Computer-Bewertung einer Stellung erzählt nur einen sehr kleinen Teil der Geschichte

Ich sage ja schon lange, daß die Computer-Bewertung einer Stellung für die Praxis oft irreführend ist. Auch unser tschechischer Trainer Jiri hat das schon öfters erwähnt.

Nun habe ich auch Unterstützung von Großmeister Daniel Naroditsky gefunden, der es in diesem Video ab Minute 19:10 ebenfalls sagt.

„Computer evaluation tells a very small part of the story … You need to judge a position based on the difficulty of moves that one has to find.“

Da hilft es auch überhaupt nicht, wenn man den Computer länger rechnen läßt. Nein, dadurch wird der Fehler eher schlimmer.

Der Grund, warum die Computer-Bewertung oft irreführend ist: Der Computer bewertet die Stellung unter der Hypothese, daß zwei Computer mit ELO 3000 oder mehr gegeneinander spielen. Wir müssen Stellungen bewerten, unter der Hypothese, daß zwei Menschen mit ELO 1000-2000 gegeneinander spielen. Wir Menschen können viele schwierige Züge halt nicht finden oder nur zufällig.

Ich habe auch noch einen weiteren Beweis gefunden. Die Lichess-Eröffnungs-Datenbank. Gibt man dort zB e4 e5 f4 exf5 ein, also das angenommene Königsgabit, schaltet die Engine und das Eröffnungsbuch gleichzeitig an und stellt am Zahnrädle für das Buch ein, daß die Rapid und Classical-Partien der Lichess-Spieler von 1800-2200 betrachtet werden, erhält man dieses Bild:

Aus der Tabelle rechts unten erhält man für den Zug 3. Sc3 eine Statistik von 58% zu 38%, d.h. Weiß gewinnt mit diesem Zug 58% der Partien und verliert 38%. Die 4% Differenz zu Hundert sind remis. Das ist superstark, es gibt wenige Eröffnungen mit so deutlicher Differenz.

Gleichzeitig ist die Bewertung der Engine bei Tiefe 47 für Sc3 = -0.9, was landläufig als 1 Bauer schlechter für W interpretiert wird und darin sind alle Kompensationen schon einkalkuliert. Das wäre also schon sehr deutlicher Nachteil für Weiß.

Aber die Statistik beweist tatsächlich, daß Weiß bei Spielern auf unserem Niveau im Vorteil ist.

Ich könnte noch diverse weitere logische Beweise anführen, daß die Computerbewertung für unsereins mehr oder weniger Mist ist, aber will es dabei belassen.