Hardends2013 test suite

Hardtends2013 test set- The engines limits:  ends games.

Around 2 years ago I published a, 'test set' for engines that contained a collection positions of difficult ends games.
My intention was to show the engines limits in this sector.
Run "elaboration test set" with Fritz GUI, the engines results were very scarce.
Son spent only two years, but the enginess have made some great improvements. Many test positions,hard in that time, it are resolved today easily.
In these days, I have many labored to find some positions that seriously hocked the actual programs.
Some positions I have had to cancel from the test, because today resolved instantly. I have added some new difficult position. The suite download from: link down.
The suite, over that to be used as test set, to verify the engines strength in the ends, according to the  parameters setting, also can be interesting to study some typical strategies in the ends games.

Download test suit:  hardends2013


Hardtends2013 test suite. Limiti dei motori: finali.

Circa 2 anni fa, pubblicai un 'set test'  per motori che conteneva una raccolta di posizioni di finali difficili.
La mia intenzione era quella di dimostrare i limiti dei motori in questo settore.
I risultati che i motori ottenevano, lanciando "elaborazione set di test" con Fritz GUI, erano molto scarsi.
Son passati solo due anni, ma i motori hanno fatto dei grandi miglioramenti. Molte delle posizioni del test allora ostiche, sono risolte con facilità oggi.
In questi giorni, ho fatto fatica a trovare delle posizioni che impegnassero seriamente i programmi attuali.
Alcune posizioni ho dovuto cancellarle dal test, perchè oramai risolte all'istante. Ho aggiunto qualche nuova posizione difficile. La suite si scarica da: hardends2013
La raccolta, oltre che essere utilizzata come set test per verificare la forza dei motori nei finali anche a seconda delle impostazioni dei parametri, può essere interessante per studiare alcune tipiche strategie nei finali.
Nota: per eseguire il set di test con Fritz, usare il file chessbase. Copiare tutta la cartella, con tutti i file.
Per lanciare un set di test con GUI tipo Fritz:
Menu Motore>Elaborazione set di test (vecchie versioni: menu strumenti>analisi>elaborazione set di test), quindi andare nella cartella 'chessbase' del file scaricato qua, e selezionare il database 'hardends2013'. Scegliere un tempo massimo per ogni partita. Esempio: io ho impostato 90 sec. nei testi di cui riporto i risultati qui sotto. Per il 'Ply aggiuntivo' consiglio di lasciare il valore 1 di default. Aumentando il Ply i tempi si allungano troppo.
Nota: i risultati delle partite, spesso sono riferiti all'analisi esposta e non al risultato della partita realmente giocata.

Risultati di alcuni test eseguiti sul mio PC dual core:
Houdini 3,hash 256M, tb 5 pezzi:
Max. time = 90s.
Result: 17 su 40 = 42.5%. average time = 10.83s / 17.35

Deep Rybka 4.1, 256M hash, TB 5 pezzi:
Max. time = 90s.
Result: 13 su 40 = 32.5%. average time = 17.43s / 16.76

Stockfish 04 (a 3 version beta), 256M hash:
Max. time = 90s
Result: 15 su 40 = 37.5%. average time = 19.17s / 26.53

Houdini 3, tatical mode, 512M hash, 3,5', 5 pezzi tb:
Max. time = 210s.
Result: 17 su 40 = 42.5%. average time = 24.64s / 17.11

Hardmiddle suite- middle games test set :

This to test the strength of the modern engines in the middle game.
I have hard labored to find binding positions for the engines.
The "Encyclopaedia of chess middlegames-combinations" contains hundreds of games, but the positions are
almost all resolved in few second by the modern engines.
Download hardmiddle suite, middle games test set: hardmiddle 
Some result:
Max. time = 60s
Houdini 3:
Result: 10 su 30 = 33.3%. average time = 6.70s / 13.10

Rybka WinFinder 2.2:
Result: 17 su 30 = 56.6%. average time = 7.81s / 10.11





1 comment:

Anonymous said...

Hi, thanks for this great work

There few results of my PC

CPU: i7-3770K
GUI: Fritz 13
Fritz Bench on 4 cores: 24.93 11965Kn/s
tb 3,4,5, and some 6

Komodo5.1MP-256MB/computer i7 3770K
Maximum time = 90s.
Result: 12 out of 40 = 30.0%. Average time = 6.06s / 19.58

Komodo CCT 64-bit (single core)-256MB/computer i7 3770K
Maximum time = 90s.
Result: 12 out of 40 = 30.0%. Average time = 8.02s / 18.83

Octochess revision 5132-256MB/computer i7 3770K
Maximum time = 90s.
Result: 5 out of 40 = 12.5%. Average time = 16.81s / 17.60

Gull 2.1 x64-256MB/computer i7 3770K
Maximum time = 90s.
Result: 14 out of 40 = 35.0%. Average time = 7.41s / 15.57

Critter 1.6a 64-bit-256MB/computer i7 3770K
Maximum time = 90s.
Result: 16 out of 40 = 40.0%. Average time = 11.92s / 19.75

Arasan 15.6-256MB/computer i7 3770K
Maximum time = 90s.
Result: 11 out of 40 = 27.5%. Average time = 13.66s / 18.72

Protector 1.5.0 x64-256MB/computer i7 3770K
Maximum time = 90s.
Result: 12 out of 40 = 30.0%. Average time = 19.20s / 20.58 (2 crash exceptions)

Best regards

Phi10u