AlphaZero, il programma di intelligenza artificiale di DeepMind, ora mostra segni di intuizione e creatività simili a quelle umane, in ciò che gli sviluppatori hanno salutato come "punto di svolta" nella storia.
Il sistema informatico stupito il mondo l'anno scorso quando ha dominato la partita a scacchi da zero in sole quattro ore, nonostante non fosse programmato come vincere.
Ma ora, dopo un anno di prove e analisi da parte di nonni di scacchi, la macchina ha sviluppato un nuovo stile di gioco diverso da qualsiasi cosa mai vista prima, suggerendo che il programma ora sta improvvisando come un essere umano.
A differenza della migliore macchina da scacchi del mondo - Stockfish - che calcola milioni di possibili risultati mentre gioca, AlphaZero impara dai suoi successi e fallimenti passati, facendo le sue mosse basate su una `` sensazione nebulosa che tutto si risolverà nel lungo periodo , "secondo gli esperti di DeepMind.
Quando AlphaZero è stato contrapposto a Stoccafisso nelle partite 1,000, ha perso solo sei, vincendo in modo convincente 155 volte e disegnando gli attacchi rimanenti.
Eppure è stato il modo in cui ha giocato che ha stupito gli sviluppatori. Mentre i computer a scacchi preferiscono aggrapparsi ai loro pezzi, AlphaZero ha prontamente sacrificato i suoi soldati per una migliore posizione nella scaramuccia.
Parlando con The Telegraph, il prof. David Silver, che guida il gruppo di ricerca sull'apprendimento per rinforzo di DeepMind, ha dichiarato: “Ha un sottile senso di intuizione che aiuta a bilanciare tutti i diversi fattori.
"Ha una rete neurale con milioni di diversi parametri sintonizzabili, ognuno impara le proprie regole di ciò che è buono negli scacchi, e quando le metti insieme hai qualcosa che esprime, in un modo del tutto simile al cervello, la nostra capacità umana di dare un'occhiata a una posizione e dire "ah ah, questa è la cosa giusta da fare".
"La mia convinzione personale è che abbiamo visto qualcosa di importante in cui stiamo iniziando a capire che molte abilità, come l'intuizione e la creatività, che in precedenza pensavamo fossero solo nel dominio della mente umana, sono effettivamente accessibili all'intelligenza artificiale anche. E penso che sia un momento davvero emozionante nella storia. "
AlphaZero è iniziato come un "tabula rasa" o un sistema di tabula rasa, programmato con solo le regole di base degli scacchi e imparato a vincere giocando milioni di partite contro se stesso in un processo di prova ed errore noto come apprendimento di rinforzo.
È lo stesso modo in cui il cervello umano impara, regolando le tattiche in base a una precedente vincita o perdita, che gli consente di cercare solo 60 migliaia di posizioni al secondo, rispetto ai circa 60 milioni di Stockfish.
Nel giro di poche ore il programma aveva scoperto e giocato in modo indipendente aperture e strategie umane comuni prima di passare a sviluppare le proprie idee, come sciamare rapidamente intorno al re avversario e dare molto meno valore ai singoli pezzi.
Il nuovo stile di gioco è stato analizzato dal grande maestro di scacchi Matthew Sadler e dal maestro internazionale femminile Natasha Regan, che lo dicono diversamente da qualsiasi motore di scacchi tradizionale.
"È come scoprire i quaderni segreti di alcuni grandi giocatori del passato", ha detto Sadler.
Regan ha aggiunto: “È stato affascinante vedere come l'analisi di AlphaZero differiva da quella dei migliori motori scacchistici e persino del miglior gioco Grandmaster. AlphaZero potrebbe essere un potente strumento di insegnamento per l'intera comunità. "
Garry Kasparov, ex campione del mondo di scacchi, che ha perso notoriamente la macchina per scacchi Deep Blue in 1997, ha dichiarato: “Invece di elaborare istruzioni e conoscenze umane a una velocità incredibile, come tutte le precedenti macchine per scacchi, AlphaZero genera le proprie conoscenze.
"Suona con uno stile molto dinamico, molto simile al mio. Le implicazioni vanno ben oltre la mia amata scacchiera."