[ad_1]
Il suo gruppo ha deciso di scoprirlo. Hanno costruito la nuova versione diversificata di AlphaZero, che include più sistemi di intelligenza artificiale addestrati in modo indipendente e in una varietà di situazioni. L’algoritmo che governa l’intero sistema agisce come una sorta di sensale virtuale, ha affermato Zahavy: uno progettato per identificare quale agente ha le migliori possibilità di successo quando è il momento di fare una mossa. Lui e i suoi colleghi hanno anche codificato un “bonus di diversità”, una ricompensa per il sistema ogni volta che estraeva strategie da un’ampia selezione di scelte.
Quando il nuovo sistema è stato liberato per giocare i propri giochi, la squadra ha osservato molta varietà. Il giocatore diversificato dell’IA ha sperimentato nuove ed efficaci aperture e nuove, ma valide, decisioni su strategie specifiche, come quando e dove arroccare. Nella maggior parte delle partite, ha sconfitto l’AlphaZero originale. Il team ha anche scoperto che la versione diversificata potrebbe risolvere il doppio dei puzzle di sfida rispetto all’originale e potrebbe risolvere più della metà del catalogo totale dei puzzle Penrose.
“L’idea è che invece di trovare una soluzione, o un’unica politica, che possa battere qualsiasi giocatore, qui [it uses] l’idea di diversità creativa”, ha detto Cully.
Con l’accesso a un numero sempre maggiore di giochi diversi, ha affermato Zahavy, il diversificato AlphaZero aveva più opzioni per le situazioni difficili quando si presentavano. “Se puoi controllare il tipo di giochi che vede, puoi sostanzialmente controllare il modo in cui si generalizzerà”, ha detto. Quelle strane ricompense intrinseche (e le mosse ad esse associate) potrebbero diventare punti di forza per comportamenti diversi. Quindi il sistema potrebbe imparare a valutare e valutare gli approcci disparati e vedere quando hanno avuto maggior successo. “Abbiamo scoperto che questo gruppo di agenti può effettivamente raggiungere un accordo su queste posizioni”.
E, soprattutto, le implicazioni si estendono oltre gli scacchi.
Creatività nella vita reale
Cully ha affermato che un approccio diversificato può aiutare qualsiasi sistema di intelligenza artificiale, non solo quelli basati sull’apprendimento per rinforzo. Ha utilizzato a lungo la diversità per addestrare sistemi fisici, incluso un robot a sei zampe a cui è stato permesso di esplorare vari tipi di movimento, prima di “ferirlo” intenzionalmente, permettendogli di continuare a muoversi utilizzando alcune delle tecniche che aveva sviluppato in precedenza. “Stavamo solo cercando di trovare soluzioni diverse da tutte le soluzioni precedenti che abbiamo trovato finora.” Recentemente, ha anche collaborato con ricercatori per utilizzare la diversità per identificare nuovi promettenti candidati farmaceutici e sviluppare strategie efficaci di compravendita di titoli.
“L’obiettivo è generare un’ampia raccolta di potenzialmente migliaia di soluzioni diverse, in cui ogni soluzione è molto diversa dalla successiva”, ha affermato Cully. Quindi, proprio come il giocatore di scacchi diversificato ha imparato a fare, per ogni tipo di problema, il sistema complessivo poteva scegliere la migliore soluzione possibile. Il sistema di intelligenza artificiale di Zahavy, ha affermato, mostra chiaramente come “la ricerca di strategie diverse aiuta a pensare fuori dagli schemi e a trovare soluzioni”.
Zahavy sospetta che, affinché i sistemi di intelligenza artificiale possano pensare in modo creativo, i ricercatori debbano semplicemente convincerli a considerare più opzioni. Questa ipotesi suggerisce una curiosa connessione tra esseri umani e macchine: forse l’intelligenza è solo una questione di potenza computazionale. Per un sistema di intelligenza artificiale, forse la creatività si riduce alla capacità di considerare e selezionare da un buffet di opzioni sufficientemente ampio. Man mano che il sistema ottiene ricompense per la selezione di una varietà di strategie ottimali, questo tipo di risoluzione creativa dei problemi viene rafforzata e rafforzata. In definitiva, in teoria, potrebbe emulare qualsiasi tipo di strategia di risoluzione dei problemi riconosciuta come creativa negli esseri umani. La creatività diventerebbe un problema computazionale.
Liemhetcharat ha osservato che è improbabile che un sistema di intelligenza artificiale diversificato risolva completamente il più ampio problema di generalizzazione nell’apprendimento automatico. Ma è un passo nella giusta direzione. “Sta mitigando una delle carenze”, ha detto.
Più in pratica, i risultati di Zahavy sono in sintonia con i recenti sforzi che mostrano come la cooperazione può portare a prestazioni migliori nei compiti difficili tra gli esseri umani. La maggior parte dei successi nella lista Billboard 100 sono stati scritti da gruppi di cantautori, ad esempio, non da singoli individui. E c’è ancora spazio per miglioramenti. L’approccio diversificato è attualmente costoso dal punto di vista computazionale, poiché deve considerare molte più possibilità rispetto a un sistema tipico. Zahavy inoltre non è convinto che anche il diversificato AlphaZero catturi l’intero spettro di possibilità.
“Io ancora [think] c’è spazio per trovare soluzioni diverse”, ha affermato. “Non mi è chiaro se, visti tutti i dati del mondo, ci sia [only] una risposta ad ogni domanda.”
Storia originale ristampato con il permesso di Rivista Quanta, una pubblicazione editorialmente indipendente del Fondazione Simon la cui missione è migliorare la comprensione pubblica della scienza coprendo gli sviluppi e le tendenze della ricerca in matematica, scienze fisiche e della vita.
[ad_2]
Source link