Uno studio americano ha dimostrato che i modelli di IA di OpenAI e Meta riescono a imitare gli umani nelle risposte e a superare il test di Turing
I modelli di intelligenza artificiale continuano a progredire e a fare enormi passi avanti nella comprensione dei comportamenti umani. Pochi giorni fa è comparso sull’autorevole rivista Proceedings of the National Academy of Sciences uno studio dell’Università della California che ha mostrato che i modelli attuali di IA sono in grado di superare il test di Turing.
leggi anche
La Cina possiede una nuova AI capace di spiare e prendere decisioni militari dallo spazio
Cos’è il test di Turing e come è stato superato dall’IA
Il test di Turing è stato creato dal matematico Alan Turing e ha l’obiettivo di provare a misurare la somiglianza tra intelligenza artificiale e intelligenza umana.
Il meccanismo è abbastanza semplice: gli osservatori cercano di indovinare se un testo scritto è stato elaborato da una macchina o da una persona. Se non ci riescono significa che l’IA ha superato il test e che quindi è in grado di «pensare» in maniera molto simile agli esseri umani.
I ricercatori americani sono riusciti a dimostrare che alcuni sistemi di intelligenza artificiale sono in grado di superare la prova. I partecipanti allo studio hanno scambiato il modello linguistico GPT-4.5 di OpenAI per un essere umano in quasi 3 casi su 4 e il modello LLaMa-3.1-405B elaborato da Meta nel 56% dei casi.
In realtà il confine tra umani e macchine potrebbe essere ancora più sottile di quanto indichi la ricerca. Da quando è stato effettuato lo studio, OpenAI e Meta hanno rilasciato modelli linguistici ancora più avanzati.
Cosa implicano questi risultati
Ben Bergen, professore di scienze cognitive tra gli autori dello studio, ha dato una chiave di lettura molto interessante nell’analizzare i risultati ottenuti.
Il test di Turing è nato per confrontare l’intelligenza “pura” di uomo e macchina e i modelli di IA hanno iniziato a superare la prova solo negli ultimi anni. L’IA, sostiene Bergen, può rispondere a molte domande più rapidamente e con più precisione rispetto all’uomo. La questione, dunque, non è soltanto “misurare” la capacità di elaborazione ma capire cosa deve essere misurato.
Nel test di Turing lo stimolo gioca un ruolo fondamentale. I modelli di IA hanno avuto successo soltanto quando è stato “detto” loro di comportarsi in maniera più simile possibile agli umani. Se non avessero avuto questi input le loro risposte sarebbero state molto più semplici da individuare per gli osservatori.
Sul tema è intervenuto anche Cameron Jones, il dottorando a capo del team di ricerca, sostenendo che i modelli linguistici sono ormai in grado di comportarsi come l’uomo se istruiti con gli stimoli giusti. È un passo avanti epocale perché dimostra che l’IA non è soltanto in grado di produrre e fornire informazioni in tempo reale su qualsiasi argomento, ma che è anche in grado di rappresentare in modo estremamente credibile alcuni tratti del comportamento sociale.
Ad esempio la capacità di sbagliare. Il dato più inquietante è che non tutte le risposte dei modelli di IA sono state perfette. Al contrario, i programmi hanno commesso errori umani nelle loro risposte, confondendo i partecipanti allo studio.
© RIPRODUZIONE RISERVATA
Argomenti