Una fuga di notizie rivela Bidi 1, il modello vocale di ChatGPT che permetterà al chabot di ascoltare e parlare in contemporanea. Ecco di cosa si tratta.
Secondo alcune indiscrezioni emerse nelle ultime settimane, OpenAI sarebbe al lavoro per trasformare ChatGPT in una vera e propria super-app capace di svolgere qualsiasi azione e di soddisfare ogni richiesta degli utenti. Questa mini trasformazione del chatbot avrebbe dato il via a una revisione tramite lo strumento di programmazione Codex di OpenAI, oltre che coi vari tool di intelligenza artificiale in grado di svolgere compiti.
Proprio di recente, alcune fughe di notizie hanno svelato l’imminente arrivo di GPT Bidi 1. Si tratterebbe di un modello di audio bidirezionale che promette di migliorare notevolmente le capacità conversazionali di ChatGPT. E tutto questo si inserirebbe di diritto nella più ampia volontà di rendere il sistema una super-app per tutti i giorni.
Cos’è Bidi 1 di ChatGPT
Bidi 1, che nasce dall’abbreviazione della dicitura “bidirectional design”, è un nuovo modello di ChatGPT che dà modo all’assistente vocale di parlare e ascoltare contemporaneamente. I primi riferimenti sono stati trovati la scorsa settimana all’interno di un codice interno. Qui si parla di Bidi 1 come un importante passo avanti verso la prossima generazione di tecnologia vocale.
Pare che Bidi 1 sarà disponibile all’interno delle impostazioni, nell’area in cui si sceglie la modalità di conversazione vocale. La distribuzione è già partita per un gruppo ristretto di utenti di ChatGPT. A detta di molti, il lancio definitivo potrebbe arrivare già entro la fine di questa settimana o l’inizio della prossima.
Quali sono le novità di Bidi 1
Ma in che cosa Bidi 1 dovrebbe rappresentare una rivoluzione delle conversazioni vocali con l’AI? In primis, pare che il modello inizierà a parlare anche quando siamo noi a impartire il comando, senza mai interrompere. Se per esempio stai spiegando un tuo problema e fai una breve pausa, potresti sentre il chatbot dire “Okay, capisco, vai avanti”.
Si potrà anche cambiare attività al volo. Se per esempio gli chiedi di contare fino a dieci e, nel mentre, lo fermi per dirgli di invertire il conteggio, il chatbot sarà capace di adattarsi immediatamente. Uno dei cambiamenti più significativi è la capacità di Bidi 1 di mantenere il filo del discorso per tutta la durata della conversazione, anziché interrompere il contesto precedente.
Secondo quanto emerso dal rapporto che per primo ha parlato di Bidi 1, questo modello può essere visto come un modo per OpenAI di colmare il divario tra i suoi modelli di testo potenti e il suo livello vocale meno avanzato. Questo può voler dire che OpenAI scommetterà sempre di più sulle conversazioni a voce, piuttosto che sulle query testuali scritte.