Qwen lancia la versione 3.5, il modello AI targato Alibaba che ha come obiettivo quello di scalzare i colossi dell’intelligenza artificiale (a costi inferiori)
Negli ultimi anni il settore dell’intelligenza artificiale generativa ha vissuto una corsa senza precedenti, dominata per lungo tempo da pochi nomi occidentali. Ma il 2026 segna un punto di svolta. Alibaba ha infatti accelerato in modo deciso sul fronte AI con il rilascio di Qwen 3.5, una versione profondamente rinnovata del suo assistente intelligente che non si limita più a “rispondere bene”, ma punta a diventare un vero agente autonomo, integrato nell’economia digitale quotidiana.
Nei giorni scorsi, Alibaba ha lanciato ufficialmente Qwen come evoluzione diretta di Tongyi, il suo chatbot di intelligenza artificiale già disponibile su App Store di iPhone e sul Play Store di Android. L’azienda cinese ha presentato questo nuovo prodotto definendolo come il più potente in assoluto tra gli assistenti di AI sul mercato, una dichiarazione che oggi, con l’arrivo della versione 3.5, assume un peso molto più concreto rispetto al passato.
L’obiettivo dichiarato resta quello di lanciare la sfida ai grandi colossi come ChatGPT, ma la strategia è cambiata: non solo prestazioni elevate, bensì efficienza architetturale, riduzione dei costi e un forte orientamento all’open source. Qwen 3.5 nasce infatti in un contesto di competizione feroce, che vede protagoniste anche altre big cinesi come ByteDance e MiniMax, e in un momento geopolitico delicato per Alibaba, finita sotto i riflettori per possibili tensioni con gli Stati Uniti.
Ma come funziona davvero Qwen oggi? Quali sono le sue capacità distintive rispetto al passato? E soprattutto: è già meglio di ChatGPT in alcuni ambiti specifici? Ecco tutto quello che c’è da sapere.
Cos’è Qwen?
Qwen è il chatbot di intelligenza artificiale di proprietà di Alibaba e rappresenta oggi molto più di un semplice assistente conversazionale. Fin dalle prime versioni, l’azienda ha confermato e rafforzato un approccio open source, o meglio open-weight, rendendo disponibili i pesi addestrati del modello per consentire a sviluppatori e aziende di personalizzarlo, distribuirlo in locale e integrarlo in ambienti complessi.
Con l’arrivo di Qwen 3.5, questo approccio assume una nuova rilevanza strategica. Il modello di punta, Qwen3.5-397B-A17B, conta 397 miliardi di parametri complessivi, ma ne attiva soltanto 17 miliardi per ogni inferenza grazie a un’architettura ibrida basata su mixture-of-experts e linear attention. In pratica, un modello di scala “frontier” con costi operativi paragonabili a sistemi molto più piccoli.
Questa scelta consente ad Alibaba di proporre versioni diverse: dai modelli leggeri, adatti all’esecuzione locale su workstation o server aziendali, fino a varianti cloud estremamente potenti, capaci di gestire contesti lunghissimi e workflow articolati.
Non è un caso che Qwen venga oggi descritto come una piattaforma totale, integrata nell’ecosistema Alibaba, dall’e-commerce alla logistica, dai pagamenti ai servizi consumer.
Come funziona Qwen con l’arrivo del modello 3.5
Uno dei grandi vantaggi di Qwen resta la sua natura multimodale. Con la versione 3.5, questa caratteristica diventa nativa: il modello è in grado di elaborare testo, immagini e video all’interno di un unico processo di ragionamento, arrivando a gestire contenuti lunghi fino a due ore o documentazione tecnica estesa in una sola sessione.
Il pensiero computazionale è stato definito ibrido. In pratica, Qwen alterna un modello di pensiero approfondito a uno di risposta rapida, scegliendo dinamicamente l’approccio migliore in base alla complessità del prompt.
Questo comportamento è ulteriormente raffinato grazie al cosiddetto budget di pensiero, che permette di allocare più o meno token di ragionamento per ogni richiesta, bilanciando velocità e profondità.
Dal punto di vista tecnico, Qwen 3.5 introduce innovazioni come la multi-token prediction, che riduce la latenza generando più token per ciclo, e pipeline di calcolo ottimizzate in FP8, capaci di abbattere consumi energetici e costi hardware senza compromettere la stabilità.
Per quanto riguarda le informazioni, resta centrale il tool di ricerca sul web in tempo reale, pensato per fornire risposte sempre aggiornate. Sul fronte linguistico, il supporto si estende ora a oltre 200 lingue e dialetti, rendendo Qwen uno dei modelli più inclusivi in circolazione.
Come poter utilizzare Qwen
Ma in termini pratici, come si usa Qwen oggi e perché il modello 3.5 segna un cambio di passo netto rispetto alle versioni precedenti? Alibaba ha lavorato per rendere l’accesso a Qwen estremamente flessibile, adattandolo tanto all’utente consumer quanto a contesti professionali e aziendali complessi.
Sul fronte consumer, Qwen è accessibile tramite Qwen Chat, disponibile via browser e tramite app mobile. L’interfaccia è pensata per essere immediata, ma dietro questa semplicità si nasconde una struttura molto più sofisticata rispetto al passato. Con Qwen 3.5, l’utente può scegliere tra tre modalità operative:
- Auto, che abilita il thinking adattivo e l’uso automatico degli strumenti;
- Thinking, progettata per attivare il ragionamento profondo e la pianificazione multi-step;
- Fast, ottimizzata per la rapidità di risposta e la riduzione della latenza.
Nella barra di inserimento del prompt, come già avviene per i principali concorrenti, è possibile caricare documenti, immagini, video e file audio, ma la vera differenza emerge nella gestione dei contesti lunghi. La versione hosted Qwen 3.5 Plus arriva infatti a una finestra di contesto di 1 milione di token, rendendo possibile l’analisi di interi codebase, report aziendali estesi o contenuti video molto lunghi in un’unica sessione.
Per sviluppatori e imprese, Qwen 3.5 può essere integrato tramite API attraverso Alibaba Cloud Model Studio. Qui entrano in gioco funzionalità avanzate come il reasoning esteso, gli strumenti di ricerca in tempo reale e la gestione di agenti autonomi in grado di eseguire workflow articolati. A differenza di molti modelli proprietari, Qwen offre anche la possibilità di deployment locale grazie alla distribuzione open-weight, consentendo alle aziende di mantenere il pieno controllo su dati e infrastruttura, un aspetto particolarmente rilevante in settori regolamentati.
L’ecosistema è completato dal supporto a strumenti come Ollama e LM Studio, che permettono l’esecuzione in locale e favoriscono audit tecnici, fine-tuning su dati proprietari e maggiore tutela della privacy. Non si tratta solo di una scelta tecnica, ma anche strategica: in un contesto europeo sempre più attento alla sovranità digitale e all’AI Act, la possibilità di eseguire un modello avanzato sotto giurisdizione controllata rappresenta un vantaggio competitivo concreto.
A livello applicativo, Qwen mostra una forte vocazione industriale. Il servizio clienti è uno degli ambiti più maturi, con modelli addestrati per gestire chatbot integrati in piattaforme e-commerce. Grazie a Qwen-Audio, sono disponibili anche interazioni vocali, mentre in ambito sanitario e finanziario Qwen viene già utilizzato per analisi documentali, supporto alla diagnosi, creazione automatizzata di report e analisi dei dati.
Le differenze tra Qwen e ChatGPT
La domanda chiave resta sempre la stessa: perché scegliere Qwen invece di ChatGPT? A uno sguardo superficiale, le differenze possono sembrare minime. Entrambi sono modelli multimodali, capaci di comprendere testi, immagini e contenuti complessi, ed entrambi offrono interfacce conversazionali evolute. Non a caso, molti hanno liquidato Qwen come la “copia cinese di ChatGPT”.
In realtà, questa definizione ignora la differenza più importante: l’architettura e la filosofia di sviluppo. Qwen è un modello open-weight, con pesi addestrati pubblicamente disponibili, mentre ChatGPT è un sistema proprietario chiuso, accessibile solo tramite interfacce e API controllate da OpenAI. Questo significa che Qwen può essere scaricato, analizzato, modificato e adattato a esigenze specifiche, mentre ChatGPT no.
Dal punto di vista tecnico, Qwen 3.5 punta su efficienza architetturale anziché sullo scaling “a forza bruta”. Il modello Qwen3.5-397B-A17B, pur contando 397 miliardi di parametri complessivi, ne attiva solo 17 miliardi per inferenza grazie alla mixture-of-experts sparsa e alla linear attention. Il risultato è un sistema che, secondo i benchmark dichiarati, raggiunge prestazioni comparabili a modelli proprietari molto più grandi, ma con costi di calcolo, consumo energetico e latenza sensibilmente inferiori.
ChatGPT, dal canto suo, resta più diffuso e immediato, soprattutto per l’utente generalista. La sua interfaccia è estremamente fluida e nasconde gran parte della complessità del ragionamento, offrendo risposte concise e ben strutturate. Questo lo rende ideale per un utilizzo quotidiano e per chi cerca un supporto rapido senza necessità di personalizzazione.
Qwen, invece, guarda con decisione al mondo enterprise. L’orientamento open-weight consente audit approfonditi, fine-tuning su dati proprietari e integrazione in pipeline industriali complesse. In un contesto regolatorio sempre più stringente, questa possibilità di controllo diretto diventa un fattore discriminante, soprattutto in Europa.
Va poi considerato l’aspetto economico. Alibaba sta giocando apertamente la guerra dei prezzi, riducendo il costo dei token e rendendo l’IA accessibile anche a piccole e medie imprese. Questo approccio, unito alla capacità di esecuzione locale, posiziona Qwen come una soluzione sostenibile nel lungo periodo.
In definitiva, non esiste un vincitore assoluto. ChatGPT resta la scelta più comune per l’utente standard. Qwen 3.5, invece, si rivolge a chi cerca potenza, controllo e integrazione profonda, accettando una curva di apprendimento leggermente più ripida in cambio di maggiore libertà.
© RIPRODUZIONE RISERVATA