I PDF sono molto utilizzati per salvare, inviare e scambiare documenti di testo. Ma sono una minaccia per l’intelligenza artificiale.
L’intelligenza artificiale ha ormai preso il sopravvento nelle nostre vite, entrando con forza in ogni ambito quotidiano: dal lavoro alla scuola, fino al tempo libero. È diventata uno strumento fondamentale anche per le aziende, che grazie all’AI riescono a semplificare numerosi processi e a renderli più veloci ed efficienti. Tuttavia, questa trasformazione comporta anche potenziali problemi occupazionali, perché molti posti di lavoro potrebbero scomparire sotto l’influenza di sistemi in grado di sostituire mansioni che un tempo richiedevano necessariamente l’intervento umano.
Per funzionare al meglio, però, l’intelligenza artificiale deve analizzare e scandagliare enormi quantità di dati presenti sul web: pagine, report, documenti e archivi digitali. Solo così può acquisire l’apprendimento necessario per rispondere in modo efficace ai quesiti degli utenti. Eppure esiste un formato che diversi esperti considerano un vero ostacolo allo sviluppo dell’AI: il PDF. Questo formato è ormai diffusissimo ed è diventato uno dei più utilizzati per salvare, inviare e scambiare documenti di testo.
PDF significa Portable Document Format: si tratta di un formato sviluppato da Adobe circa trent’anni fa per presentare e condividere documenti in modo affidabile, indipendentemente dal software, dall’hardware o dal sistema operativo utilizzato. Il PDF blocca il layout e la presentazione del documento, garantendo che font, immagini e impaginazione rimangano invariati su qualsiasi dispositivo. È proprio questa caratteristica a renderlo ideale per l’archiviazione, la stampa e la condivisione sicura. Inoltre, supporta crittografia, firme digitali, protezione con password e può contenere link e script.
I PDF ostacolano l’AI: ecco perché
leggi anche
Libri pdf gratis, dove scaricare
Secondo molti esperti, tuttavia, il PDF rappresenta un ostacolo per l’intelligenza artificiale. A differenza delle pagine web o dei semplici file di testo, i PDF non sono strutturati secondo una logica testuale, ma in base a coordinate grafiche: ogni parola e ogni lettera vengono posizionate nella pagina esattamente nel punto in cui devono apparire. Questo garantisce coerenza visiva per gli esseri umani, ma rende più complessa l’interpretazione per i modelli linguistici. L’AI può incontrare difficoltà nel riconoscere correttamente la gerarchia delle informazioni, le intestazioni, le colonne o le note a piè di pagina, rischiando di interpretare in modo errato il contenuto. In alcuni casi può persino generare errori o inventare informazioni quando deve riassumere o analizzare documenti complessi, come articoli scientifici ricchi di tabelle e grafici.
I limiti dei PDF non riguardano solo l’apprendimento dell’intelligenza artificiale, ma anche la sicurezza informatica. L’azienda Check Point ha segnalato che una parte significativa degli attacchi via email avviene proprio tramite PDF dannosi, sfruttando la possibilità di incorporare script e link contenenti malware. In altre parole, il formato PDF è spesso utilizzato come vettore di virus.
Mentre alcuni difendono il PDF sostenendo che il problema risieda negli strumenti di intelligenza artificiale ancora imperfetti, altri ritengono necessario evolvere verso nuovi formati progettati fin dall’inizio per dialogare correttamente con l’AI. L’idea è quella di sviluppare una sorta di «PDF 2.0», capace di garantire sicurezza e uniformità del layout, ma anche di interagire efficacemente con i sistemi di intelligenza artificiale. Del resto, l’AI è ormai radicata nella nostra quotidianità e difficilmente scomparirà: è quindi inevitabile che anche i formati digitali si adattino a questa nuova realtà tecnologica.
© RIPRODUZIONE RISERVATA