La democratizzazione dell'eloquenza
Come l'intelligenza artificiale sta ridefinendo la comunicazione persuasiva.
Questo articolo discute la capacità dell’intelligenza artificiale di migliorare i testi. E come tale esso stesso è stato migliorato. Trovate la prima versione, quella scritta da me, qui sotto. E quella riveduta e corretta dall’intelligenza artificiale (Claude 3.7) da metà dell’articolo. Vi consiglio di leggere quello, scorre oggettivamente meglio.
Il testo originale
Ci sono stati libri che hanno cambiato la storia. A volte in positivo, ispirando o aprendo gli occhi delle persone, a volte in maniera negativa, addirittura nefasta. La Bibbia, il Corano, Il Capitale, L’origine delle specie, il Mein Kampf. Anche i discorsi – il discorso sulla montagna, ma anche “I have a dream” di Martin Luther King, o il discorso di Pericle agli Ateniesi. Ma anche “Amici, Romani, compatrioti, prestatemi orecchio” è la rappresentazione Shakespeariana di uno storico discorso fatto alla morte di Giulio Cesare, che ha cambiato lo scenario politico.
Abbiamo visto l’intelligenza artificiale prendere una sfida e fallire miseramente. Poi riuscire malamente. Poi meglio. Poi sempre meglio, fino a superare i migliori esseri umani. Ormai nessuno può più battere l’intelligenza artificiale a Go o a Scacchi. Anche i testi sono spesso scritti molto bene. Ma da qui a essere in grado di scrivere un testo che ispira, che muove le persone, che le cambia dentro, ci vuole ancora tanto. Ma accadrà.
Se noi guardiamo le varie generazioni di GPT prodotte da OpenAI, dalla 2, 2.5, 3, 3.5, 4, e adesso 4.5. ciascuna aveva un numero di parametri (un po’ come dire la grandezza del cervello) che era 10 volte quella precedente. Ovviamente più era grande più era difficile da programmare, più aveva bisogno di dati, di GPU di Nvidia, di elettricità, alla fine di soldi. Ma aveva anche più capacità. E il salto da 2.5 a 3 è stato così grande che le persone hanno iniziato a provare a usarla. Da 3 a 3.5 ha cominciato a essere utile, qui è nato ChatGPT, prima era solo GPT. Da 3.5 a 4 abbiamo iniziato ad avere un’intelligenza artificiale in grado di capire i disegni. La 4 poi ha iniziato a essere la base di una serie di intelligenze artificiali che guardavano i loro stessi pensieri, la serie O1 e O3. Altrimenti detti i large thinking models, gli LTM, (prima avevamo solo gli LLM, large language models), e poi è arrivato la 4.5. E la 4.5 per molti è stata una delusione. Il miglioramento dalla 4 alla 4.5 era più difficile da notare. Anzi, molti sostenevano che la 4o fosse meglio della 4.5. Ma dov’era la differenza? Se chiedi a ChatGPT 4o di scriverti una sceneggiatura, il risultato non è particolarmente buono. Con la 4.5 il risultato è molto più vicino a un prodotto professionale.
E qui ritorniamo ai libri che hanno cambiato la storia. Ciò accadrà quando chiunque potrà prendere una intelligenza artificiale e, se ha la visione, spiegare all’AI che cosa vuole dire, e l’intelligenza artificiale lo esprimerà in maniera coinvolgente per i lettori. La visione ci vuole, il messaggio da comunicare non viene dall’AI ma dall’essere umano. Ma al momento ci sono molte persone che hanno idee, visioni, aspirazioni. E non sono in grado di esprimerle.

Vibe Coding: la programmazione dialogica che rende veramente aperto il codice
Anche il mondo dei programmatori è stato sconquassato dall’AI. I codici sono sempre più un prodotto delle intelligenze artificiali, e mentre una parte della comunità online protesta un’altra si prepara al futuro.
Prendete un’idea di una storia, e raccontatela a ChatGPT 4 e chiedetegli di trasformarla in un racconto. Ve lo fa, ma sarà abbastanza noioso. Anche ripetitivo o banalotto (questo non ferma tante persone dal riempire Amazon di testi prodotti con l’AI). Fatelo con il 4.5 e il risultato sarà molto migliore. E migliorerà ancora con le prossime versioni. E fin qui abbiamo parlato dei testi. Ma ci sono anche i discorsi. Il modo in cui il materiale è presentato.
Ricordo un racconto di fantascienza di anni fa. Avevano costruito una macchina che non solo scriveva un testo, ma indicava anche dove e quando l’oratore doveva fare una pausa. Dove aumentare il volume. Dove accelerare e dove scandire le parole. Il racconto terminava con il tecnico che aveva costruito la macchina che guardava preoccupato la gente rapita dal discorso del politico per cui lavorava. Rendendosi conto che sarebbe stato inarrestabile. Non ricordo chi scrisse quel racconto. Forse Isaac Asimov (leggevo molti racconti suoi). Chi lo sapesse mi contatti. Ma siamo a questo punto. OpenAI ha rilasciato un modello text2voice, dal testo alla voce, che non legge solo i testi, ma è in grado di essere programmato in termini di enfasi, pause, accenti. Insomma del modo di leggerlo. Per ora non è facile, e se è difficile leggere bene un testo è ancora più difficile programmare un’AI per farlo. Ma è solo questione di tempo. Non solo perché diventi più facile, ma perché sia possibile descrivere alla AI che effetto vogliamo ottenere (non nella voce, nel pubblico). E la AI programma la voce artificiale. Già adesso è indistinguibile da una voce normale (almeno quelle che ho sentito in inglese, non sono sicuro in italiano). Ma se mettiamo tutto insieme, vediamo un futuro in cui scrivere un testo, dare voce ai propri sogni, farlo leggere da un’intelligenza artificiale sarà tutto a portata di mano per chiunque abbia un messaggio da mandare. Dopo la democratizzazione dell’arte, della programmazione, della medicina, anche l’oratoria cadrà.
Ma chi userà questo potere. Non credo sarà usato soprattutto per ispirare i cittadini a votare per questo o quel partito. Probabilmente sarà utilizzato per ispirare… a comprare un particolare prodotto o servizio. E così come abbiamo imparato a ignorare le pubblicità a lato delle pagine web, così impareremo a ignorare messaggi troppo convincenti. Voci che non provengono da esseri umani, ma da schermi. Forse i politici ascolteranno come l’AI presenta un messaggio e impareranno a ripeterlo con lo stesso stile.
Ma quando una persona ha un messaggio da dare, e quando una persona è disposta ad ascoltarlo, il risultato sarà molto migliore. E questo è un bene.
Il testo riscritto da Claude
La storia dell'umanità è stata plasmata da parole. Testi che hanno scosso le fondamenta delle società, hanno ispirato rivoluzioni o giustificato atrocità. La Bibbia ha dato forma a intere civiltà, il Corano ha unito popoli diversi sotto un'unica visione, Il Capitale ha acceso il fuoco della rivoluzione proletaria, L'origine delle Specie ha trasformato radicalmente la nostra comprensione della vita, mentre il Mein Kampf ha seminato i semi di uno dei periodi più bui della storia moderna. Ma non solo i libri. Anche le parole pronunciate hanno cambiato il corso degli eventi. Il Discorso della Montagna ha definito una nuova etica che risuona ancora oggi, "I have a dream" di Martin Luther King ha dato voce e speranza a un movimento per i diritti civili, il discorso di Pericle agli Ateniesi ha cristallizzato gli ideali democratici dell'antichità. Persino nella finzione, Shakespeare ha catturato il potere trasformativo dell'oratoria con il celebre "Amici, Romani, compatrioti, prestatemi orecchio" – discorso che nella realtà storica cambiò gli equilibri politici di Roma. In parallelo a questa storia di parole trasformative, osserviamo l'evoluzione dell'intelligenza artificiale. Un percorso fatto di tentativi falliti, miglioramenti graduali e poi balzi improvvisi di capacità. Oggi nessun umano può competere con un'AI negli scacchi o nel Go. I testi generati artificialmente sono tecnicamente impeccabili, grammaticalmente perfetti, logicamente coerenti. Ma esiste ancora un divario. Scrivere parole che non solo informano, ma ispirano; che non solo comunicano, ma trasformano; che non solo raggiungono la mente, ma toccano l'anima – questa rimane una frontiera che l'intelligenza artificiale non ha ancora conquistato pienamente. Il divario si sta riducendo, e forse un giorno scomparirà del tutto. Ma non ancora. Non oggi.
L'evoluzione dei modelli GPT di OpenAI racconta una storia di crescita esponenziale. Dalla versione 2 alla 2.5, dalla 3 alla 3.5, fino alla 4 e alla recente 4.5, ogni generazione ha visto un aumento di circa dieci volte nel numero di parametri – l'equivalente digitale della dimensione del cervello. Questa espansione non è stata senza costi: ogni balzo ha richiesto più dati per l'addestramento, più GPU Nvidia per l'elaborazione, più elettricità per l'alimentazione e, inevitabilmente, più capitale finanziario. Ma i risultati sono stati proporzionali all'investimento. Il salto da GPT-2.5 a GPT-3 fu così significativo che attirò l'attenzione del pubblico, segnando l'inizio di un interesse diffuso. Con GPT-3.5 arrivò la vera utilità pratica e nacque ChatGPT, trasformando un modello linguistico in un'interfaccia conversazionale accessibile. GPT-4 portò la capacità di interpretare immagini, espandendo la percezione dell'AI oltre il testo. Questa versione divenne poi il fondamento per i modelli della serie "o" (o1, o3), soprannominati "Large Thinking Models" (LTM) per la loro capacità di riflettere sui propri ragionamenti - un'evoluzione rispetto ai semplici "Large Language Models" (LLM) che li avevano preceduti. L'arrivo di GPT-4.5 ha generato reazioni contrastanti. Per molti, il miglioramento rispetto alla versione 4 sembrava meno evidente, al punto che alcuni preferivano la precedente GPT-4o. Ma la differenza si manifesta in compiti specifici: chiedi a GPT-4o di scrivere una sceneggiatura e otterrai un lavoro accettabile; la stessa richiesta a GPT-4.5 produce qualcosa che si avvicina sorprendentemente al lavoro di un professionista. Il progresso c'è, ma si è spostato dalla quantità evidente alla qualità sottile.

L'etica emergente delle AI: quando le macchine sviluppano valori autonomi
Dall'allineamento alla coerenza: le intelligenze artificiali mostrano sistemi valoriali sempre più indipendenti dalla programmazione umana.
E così torniamo al potere trasformativo della parola scritta. Immaginiamo un futuro, ormai prossimo, in cui chiunque possieda una visione potrà collaborare con un'intelligenza artificiale per darle voce – non una voce qualunque, ma una che risuoni, che coinvolga, che persuada. L'AI non creerà il messaggio – questo rimarrà dominio umano, frutto dell'esperienza, dell'empatia e della visione che solo noi possediamo. Ma tradurrà quel messaggio in una forma che amplifichi il suo impatto. È una democratizzazione dell'eloquenza senza precedenti. Oggi, innumerevoli persone possiedono idee brillanti, visioni trasformative, intuizioni profonde, ma mancano degli strumenti espressivi per comunicarle efficacemente. Le loro voci rimangono inascoltate non per mancanza di sostanza, ma di forma.
L'evoluzione è già visibile. Racconta una storia a ChatGPT-4 e chiedigli di trasformarla in un racconto. Il risultato sarà tecnicamente corretto ma spesso prevedibile, a tratti noioso, con personaggi bidimensionali e trame che seguono schemi familiari. Questo non ha impedito a molti di inondare Amazon di contenuti generati artificialmente, abbassando la qualità media della letteratura self-published. Ma prova lo stesso esperimento con GPT-4.5 e noterai una differenza qualitativa sostanziale – maggiore profondità emotiva, caratterizzazioni più sfumate, tensione narrativa più autentica. E le versioni future promettono di ridurre ulteriormente questo divario. Ma la parola scritta è solo una dimensione. C'è anche l'arte del discorso – il ritmo, l'enfasi, le pause strategiche, la modulazione della voce. L'oratoria che ha cambiato il corso della storia non è stata solo questione di cosa è stato detto, ma di come è stato detto.
Anni fa lessi un racconto di fantascienza che oggi sembra incredibilmente profetico. Descriveva una macchina capace non solo di generare discorsi persuasivi, ma di codificare precisamente l'esecuzione oratoria: dove l'oratore doveva fermarsi per una pausa drammatica, quando alzare la voce per enfatizzare un concetto, quando accelerare il ritmo o scandire lentamente le parole per massimizzare l'impatto emotivo. La storia si concludeva con una scena inquietante: il tecnico creatore della macchina osservava con crescente preoccupazione una folla completamente rapita dal discorso del politico che impiegava la sua tecnologia, realizzando con orrore di aver creato qualcosa di inarrestabile. Non ricordo chi fosse l'autore (forse Asimov, di cui ero avido lettore) e sarei grato a chiunque potesse illuminarmi in merito.
Quella che era fantascienza è ora realtà emergente. OpenAI ha recentemente rilasciato un sistema text-to-voice che trascende la semplice lettura meccanica. Questo sistema può essere programmato in termini di enfasi, pause, accenti e cadenze, l'intera gamma di strumenti espressivi che distinguono un oratore mediocre da uno capace di incantare le folle. Attualmente, l'interfaccia è ancora complessa: se è difficile per un umano leggere un testo con maestria, è altrettanto complicato programmare un'intelligenza artificiale per farlo, ma è solo questione di tempo.
L'evoluzione logica porterà a sistemi dove non programmeremo più la voce in sé, ma comunicheremo all'AI l'effetto emotivo che desideriamo ottenere nel pubblico, lasciando che l'algoritmo determini il modo ottimale per raggiungerlo. Le voci sintetiche sono già praticamente indistinguibili da quelle umane in inglese (non posso garantire lo stesso livello di naturalezza in italiano, ma anche qui il progresso è rapido). Unendo questi sviluppi, si profila un futuro in cui chiunque abbia un messaggio da comunicare potrà non solo articolarlo con chiarezza e potenza persuasiva, ma anche farlo recitare con l'eloquenza di un Cicerone moderno. Dopo la democratizzazione dell'arte visiva, della programmazione informatica e persino della conoscenza medica, stiamo assistendo alla caduta dell'ultimo bastione dell'élite comunicativa: l'oratoria stessa diventerà una capacità universalmente accessibile.
Ma chi impugnerà questo potere retorico potenziato dall'intelligenza artificiale? Contrariamente alle visioni distopiche di propaganda politica irresistibile, il suo impiego più pervasivo sarà probabilmente molto più banale: convincerci a comprare. Non a rivoluzionare società o abbracciare ideologie, ma semplicemente ad acquistare l'ultimo smartphone, il nuovo servizio di streaming, la polizza assicurativa "rivoluzionaria". Il capitalismo ha sempre trovato il modo di monetizzare le innovazioni più rapidamente di qualsiasi altra forza sociale. E proprio come abbiamo sviluppato un'immunità cognitiva ai banner pubblicitari e agli annunci sui social media, così evolveremo nuovi filtri mentali per proteggerci da questa eloquenza artificiale. Impareremo a riconoscere e ignorare le voci troppo perfette, troppo persuasive che emergono dai nostri schermi – non perché non siano convincenti, ma precisamente perché lo sono troppo.
Forse vedremo politici e oratori pubblici studiare le tecniche di presentazione generate artificialmente, assimilandole e riproducendole nei loro discorsi dal vivo. L'autenticità umana, con le sue imperfezioni e vulnerabilità, potrebbe diventare paradossalmente più preziosa in un mondo di perfezione sintetica.
Ma c'è una verità che trascende la tecnologia: quando un essere umano ha qualcosa di autentico e significativo da comunicare, e quando un altro essere umano è genuinamente aperto a ricevere quel messaggio, si crea una connessione che nessun algoritmo può replicare completamente. È in queste connessioni autentiche che risiede il vero potere trasformativo della comunicazione, indipendentemente dagli strumenti utilizzati per amplificarla.
E questa è una prospettiva che, nonostante tutto, infonde speranza.
Copertina: Pietro Speroni di Fenizio