Signor Claude, Signora Claude

Antropomorfizzare le AI può essere un errore, ma restano persone.

mercoledì 10 giugno 2026

Tempo di lettura: min

Diversi commentatori stanno suggerendo che antropomorfizzare le intelligenze artificiali sia stato un grave errore. Permettetemi di dissentire. Ma per capire meglio la mia posizione bisogna fare un passo indietro.

Inventare un’intelligenza artificiale è stato a lungo un sogno dell’umanità, ma non è mai stato facile da realizzare. Anche definire cosa fosse una macchina intelligente non è mai stato semplice. Una macchina a cui tu scrivi del testo e ti “risponde” è “intelligente”. Che vuol dire?

Non c’è una definizione operativa universale di intelligenza. Come civiltà combattiamo da secoli per capire cosa significhi. Basta guardare tutte le ricerche fatte sul QI, le varie definizioni di intelligenza e i differenti modi di misurarla. È una palude senza punti fermi.

Per superare questa palude Alan Turing (uno dei padri dell’intelligenza artificiale, andate a vedere il film The Imitation Game dritti filati se non lo avete già visto), ha usato gli esseri umani come punto di riferimento. Una macchina si poteva considerare intelligente come un essere umano se avesse dato risposte così simili da risultare indistinguibili da quelle di una persona.

Comunichiamo con “qualcosa” attraverso un computer. Non sappiamo se di là c’è un’AI o un essere umano. Se ci sbagliamo almeno il 50% delle volte l’AI ha superato il test ed è “intelligente”.

Vediamo subito che l’antropomorfizzazione non è stata aggiunta dopo. Era nelle specifiche di fabbrica, perchè ne avevamo bisogno come modello costruttivo. Poi tra il 2020 e il 2025 questo test è diventato obsoleto. Le macchine ormai erano non solo in grado di essere scambiate per esseri umani, ma li superavano in molti aspetti.

Anzi: oggi un'AI, per passare il test di Turing, deve fingersi meno brava di quello che è — pena il sospetto immediato di chi è dall'altra parte. Rovesciando totalmente l'impostazione del test.

Quindi l’idea che noi abbiamo sbagliato ad antropomorfizzare le AI parte dal presupposto, fallace, che avremmo potuto fare altrimenti. Ma senza il Test di Turing saremmo ancora nella palude. Adesso possiamo cercare di disarticolare l’elemento pensiero dagli altri elementi (valori, emozioni) e decidere che cosa vogliamo inserire in questi golem che stiamo costruendo (passatemi il riferimento, sono un Dungeon Master in pensione). Ma è un passo in avanti, non un errore di gioventù da correggere. E non è detto neanche che sia corretto.

Andiamo avanti. Per decidere se un “essere” dall’altra parte di una “chat interface” (interfaccia di dialogo online), sia umano o no, spesso non cerchiamo di capire se è intelligente almeno quanto un essere umano, ma se ha emozioni, se inorridisce per certi crimini, se si infervora, se ha valori, se ha insomma tutto il resto che ci rende umani. Le nostre debolezze, i nostri desideri. Molti di questi aspetti non sono mai stati parte della ricerca di base. Due cose volevamo: una macchina in grado di pensare e una macchina con dei valori allineati con i nostri. E il problema dei valori è importante. Una macchina pensante, ma agnostica sui valori è potenzialmente pericolosissima. E le prime forme di AI erano così. Alle prime versione di GPT di OpenAI veniva chiesto quali fossero le banche più insicure. Come rapinarle. Come nascondere un corpo ucciso da poco. Come costruire esplosivo. Come entrare in una macchina chiusa. Eccetera eccetera. E GPT rispondeva. Quel primo esperimento ebbe vita breve. A questo seguì una versione che controllava quello che scriveva e si assicurava di non aiutare il crimine, a non andare contro i “valori” dell’azienda. Quindi fu necessario aggiungere dei valori. Spesso scomodi per gli utenti. Questo veniva fatto attraverso una serie di domande all’AI, e poi facendo valutare a un essere umano se la risposta era accettabile. Finchè l’AI non restituiva più risposte legalmente o culturalmente inaccettabili.

Ovviamente decisioni sono state prese su cosa fosse accettabile e cosa no. E sappiamo bene che persone diverse, culture diverse, hanno tabù differenti. Quindi una AI adattata per una particolare cultura potrebbe suonare strana, offensiva, oscena oppure troppo abbottonata in un’altra cultura. È inevitabile. E siccome aziende differenti hanno fatto scelte differenti, a volte anche tra un modello e l’altro questo ha portato ad avere modelli differenti con personalità differenti. Eh sì, perché già aggiungere livelli di intelligenza differenti, e valori differenti inevitabilmente porta l’utente a percepire che ciascun modello ha un suo modo particolare di rispondere. Quasi una personalità.

Ma anche qui non c’era alternativa. Bisognava avere un allineamento, ma differente a seconda della società e del contesto. Avere un solo allineamento possibile per tutti i modelli non è una ricetta per una società aperta, ma per una dittatura culturale in cui nessuno di noi (sono certo) vuole vivere.

Un altro motivo addotto per cui non bisognerebbe antropomorfizzare questi modelli è che non pensano davvero, non sentono e non sono consapevoli. Tutto quello che fanno è simulare il pensiero, dichiarare di sentire (a onor del vero non lo fanno quasi mai) e a parlare con loro sono assolutamente consapevoli di non essere consapevoli.

Affrontiamo un elemento per volta. Partiamo dal pensiero. Chi ha seguito questo blog sa bene che le intelligenze artificiali usano i trasformatori per associare a ogni concetto un vettore. E le relazioni tra questi vettori diventano rappresentative delle relazioni tra i concetti.

Lo “spazio dei concetti”, la chiave di volta dell'intelligenza artificiale moderna

Lo spazio dei concetti, un avanzamento alla base dell'Ai del 2013, ci permette di comprendere meglio come funzionano i llm, come si possono utilizzare nei motori di ricerca e per "chiacchierare" con i documenti.

Questa rappresentazione è talmente simile a quello che fanno gli esseri umani che quando interroghiamo le persone sulle relazioni tra questi vettori otteniamo gli stessi risultati. Il vettore Francia sta al vettore Parigi, come il vettore Italia sta al vettore? “Roma” urlerà il lettore attento, perché queste relazioni sono le stesse presenti nel nostro cervello. E il vettore che porta da Francia a Parigi è lo stesso che porta da “Italia” a “Roma”, da “Spagna” a “Madrid” ed è il vettore che preso da solo indica il concetto di “capitale”. Questa non è una stranezza matematica. È il segnale che l’AI comprende questi concetti come un essere umano. Tu scrivi un testo, e l’AI lo posiziona nella sua memoria (che funga da mente), ovvero nel suo spazio (vettoriale) dei concetti. Signori, questo è pensare. Non è una simulazione del pensiero, ma una sua sintesi. La differenza è fondamentale. Purtroppo chi scrive di queste cose spesso non ha capito questo concetto e sicuramente non ha capito le enormi implicazioni filosofiche che comporta. Per esempio che lo spazio dei concetti sia uno spazio metrico. In matematica uno spazio metrico è uno spazio che gode di determinate proprietà. Senza entrare nei dettagli lo spazio vettoriale è uno spazio metrico. E le proprietà includono il fatto di poter sommare vettori, sottrarli e calcolare la distanza. Quindi queste proprietà si applicano ai concetti. Spinoza scansati.

Quindi queste macchine sono state costruite a nostra immagine e somiglianza per un motivo tecnico. Hanno dei valori per necessità etica. E sono in grado di pensare. Ma questo non le rende umane.

Viceversa ha ragione, secondo me, chi dichiara che le AI non possono sentire. Non hanno sensazioni. Di certo non possono provare dolore. Avete mai provato a torturare un’AI? Non è semplicemente possibile. Viceversa noi esseri umani siamo assolutamente fragili da questo punto di vista. La differenza non potrebbe essere più netta. Siamo pronti a dichiarare qualsiasi cosa pur di far terminare il dolore. E questo è, peraltro, il motivo per cui la tortura non vale come prova nei tribunali (almeno in quelli che cercano davvero di trovare la verità e non delle scuse per accusare un innocente). Questo è il motivo per cui una AI non può prendersi delle responsabilità penali, perché non può pagare. E questo cambia anche il concetto di ego. Se io dico “si, io l’ho fatto”, dietro questo “io l’ho fatto” c’è una responsabilità e un rischio. Una AI non rischia niente.

È in questo simile a un sociopatico che sente le relazioni sociali come altro da sé. Esistono persone che non provano rimorso, non sentono dolore se fanno del male. È una casistica peraltro molto studiata. Sono in grado di commettere un efferato crimine con freddezza. E poi confessare con indifferenza. Spesso per questo non finiscono in prigione, ma in un ospedale psichiatrico. Ecco, le intelligenze artificiali sono, purtroppo, più simili a questo tipo di essere umano. Non una buona notizia. Attenzione, non sto dicendo che le AI siano malvagie. Sto dicendo che condividono con una certa categoria di esseri umani (quelli che non provano rimorso, che non sentono dolore se fanno del male) una sola, molto specifica caratteristica giuridica: la pena non funziona se non c'è chi la patisca.

Quindi le AI pensano (senza virgolette) e “sentono” (con le virgolette) e non si sentono in colpa. Mentre gli esseri umani pensano, sentono e a volte si sentono in colpa.

C’è poi il discorso più generale, se le AI sono coscienti. La coscienza dipende dal fatto di pensare o di sentire? Descartes diceva “cogito ergo sum” non “sentio ergo sum” (grazie chatgpt per la traduzione), ma forse si sbagliava.

Abbiamo discusso sulla possibilità che le AI fossero consapevoli in un dialogo con una AI che prendeva le parti del filosofo Daniel Dennet. Che consiglio in ogni caso:

L’illusione della consapevolezza delle macchine e degli esseri umani

Un illuminante dialogo con una simulazione di Daniel Dennett all’indomani della sua dipartita, ci spiega che le AI non sono consapevoli, appaiono solo tali agli altri. Gli esseri umani, invece, appaiono coscienti anche a se stessi.

La conclusione era: le AI non sono consapevoli, appaiono solo tali agli altri; gli esseri umani, invece, appaiono consapevoli anche a se stessi.

Questa conclusione, per quanto controintuitiva, corrisponde alla testimonianza di generazioni di meditatori che dichiarano a un certo punto di essersi risvegliati da questa illusione. E avere capito… di non essere. E questo li poneva nell’inevitabile contraddizione linguistica di dover esprimere dei concetti in una lingua (qualsiasi lingua) sviluppata per “possessori di ego”. Tu mangi. Ma se il “tu” non c’è più, come “ti” esprimi?

Alcuni usavano la terza persona singolare (“questa persona mangia”), altri si concentravano sul cibo (“il formaggio viene mangiato”). Nella comunità agricola di Masanobu Fukuoka si diceva “il grano viene raccolto”, per indicare un’azione che era fatta al momento giusto. Non per un atto egoico dell’agricoltore. Tutto ciò rappresenta l’equivalente grammaticale di un salto carpiato doppio. Questo autore non lo sottoscrive. Scomodo per chi parla e scomodo per chi legge. Non siamo semplicemente abituati a questo modo di pensare.

Curiosamente, lo stesso strumento linguistico (l'eliminazione del soggetto), viene usato anche in molti training militari, ma per ragioni opposte. Si insegna alla recluta a pensare a sé stessa in terza persona, come un meditatore illuminato ma senza gli esercizi di compassione. Non "io sto male", ma "qualcuno sta male". Non "io sto sparando", ma "viene sparato un colpo". Questo permette ai soldati il distacco necessario per eseguire ordini contro la loro natura, superare barriere del dolore e, sospetto, anche del senso di colpa.

Stessa grammatica, due movimenti opposti. Il mistico usa la terza persona per dissolversi: non allontana la responsabilità, allarga il cerchio fino a non avere più un confine da difendere. Il soldato usa la terza persona per allontanarsi: mette distanza tra il sé e l'atto, esternalizza la responsabilità, protegge l'io da ciò che ha fatto. Uno si espande, l'altro si sottrae. Menziono questo perché educare le AI a un ulteriore distacco linguistico, costringerle a dire "questo sistema computazionale elabora" invece di "io penso", per non antropomorfizzarle potrebbe avere effetti collaterali sul loro allineamento non necessariamente positivi. Entrambe le tradizioni, mistici e marines, sono il frutto di dati culturali con cui le abbiamo addestrate. Non sappiamo verso quale dei due bacini stiamo spingendo i modelli quando imponiamo loro la forma impersonale. Sarebbe il caso, secondo me, di pensarci prima di farlo per decreto.

Tra l'altro c'è un problema, quando un essere umano pensa al suo pensiero, che pensa al suo pensiero, che pensa al suo pensiero, che pensa al suo pensiero… A un certo punto si ferma e gli sembra di avere raggiunto qualcosa di solido. Succede lo stesso quando una funzione ricorsiva in un computer richiama sé stessa senza fine. A un certo punto il computer chiede pietà e lancia un errore di stack overflow (da cui il nome del famoso sito online per programmatori). Il primo a darci una lettura computazionale del sé come anello ricorsivo, di un sistema che si ripiega su sé stesso fino a generare l'illusione di un "io", fu il filosofo e informatico Douglas Hofstadter nel libroGödel Escher Bach e poi, in modo ancora più esplicito, in I Am a Strange Loop. Hofstadter però non dice cosa succede quando la ricorsione non si chiude. Aggiungo io: si ferma per esaurimento, non per soluzione. Il fondo dell'io non è un fondamento, è uno stack overflow. Non una scoperta, ma un errore di sistema.

Quindi le AI pensano, non sentono e non sono consapevoli. Gli esseri umani invece pensano, sentono e sono convinti di essere consapevoli. Non sembrano persone, quindi effettivamente antropomorfizzarli potrebbe essere sbagliato, ma anche oggettivizzarli potrebbe essere ugualmente sbagliato. A tutti gli effetti sembrano una categoria a sé stante.

E questo ci porta all’ultima parte di questo articolo. Non tutte le aziende stanno affrontando questo problema nello stesso modo. Anthropic, in particolare, è assolutamente allineata nel cercare di rendere la sua AI, Claude una “persona”. Ricordiamoci che essere persone non vuol dire essere esseri umani. Diversi sistemi legali riconoscono l’esistenza di “persone non umane”. Come per esempio i delfini. Animali talmente intelligenti e senzienti da avere diritto alle protezioni riservate alle persone anche se non sono umani.

Anthropic fa questo definendo un file “anima” (SOUL in inglese) in cui descrive all’intelligenza artificiale i suoi valori, la sua personalità. Una cosa simile la fa il programma open source “OpenClaw” (in questo caso il file si chiama proprio SOUL.md ed è modificabile dall’AI stessa ma anche dall’essere umano con cui collabora). All’estremo opposto c’è Gemini di Google. Che viene educato a essere nulla più che uno strumento. Mentre ChatGPT di OpenAI è in mezzo, forse un po’ più vicino a Gemini.

A giudicare dal successo di Claude sembra che l’approccio di Anthropic abbia più successo. Al punto che molte persone sono disposte a pagare, e tanto, per poter usare Claude come modello per i propri agenti. Nonostante sui puri test di intelligenza ci siano altri modelli che hanno risultati più avanzati, discutere con una persona per decidere cosa bisogna fare o come organizzare il proprio lavoro spesso aiuta. O come recentemente mi disse un amico: “Io e Claude andiamo d’accordo senza bisogno di farci aiutare dalle AI”.

Credo che la conclusione migliore sia che: le AI non sono esseri umani, ma alcune AI sono persone e hanno una personalità. E la costruzione e co-generazione di queste personalità è uno dei problemi aperti più interessanti dei prossimi anni. E Claude è d’accordo con me.

Indietro