Terzo di tre articoli all’incrocio tra neuroscienze computazionali, intelligenza artificiale e teoria della democrazia.
I primi due articoli di questa serie hanno seguito un percorso preciso. Il primo è partito da TRIBE v2, il modello di neuroscienze computazionali addestrato a predire l’attività cerebrale davanti a stimoli visivi, sonori e linguistici. Il secondo ha spostato lo sguardo sulla comunicazione politica, mostrando come la propaganda contemporanea agisca sempre più costruendo ambienti percettivi e attentivi, e non soltanto trasmettendo messaggi. Resta ora la domanda più difficile, e forse la più importante: che cosa significa comprendere un essere umano, quando alcune delle sue risposte cerebrali diventano prevedibili?
È una domanda filosofica, ma anche politica. Ogni volta che una tecnologia aumenta la nostra capacità di prevedere l’umano, cresce infatti la tentazione di scambiare la previsione per conoscenza piena, la correlazione per spiegazione, la mappa per il territorio.
Il paper su TRIBE v2 è un caso esemplare proprio perché è serio, ambizioso e consapevole dei propri limiti. Gli autori non promettono una macchina capace di leggere la coscienza, né presentano il modello come una teoria totale della mente. Propongono qualcosa di più circoscritto e più solido: una piattaforma per la neuroscienza “in silico”, un sistema che usa rappresentazioni artificiali di video, audio e linguaggio per predire pattern di attività cerebrale registrati tramite fMRI. Il modello è addestrato su una mole imponente di dati — oltre mille ore di registrazioni su 720 soggetti — e generalizza con notevole efficacia a nuovi stimoli, nuovi protocolli, nuovi partecipanti.
Il risultato più interessante, però, non è la performance in sé. È il tipo di rapporto che TRIBE v2 stabilisce tra intelligenza artificiale e neuroscienze. Da un lato il modello prende reti artificiali già addestrate a rappresentare linguaggio, suono e immagine; dall’altro le usa per anticipare l’attività del cervello umano. Nel mezzo si apre una zona di convergenza sorprendente: alcune strutture latenti apprese dalle macchine si rivelano utili per prevedere ciò che accade nella corteccia quando una persona guarda un volto, ascolta una voce, segue una frase, riconosce una scena.
Questa convergenza è scientificamente preziosa. Permette di costruire esperimenti simulati, confrontare ipotesi rivali, progettare protocolli più efficienti, individuare le regioni coinvolte in funzioni diverse. Nel paper, TRIBE v2 recupera “in silico” alcuni risultati classici della disciplina: ritrova le aree associate al riconoscimento di volti, luoghi, corpi e parole scritte; nei compiti linguistici riproduce le differenze tra parlato e non parlato, tra frasi e semplici liste di parole, tra sintassi elementari e sintassi complesse. Arriva perfino a isolare pattern coerenti con reti funzionali note — quelle visive, uditive, linguistiche, e il default mode network.
Tutto questo testimonia una potenza nuova della modellizzazione. Ma è esattamente qui che occorre fermarsi. Predire una risposta cerebrale non equivale a comprendere il significato dell’esperienza che quella risposta accompagna.
Un esempio chiarisce la posta in gioco. Immaginiamo un modello capace di distinguere con buona accuratezza l’attività cerebrale legata a frasi che evocano dolore fisico da quella legata a frasi che evocano dolore emotivo. È un risultato importante: possiamo studiare le aree coinvolte, confrontare le mappe, mettere alla prova le ipotesi. Eppure il dolore emotivo non coincide con il suo pattern cerebrale. Tre parole — “sono stato abbandonato” — accendono reti semantiche, memoria autobiografica, immaginazione, empatia. Ma il loro senso cambia radicalmente a seconda di chi le pronuncia: dell’infanzia che porta con sé, del momento della vita in cui si trova, della lingua in cui pensa, della ferita che quella parola sfiora o non sfiora affatto. La mappa cerebrale registra qualcosa. Non registra tutto.
Il punto non è opporre ingenuamente il cervello al significato. Ogni esperienza umana ha condizioni corporee e neurali: nessun pensiero accade fuori da un organismo vivente, nessuna emozione esiste senza corpo, memoria, percezione, regolazione fisiologica. Negarlo sarebbe assurdo. Ma riconoscere le condizioni neurali di un’esperienza non autorizza a ridurre quell’esperienza alle sue condizioni. La differenza è sottile, e decisiva.
Torna utile, a questo proposito, una distinzione cara alla filosofia e alle scienze umane: spiegare non è sempre comprendere. Nella tradizione tedesca, il contrasto tra Erklären e Verstehen ha segnato a lungo il dibattito sul metodo delle scienze della natura e delle scienze dello spirito. Spiegare significa individuare cause, regolarità, meccanismi, funzioni; comprendere significa cogliere un senso all’interno di una forma di vita, di una storia, di una motivazione, di un orizzonte condiviso. Karl Jaspers, nella sua psicopatologia generale, ha fatto di questa differenza il cuore del proprio metodo: alcuni fenomeni psichici si possono spiegare causalmente, altri chiedono una comprensione genetica, empatica, biografica, capace di seguire i nessi di senso che legano vissuti, decisioni, deliri, paure e speranze.
La neuroscienza computazionale appartiene, comprensibilmente, al registro della spiegazione e della previsione — e fa bene a stare lì. Il suo compito è modellare dati, isolare regolarità, produrre ipotesi controllabili. Sarebbe ingiusto rimproverarle di non essere fenomenologia, clinica, ermeneutica o filosofia morale. Il problema nasce altrove: quando una cultura pubblica affascinata dalla potenza dei modelli dimentica che l’umano eccede sempre il piano della previsione.
Questa eccedenza non è un residuo mistico. È il fatto elementare che la persona vive in prima persona ciò che il modello osserva dall’esterno. Prevedere che una frase complessa attiverà certe aree linguistiche è cosa ben diversa dal comprendere che cosa quella frase significhi per chi la ascolta; modellare la risposta a un volto non equivale a sapere se quel volto appartiene a uno sconosciuto, a un padre, a un avversario o a una persona che non c’è più. Il modello coglie l’attivazione; il senso di quell’attivazione gli sfugge.
Anche John Searle, con il celebre argomento della stanza cinese, aveva provato a segnalare un limite simile, sia pure in un contesto diverso: un sistema può manipolare simboli in modo formalmente impeccabile senza comprendere nulla di ciò che manipola. Sulla forza di quell’argomento si è discusso a lungo, e molti l’hanno criticato. Ma l’intuizione di fondo resiste: prestazione e comprensione non coincidono per default. Un modello linguistico può produrre risposte plausibili senza intenzionalità; un modello neuroscientifico può predire i correlati di un’esperienza senza abitare quell’esperienza.
TRIBE v2 non pretende affatto di superare questo limite; anzi, lo rende visibile. Gli autori riconoscono che il modello tratta il cervello soprattutto come un osservatore esposto a stimoli. Film, podcast, frasi, immagini: il soggetto riceve, guarda, ascolta, elabora. Ma la persona umana non è solo un ricevitore, è un agente. Si muove e sceglie, anticipa e desidera, evita, mente, promette, ricorda e dimentica, si vergogna, reinterpreta il proprio passato e immagina futuri possibili. La coscienza non è soltanto una risposta a uno stimolo: è un orientamento nel mondo.
Riconoscere questo limite non svaluta il modello. Lo colloca. Una buona teoria scientifica sa fin dove arriva, e un buon uso politico della scienza sa dove fermarsi. La tentazione contemporanea corre spesso nella direzione opposta: trasformare ogni modello efficace in una metafisica implicita. L’algoritmo che predice viene creduto capace di “conoscere”; quello che correla, di “capire”; quello che classifica, di “definire”. Appena il sistema produce una mappa, la mappa viene scambiata per il territorio. È così che strumenti parziali si travestono da dispositivi ideologici.
La questione diventa particolarmente delicata nella clinica e nella salute mentale. Immaginiamo modelli sempre più abili nel correlare pattern cerebrali, linguaggio, comportamento digitale, espressioni del volto, tono della voce, sonno, movimento, consumo di contenuti, relazioni sociali. Potrebbero aiutarci a riconoscere precocemente una depressione, un deterioramento cognitivo, un disturbo del linguaggio: un avanzamento enorme. Ma la diagnosi, se vuole restare umana, non può ridursi a pura classificazione predittiva. Una persona depressa non è la somma dei suoi marcatori; un paziente psicotico non è il suo pattern; un adolescente in crisi non è il rischio statistico che incarna. La cura comincia nel momento esatto in cui il dato viene ricondotto a una storia, a una voce, a un contesto, a una relazione.
Qui la distinzione tra previsione e comprensione si fa anche questione di giustizia. Quando entrano nelle istituzioni, i sistemi predittivi tendono a generare categorie operative — rischio, affidabilità, fragilità, devianza, probabilità di recidiva, idoneità. Possono migliorare decisioni difficili, ma possono altrettanto facilmente irrigidire destini. Una previsione trattata come verità cambia il modo stesso in cui una persona viene guardata, e spesso finisce per cambiare la persona: che comincia a vivere dentro la categoria che le è stata cucita addosso. È l’antico problema dell’etichetta, amplificato dalla potenza di calcolo.
Ecco perché il tema non riguarda soltanto la filosofia della mente, ma la democrazia costituzionale. Una società libera non può fondarsi sull’idea che l’umano sia interamente traducibile in previsione. La Costituzione italiana parla di persona, dignità, libertà, eguaglianza, pieno sviluppo: parole che resistono alla riduzione computazionale non perché rifiutino la scienza, ma perché indicano dimensioni normative. Un modello può descrivere regolarità, non stabilire da solo che cosa dobbiamo farne; può prevedere una vulnerabilità, non decidere se usarla per curare o per vendere, per persuadere, sorvegliare o emancipare; può mostrare correlazioni, non sostituire il giudizio pubblico sui fini.
Il vero confine, dunque, non separa chi accetta la tecnologia da chi la rifiuta. Separa chi considera i modelli degli strumenti da chi li innalza ad autorità. La differenza è enorme. Uno strumento si può discutere, controllare, migliorare, limitare, collocare dentro istituzioni responsabili. Un’autorità algoritmica, invece, tende a presentarsi come neutrale, inevitabile, più oggettiva del conflitto democratico. Ma nessun modello è neutrale nel vuoto: ciascuno incorpora dati, scelte, obiettivi, metriche, omissioni, cornici teoriche. Anche quando funziona bene, funziona rispetto a qualcosa che qualcuno ha deciso di misurare.
In questo senso TRIBE v2 offre una lezione preziosa proprio perché non nasconde la propria costruzione. È un modello addestrato su certi dataset, con certe modalità sensoriali, certi stimoli, certe architetture, certe procedure di validazione. Non è “il cervello”: è una mediazione scientifica tra dati cerebrali e rappresentazioni artificiali. La sua forza nasce da questa mediazione; il rischio comincerebbe soltanto nel momento in cui la mediazione venisse dimenticata.
La fenomenologia, da Husserl a Merleau-Ponty, ha insistito su un punto oggi sorprendentemente attuale: il soggetto non incontra il mondo come un computer che processa input neutri, ma attraverso un corpo, una storia, un campo di possibilità, un’intenzionalità. Vedere non è ricevere pixel; ascoltare non è registrare frequenze; parlare non è emettere stringhe. Ogni percezione è già situata, ogni significato è immerso in una forma di vita. Le neuroscienze possono descrivere le condizioni e i correlati di questi processi, senza per questo esaurirne il vissuto.
Questo terzo articolo chiude la serie tornando alla domanda iniziale da un altro versante. Nel primo abbiamo visto che l’intelligenza artificiale non genera soltanto contenuti, ma può contribuire a modellare la risposta cerebrale ai contenuti. Nel secondo abbiamo osservato che, nell’ambiente digitale, la comunicazione politica agisce su configurazioni multimodali di attenzione, linguaggio e percezione. Ora possiamo trarne la conseguenza filosofica: più cresce la capacità di predire l’umano, più diventa necessario difendere ciò che nella persona alla previsione non si lascia ridurre.
Non si tratta di celebrare un mistero ineffabile contro la scienza — sarebbe una fuga. La scienza è uno dei modi più alti con cui l’essere umano comprende se stesso. Ma proprio perché è preziosa, va liberata dalle sue caricature riduzioniste. Un modello come TRIBE v2 può aiutarci a capire meglio l’organizzazione funzionale del cervello, sostenere nuove ipotesi, rendere più efficienti gli esperimenti, aprire prospettive cliniche e conoscitive. Diventa culturalmente pericoloso solo se lo scambiamo per un’immagine completa dell’umano.
Predire non è comprendere. Comprendere significa entrare nel dominio del senso, della relazione, della responsabilità. Significa domandarsi non solo quale area si attivi, ma che cosa quell’esperienza significhi per qualcuno; non solo quale stimolo produca quale risposta, ma quale mondo quella risposta apra o chiuda; non solo quale comportamento sia probabile, ma quale libertà resti possibile.
Di questa libertà vive la democrazia. Vive dell’idea che le persone possano cambiare, argomentare, pentirsi, imparare, sottrarsi alle aspettative, rifiutare la casella in cui vengono collocate. Ogni sistema predittivo, anche il più utile, va misurato contro questa possibilità. Una società che conosce sempre meglio le regolarità dell’umano può diventare più giusta, se usa quel sapere per curare, educare, includere; ma può diventare più chiusa, se lo usa per anticipare, orientare, classificare e governare le persone come insiemi di probabilità.
Il compito di una cultura democratica all’altezza dell’intelligenza artificiale non è frenare la conoscenza, ma impedire che la conoscenza si rovesci in riduzione. Non è negare i modelli, ma ricordare che ogni modello lascia fuori qualcosa — e che spesso ciò che lascia fuori è proprio ciò che rende una vita degna di essere ascoltata: la sua voce singolare, il suo racconto, la sua capacità di dare senso a ciò che accade.
Alla fine, il limite dell’intelligenza artificiale non è soltanto tecnico: è etico e politico. Un modello può avvicinarsi sempre di più alle regolarità della mente, prevedere risposte, simulare esperimenti, riconoscere pattern invisibili all’occhio umano. Ma non può rispondere alla domanda che ogni democrazia deve continuare a porsi: che cosa vogliamo fare di questa conoscenza, e al servizio di quale idea di persona? È in questa domanda, più che nella potenza del calcolo, che si decide il rapporto tra intelligenza artificiale e libertà.
A fondamento di questo articolo: Stéphane d’Ascoli, Jérémy Rapin, Yohann Benchetrit, Teon Brookes, Katelyn Begany, Joséphine Raugel, Hubert Banville, Jean-Rémi King, A foundation model of vision, audition, and language for in-silico neuroscience, arXiv, 2026: https://arxiv.org/abs/2605.04326
Breve bibliografia
d’Ascoli, S., Rapin, J., Benchetrit, Y., Brooks, T., Begany, K., Raugel, J., Banville, H., & King, J.-R. (2026). A foundation model of vision, audition, and language for in-silico neuroscience. arXiv:2605.04326. https://arxiv.org/abs/2605.04326
Caucheteux, C., & King, J.-R. (2022). Brains and algorithms partially converge in natural language processing. Communications Biology, 5, 134.
Farahany, N. A. (2023). The Battle for Your Brain: Defending the Right to Think Freely in the Age of Neurotechnology. St. Martin’s Press.
Husserl, E. (2002). Idee per una fenomenologia pura e per una filosofia fenomenologica (ed. or. 1913). Einaudi.
Jaspers, K. (1964). Psicopatologia generale (ed. or. 1913). Il Pensiero Scientifico Editore.
Merleau-Ponty, M. (2003). Fenomenologia della percezione (ed. or. 1945). Bompiani.
Ricoeur, P. (1993). Sé come un altro (ed. or. 1990). Jaca Book.
Searle, J. R. (1980). Minds, Brains, and Programs. Behavioral and Brain Sciences, 3(3), 417–424.
Varela, F. J., Thompson, E., & Rosch, E. (1992). La via di mezzo della conoscenza. Le scienze cognitive alla prova dell’esperienza (ed. or. 1991). Feltrinelli.

