Cosa ci insegnano gli LLM su come pensiamo


“Preso in sé, il pensiero è come una nebulosa in cui nulla è necessariamente delimitato. Non vi sono idee prestabilite, e nulla è distinto prima dell'apparizione della lingua.”
Ferdinand de Saussure

Una domanda che dovrebbe costantemente affrontare chi costruisce sistemi basati su modelli linguistici è: cosa significa, davvero, "capire qualcosa"? Questo dubbio metodico emerge tutte le volte che dobbiamo risolvere un nuovo problema, stabilire se esistono nessi profondi tra frasi e concetti o valutare la bontà di un risultato. Che la comprensione abbia a che fare con l’afferrare significati e che questi dipendano strettamente dal contesto è intuitivo. Traslato nell’ambito dell’elaborazione automatica del linguaggio, significa mappare, nella maniera più accurata possibile, i significati all’interno di un perimetro di condizioni ben definite. Detto così sembra semplice; nei fatti, è invece di una complessità inaudita.

Gli LLM, dall’avvento dei Transformer in poi, sembrano aver sfondato il muro di questa complessità. Eppure, nonostante risultati straordinari, siamo ancora ben lontani dalla perfezione. I miglioramenti dei modelli, misurati attraverso i benchmark, confidano in un ecosistema sempre più capace di dominare le variabili in gioco. Ma ogni giorno, a fianco di comportamenti brillanti e risposte che lasciano a bocca aperta per acume e precisione, ne emergono altre che sono totali scemenze. Ogni volta che ci scontriamo con questi fallimenti, ritorna l’eterna domanda: perché non ha capito? Cosa sfugge ancora? Quale meccanismo logico, interpretativo o di pensiero dobbiamo ancora implementare?

Dopo oltre venticinque anni di esperienza sul campo, la strada maestra per risolvere i problemi di NLP è rimasta la stessa: delimitare il contesto e individuare i criteri di disambiguazione. La complessità resta lì, immutata, sia davanti al modello più sorprendente di oggi, sia davanti a quello che ci stupirà domani. Spesso ci chiediamo se un giorno le macchine saranno così capaci da non richiedere più il nostro sforzo (human-in-the-loop), o se addirittura arriveranno a superarci, creando paradigmi e vedendo relazioni a noi invisibili. La velocità del progresso fa supporre di sì, ma la strada è ancora tutta in salita.

C’è un limite strutturale nell’approccio attuale. Le macchine contemporanee sono incredibilmente energivore: stiamo dominando la complessità "a martellate". Per dirla con il matematico Alexander Grothendieck, i cervelli elettronici operano spesso con lo stile del martello e dello scalpello: colpiscono il guscio della noce (il problema) con la forza bruta del calcolo computazionale fino a spezzarlo. Al contrario, l’organismo biologico – il cervello umano – opera come il mare. Non attacca il problema in modo isolato: preferisce far salire lentamente il livello dell’acqua, costruendo un intero quadro teorico, un oceano di concetti leggeri e interconnessi attorno all’oggetto, finché la difficoltà non si dissolve da sola, assorbita in una comprensione più vasta e naturale.

La nostra recente esperienza nello sviluppo di Labyrinthum (il nostro primo sistema di Knowledge Management basato su Hybrid RAG) ce lo ha confermato: ogni miglioramento significativo nella qualità delle risposte non è arrivato dalla forza bruta di un prompt più lungo, ma da una vera e propria costellazione di tecniche di retrieval diverse e stratificate. Ognuna delle quali risolve una dimensione specifica del problema, alzando il livello del mare e abbassando l’asticella della complessità, senza mai ridurla a zero in modo lineare. Di fronte a ogni fallimento, torniamo a interrogarci: come faccio io, essere umano, a capire che questo nesso è corretto? Cosa faccio di diverso rispetto alla macchina? E da lì, cerchiamo di emulare quel processo nel codice.

Chi si occupa di NLP fin dagli inizi degli anni 2000 ricorderà come questa disciplina era alla portata solo di istituti di ricerca e, a livello industriale e commerciale, applicata da ben pochi pionieri. La storia di VerdeLab affonda le radici proprio in quegli anni. All’inizio del millennio ci venne proposto di costruire un software capace di trovare analogie semantiche tra i sintomi descritti spontaneamente dai pazienti e raccolti meticolosamente in un vasto corpus di materie mediche omeopatiche. Da quella sfida nacque Omeo, il nostro primo progetto NLP (un vero e proprio RAG ante litteram) di una certa portata e complessità. Un software che ancora oggi ci sorprende per l’accuratezza dei risultati, se pensiamo ai mezzi piuttosto limitati dell’epoca. In quegli anni, scrivere un algoritmo significava decodificare le logiche del pensiero umano attraverso lo studio meticoloso della sintassi, della semantica e della morfologia italiana sui manuali di Saussure e di Tullio De Mauro, che affollavano le nostre scrivanie.

Ci ispiravamo alle prime grandi risorse che arrivavano dal mondo della ricerca, come WordNet (e le sue declinazioni italiane non proprio brillanti), che cercavano di mappare la lingua per entità, relazioni gerarchiche, sinonimi, iponimi e iperonimi. Se l’utente cercava "gatto", WordNet agganciava felino o micio, ma sapeva anche che le zampe o i baffi erano parti del gatto e che il gatto apparteneva alla classe dei mammiferi. Usavamo queste reti o "sensigrafi" come "semi" per recuperare i testi rilevanti. Abbiamo dovuto costruire dizionari specializzati per ripulire il testo dal rumore (congiunzioni, particelle), effettuare la lemmatizzazione per intercettare le declinazioni (micio, micia, micetto) e affidarci ad algoritmi di similitudine basati sulla vicinanza dei caratteri (come la distanza di Levenshtein, costrutti di LIKE, indici full text nei database e tanto altro per far fronte anche ai notevoli costi computazionali). Lì abbiamo imparato la nostra prima grande lezione, valida ancora oggi nell’era dei Transformer: il perimetro della conoscenza entro cui ci si muove determina la qualità del risultato, perché l’essenza stessa del linguaggio è la disambiguazione.

All’epoca, la "vecchia porta" (intesa come un infisso antico) non era distinguibile matematicamente dall’azione di una donna anziana che "porta" qualcosa. Strumenti come NLTK (Natural Language Toolkit) erano ancora acerbi per l’italiano e non offrivano reali vantaggi rispetto ai nostri motori di retrieval customizzati. La flessibilità di adattare l’algoritmo a un contesto verticale e circoscritto era l’unica vera chiave per non fare fallire il sistema. Oggi la tecnologia si è evoluta in maniera radicale. Gli LLM gestiscono la disambiguazione in modo intrinseco grazie agli spazi vettoriali latenti e ai meccanismi di attenzione. Eppure, la sfida concettuale non è cambiata. Interpretare il linguaggio significa quantificare e misurare i significati all’interno di un contesto e i modelli linguistici attuali ci stanno insegnando ogni giorno qualcosa in più, poiché agiscono come uno specchio, sebbene ancora rudimentale, dei nostri processi logici e dei nostri limiti.

Commenti

Post popolari in questo blog

La geometria del pensiero: perché la ricerca semantica da sola non basta

Labyrinthum: come stiamo costruendo uno strumento per pensare meglio

Hybrid Search, HyDE e grafi: costruire un RAG che non dimentica come pensi