Verso l'intelligenza artificiale generale
Autore: Gabriele Rossi
da: Divenire 5, Futurologia () | pdf | stampa
Some people think much faster computers are required for Artificial Intelligence, as well as new ideas. My own opinion is that the computers of 1974 were fast enough if only we knew how to program them.
John McCarthy
A più di cinquanta anni dalla comparsa del fortunato nome "Intelligenza Artificiale", di intelligenza non se ne è vista poi così tanta: per un Deep Blue che batte Kasparov, annoveriamo decenni (decenni!) di robot che non riescono ad attraversare una stanza. Se è vero che il continuo aumento di velocità elaborativa ha contribuito in molti campi a coprire evidenti difetti progettuali, è improbabile – per non dire impossibile – che i soli miglioramenti hardware ci conducano alla costruzione di una vera Intelligenza Artificiale: l'intelligenza non risiede nell'hardware (e nemmeno, strettamente parlando, nel codice), quanto piuttosto nel progetto "filosofico" di fondo. Se è vero che una lucertola è, per molti versi, più "intelligente" di qualsiasi computer, la domanda di fondo dell'I.A. rimane ancora senza risposta: come si costruisce una mente?
In questo lavoro vorremmo provare ad introdurre la Matematica dei Modelli di Riferimento degli iLabs, esplorando i potenziali vantaggi di questa prospettiva alla luce di alcune questioni teoriche di fondo che pervadono tutta la storia della disciplina. Nella Sezione 1 introduciamo il problema al cuore dell'I.A., ovvero la riduzione di tutte le attività mentali ad un insieme di principi base; la Sezione 2 è dedicata al concetto di Modello di Riferimento e ai suoi principi ispiratori. Nella Sezione 3, infine, presentiamo un risultato di ricerca iLabs, prima di concludere con alcune considerazioni sulla generalizzazione del metodo e l'implementazione effettiva della teoria.
1. Costruire una mente
Un'Intelligenza Artificiale Generale dovrebbe quantomeno approssimare tutte le principali funzionalità di una Intelligenza Biologica Generale. Riprodurre, una ad una, le capacità della mente umana è ovviamente un progetto senza speranza: al di là delle apparenze, deve essere possibile ricondurre tutte le complesse operazioni che vediamo ad un insieme finito, possibilmente molto piccolo, di operazioni base. In alcuni campi, tale rivoluzione "occamista" ha già prodotto i suoi frutti: in biologia, la scoperta del DNA come linguaggio universale ci ha permesso di capire che l'eterogeneità tra viventi è riconducibile ad un diverso utilizzo di identici mattoncini di partenza; in linguistica, la grammatica generativa ha permesso di apprezzare la sostanziale uniformità di tutte le lingue naturali, dimostrando come italiano e giapponese siano, contrariamente alle apparenze, una variazione sullo stesso tema. In un certo senso, la primissima, pioneristica stagione dell'Intelligenza Artificiale ha tentato una riduzione simile: se la base di tutte le attività umane è il ragionamento logico- deduttivo, per costruire una mente basterà indovinare la giusta serie di deduzioni. Come noto, il programma "logicista" è durato lo spazio di un'illusione – tanto quanto è bastato per dimenticare lo stupore dei primi dimostratori di teoremi davanti all'ovvia impossibilità di generalizzare l'approccio ad altre attività della mente umana. Ma quando il testimone è passato alla generazione successiva, la lezione di quei tempi eroici è (almeno in parte) stata recepita: per costruire una mente servono sostanzialmente due cose, ovvero una forte "filosofia" di fondo e un'idea su come implementarla. Ecco quindi che la nostra domanda originale si scompone: "cosa significa pensare?" da un lato, "come rappresentarlo in un PC?" dall'altro.
2. Cosa significa pensare?
La teoria dei Modelli di Riferimento è stata elaborata all'interno dei laboratori iLabs per cercare di rispondere a questa domanda: qualsiasi attività intelligente può quindi essere scomposta ed analizzata come l'attivazione di una serie di modelli di riferimento più primitivi. L'esistenza di modelli di riferimento elementari (e di regole per costruirne di nuovi) rende trattabile la modellazione dell'intera gamma di funzionalità caratteristiche dell'intelligenza – come il DNA in biologia e gli "alberi" di Chomsky in linguistica.
Ma cos'è un modello di riferimento? Un modello di riferimento è una sequenza ordinata di
È tuttavia impossibile capire con precisione la profondità della proposta senza considerare l'impostazione filosofica: facciamo un passo indietro. L'intelligenza (o, in termini più astratti, l'informazione) non è una proprietà disincarnata, né una sostanza impalpabile che permea il cosmo: i sistemi "intelligenti", siano essi fatti di carbonio o silicio, sono sistemi fisici con proprietà fisiche. Sono collocati nello spazio, rispondono all'ambiente, sono soggetti alle fondamentali leggi fisiche. Il PC che usiamo tutti i giorni è una meravigliosa quanto elementare dimostrazione di questo fatto: l'informazione che mi appare sullo schermo – come il documento che sto componendo – è un preciso e determinato oggetto fisico, rappresentato elettromagneticamente nel mio disco fisso. Quello che distingue questo documento dalla mia lampada è che solo il primo ha proprietà semantiche: il documento rappresenta qualcosa per me – cosa che farebbe anche la lampada se avessimo convenzioni sociali e comunicative leggermente diverse. In altre parole, mentre siamo ragionevolmente certi che i marziani concorderebbero con noi sulla fisica del mio hard disk e della mia lampada, non c'è alcuna garanzia che il contenuto di informazione di questi oggetti rimanga il medesimo nelle due culture: l'informazione è nell'occhio di chi guarda.
Alla base dei Modelli di Riferimento c'è dunque l'esplicito riconoscimento dell'isomorfismo tra realtà e informazione: la metodologia scelta per indagare il pensiero dovrà quindi avere un preciso corrispettivo nella metodologia per indagare la realtà fisica in cui il pensiero è necessariamente immerso. Pensare è sì calcolare, ma calcolare è spostare pattern di proprietà fisiche. La rappresentazione del pensiero deve incontrare la rappresentazione del mondo fisico.
2.1 L'Universo digitale
Consideriamo la "super-flatlandia" unidimensionale rappresentata nella figura sottostante:
In questo piccolo universo giocattolo, ripreso nel momento del Big Bang, possiamo vedere uno spazio occupato non uniformemente da proprietà: una parte dello spazio è "bianca" (materia inerte?), un'altra è "nera" (una particella?). Il mistero si infittisce quando osserviamo cosa succede dopo il Big Bang in questo universo:
Ogni riga dell'immagine rappresenta un istante successivo (t0, t1, t2, etc.) nell'evoluzione del mondo. Pian piano lo spazio si riempie di "neri", in un modo che ricorda una continua fissione di particelle. Ovviamente, la prospettiva fisica è solo una faccia della medaglia. Supponiamo che lo spazio sia formato da quadrati bianchi o neri ("0" o "1", "falso" o "vero"... il lettore esperto starà già intuendo il "trucco") e supponiamo che ad ogni istante ogni quadrato computi lo XOR dell'algebra di Boole: all'istante successivo sarà nero ("1", "vero"...) se e solo se all'istante precedente esattamente uno dei suoi immediati vicini era nero. Il risultato (basta poco per verificarlo) è ovviamente un'immagine identica: quella che abbiamo vissuto come un'evoluzione fisica può essere rappresentata come una serie di operazioni discrete su stringhe di bit.
Universi come questo sono studiati dalla teoria degli automi cellulari, universi discreti n-dimensionali in cui ogni cella elementare può assumere stati diversi (bianco/nero nel nostro esempio) in tempi diversi, in base ad un semplice operatore elementare computato simultaneamente da tutte le celle (lo XOR, nel nostro esempio) 1 . Le potenzialità di questa classe di modelli sono evidenti: a partire da una regola semplice generano un comportamento complesso e eterogeneo (come i Modelli di Riferimento) e rispettano un rigoroso isomorfismo (come i Modelli di Riferimento), tant'è che è possibile l'analisi del loro comportamento sul piano fisico come su quello logico. Siamo dunque pronti per un salto dimensionale ad una flatlandia leggermente più complessa 2 :
Ecco la rappresentazione bi-dimensionale dell'universo iLabs 3 : un semplice spazio ("lattice", tecnicamente) di celle esagonali. Ovviamente, ogni sorta di oggetto "composito" può popolare questo spazio: ogni insieme di celle può essere a tutti gli effetti considerato un sistema, come Nero, Grigio e Grigino nell'immagine sottostante:
Come l'informazione, anche i "sistemi" sono oggetti fortemente convenzionali 4 : non essendoci a priori "nulla" in questo universo, saranno le nostre pratiche cognitive ad evidenziare (magari in base agli stati delle diverse celle) diversi "sistemi" 5 . Il concetto di sistema è fondamentale perché permette una vivida rappresentazione di un modello di riferimento: una volta identificato un sistema in questo universo, automaticamente sono definiti i pensieri, le azioni e le percezioni 6 :
Una qualsiasi sequenza di < percezione > < pensiero > < azione > è dunque un Modello di Riferimento. In questa prospettiva, la nostra mente è semplicemente un sistema, così come il nostro corpo, ma anche la nostra cellula o quella di un batterio: in ognuno di questi sistemi, operatori fondamentali convertono segnali dall'esterno in segnali per l'esterno attraverso semplici meccanismi fondamentali. In ognuno di questi sistemi, la natura "frattale" del processo è evidente: quello che nella prospettiva del cervello è una "percezione" è il risultato di tanti
a livello dei tessuti, i quali a loro volta dipendono dai Modelli di Riferimento attivati nelle cellule. Come risulta chiaro nel nostro modello bidimensionale, la Realtà tutta, fino dal suo livello fisico-informazionale più elementare, è regolata dai Modelli di Riferimento: in particolare, l'universo iLabs è regolato da un Modello di Riferimento fondamentale, la sequenza di
che governa nientemeno che il comportamento delle celle esagonali – e quindi, a cascata, di tutto l'universo. Anche se l'immagine generale della teoria dovrebbe ora essere chiara, desideriamo avventurarci ora nella cosiddetta super-regola: osservare con precisione il comportamento di un universo digitale al suo livello più ultimo ci permetterà di riconsiderare da una prospettiva inedita e privilegiata i concetti fondamentali fin qui introdotti.
3. La super-regola
La super-regola è un Modello di Riferimento e come tale è composto di percezione, pensiero ed azione. Cosa percepisce una cella elementare dell'universo? Nel nostro modello, ogni cella esagonale percepisce l'attivazione del bit contiguo nelle celle adiacenti:
Per ognuno dei sei lati, la cella riceve in input "1" o "0": la percezione può dunque essere rappresentata, per ogni esagono, da una stringa di 6 bit ottenuta concatenando i bit percepiti in un dato ordine (nella figura, “111111”). L'azione di una cella fondamentale è ovviamente il cambiamento del proprio stato interno in seguito ad una percezione; poiché ogni cella ha 6 bit da "settare", anche l'azione è rappresentabile come una stringa di 6 bit (nella figura seguente, "111111") 7 :
Il pensiero è quindi facilmente definito come l'operatore che trasforma la stringa di input in quella di output, la percezione in azione. Nella super-regola, il pensiero è un semplice routing condizionale dei segnali in ingresso: in caso di un numero pari di bit percepiti (ad es. "010100"), la cella avrà come azione la medesima stringa ("010100"); in caso di numero dispari di bit percepiti ("011100"), la cella avrà come azione l'inverso della stringa di partenza ("100011").
Il bello del modello è che il discorso astratto sui numeri si traduce immediatamente in una rappresentazione spaziale: nel caso "pari", il risultato per l'universo sarà analogo al "rimbalzo" di due particelle:
Nel caso "dispari", il risultato per l'universo sarà invece analogo al "moto rettilineo uniforme" delle cariche:
L'evoluzione di un mondo basato su questa regola in apparenza semplice è stupefacente. Durante le nostre simulazioni moltissimi pattern interessanti sono emersi a partire da configurazioni iniziali differenti 8 .
Di certo – al di là della soddisfazione per un automa cellulare in grado di generare pattern di colori e forme psichedeliche anni '70 –, sono due le caratteristiche della super-regola a farci credere di essere, dopo anni, non distanti da uno dei Modelli di Riferimento base. La prima è nota in letteratura come reversibilità: se vedete l'evoluzione dell'universo come un film, un universo è reversibile solo se è sempre possibile ripercorrere all'indietro, fotogramma dopo fotogramma, tutta la "proiezione". La super-regola non solo è reversibile, ma è fortemente tale: nel nostro film, basta applicare lo stesso operatore al contrario per ripercorrere tutti gli istanti di vita dell'universo, fino a tornare al Big Bang: non importa quante celle ci siano nella simulazione o quanti complicati siano gli stati, la super-regola garantisce che l'informazione nell'universo sia sempre completamente conservata – andando in avanti, esso mantiene "magicamente" al suo interno anche tutto il percorso che lo ho portato allo stato attuale 9 . Perché è importante questo fatto? Se il nostro punto di partenza è l'isomorfismo tra realtà e informazione, un ovvio desideratum del modello è la capacità di generare generalizzazioni fisiche vere (o quantomeno plausibili): la reversibilità a livello fondamentale delle leggi fisiche è dunque pienamente rispettata 10 .
La seconda caratteristica fondamentale della super-regola è che permette all'universo di comportarsi come una Macchina di Turing, ovvero di computare qualsiasi funzione computabile 11 . Ma cosa vuol dire che l'universo calcola i valori di una funzione? Ecco un altro aspetto fondamentale dell'isomorfismo, che esporremo con l'aiuto di un risultato di ricerca iLabs.
3.1 Computo ergo sum
L'immagine della computazione che tutti noi abbiamo in mente è ovviamente frutto della nostra esperienza con il PC (o della familiarità con il concetto di Macchina di Turing): dati di input ("2" e "4"), operatore ("+"), output ("6"). Discorso analogo per le funzioni di verità: se P e Q sono veri, P AND Q ha come risultato vero.
Tuttavia, quando si osserva il livello più fondamentale della realtà – le celle del nostro universo, ad esempio – ci si rende conto che è necessario ricondurre queste immagini astratte ad una precisa rappresentazione spaziale: ancora una volta, realtà e informazione. Così come l'informazione, anche la computazione, in un certo senso, sta nell'occhio di chi guarda: quello che possiamo interpretare come lo scontro tra "particelle" o lo spostamento di "cariche" o la distruzione di un pattern nello spazio-tempo, può anche essere visto come l'applicazione di un operatore logico. Consideriamo, come primo esempio, la seguente sequenza di istanti nel nostro universo:
Se consideriamo il bit in arrivo dall'alto come una "linea di controllo", un "attivatore" dell‟operatore, è semplice vedere come la configurazione spaziale corrisponda al calcolo dell'AND booleano: a t0 e con l'attivatore, i due bit (l'input) convergono verso la stessa cella; il risultato, a t2, è prodotto nelle direzioni di uscita – ciascun bit è ancora attivo, come deve essere 12 :
Ecco in che senso l'universo computa: a configurazioni iniziali corrispondono, dopo un certo numero di istanti, configurazioni finali che possono essere interpretate come il risultato di una computazione. A confermare la bontà della rappresentazione, ecco cosa succede nel caso 1 AND 0, ovvero quando uno dei due bit di input non è presente:
Anche in questo caso, il risultato a t2 è prodotto nelle direzioni di uscita dei bit – nessun bit attivo è presente, come deve essere:
Il procedimento può essere generalizzato a qualsiasi funzione computabile: sebbene non esista un metodo generale per sapere come computare di fatto una data funzione nell'universo, si può dimostrare che l'universo è in grado, in teoria, di rappresentare qualsiasi funzione computabile 13 .
Un altro significativo esempio di computazione "non-standard" è l'implementazione della "differenza" nel nostro universo: a t0 le celle attive rappresentano i due numeri in ingresso nella funzione, mentre a t1 inizia la computazione vera e propria.
Il risultato, pochi istanti successivi, è ovviamente rappresentato dalla “stringa” di celle attive centrali: 14
Concludiamo l'illustrazione dei principi base di computazione con una proposta per l'operatore "somma". Contando che "somma" e "differenza" sono due facce della stessa medaglia, intuitivamente ci aspettiamo che sia semplice costruire "somma" utilizzando le idee base dell'operatore definito in precedenza – ed infatti è così.
Se ricreiamo a t0 il pattern di bit presente a t6 nella simulazione precedente – ovviamente con le singole celle opportunamente e simmetricamente trasformate – cosa accade? Il risultato di "differenza" si congiunge all'input in t5, fino a risultare, correttamente, nella somma pochi istanti più tardi:
La simmetria tra gli operatori è dunque precisamente rispecchiata dalla simmetria nei pattern di bit, rendendo il risultato particolarmente elegante 15 .
Conclusione
Siamo partiti chiedendoci come si costruisce una mente e abbiamo finito con il costruire operatori nelle celle fondamentali di un universo bidimensionale. Un lungo viaggio, non c'è che dire, ma estremamente fruttuoso: è solo ripercorrendo in prima persona il percorso che ha portato alla Matematica dei Modelli di Riferimenti che è possibile coglierne in pieno la potenza rappresentativa – la tabella seguente 16 riepiloga di nuovo le analogie di cui ci siamo serviti.
Fisica | Computazione | Psicologia |
---|---|---|
Condizioni iniziali | Input | Informazioni sensoriali |
Leggi della dinamica | Algoritmi | Associazioni |
Evoluzione | Computazione | Pensiero |
Stato finale | Output | Comando motorio |
A differenza dei tentativi di modellazione precedenti, la nostra teoria prende estremamente sul serio la natura incarnata del pensiero e la rappresentazione dell'universo fisico: la versione tridimensionale – basata sul dodecaedro rombico – della nostra realtà è una prima proposta effettiva per fare il grande salto nella costruzione di intelligenze artificiali generali. Lunghe catene deduttive, sofisticate inferenze statistiche e tutti i metodi "classici" dell'I.A. hanno fallito, a nostro parere, per un semplice motivo: la vera conoscenza (la cosiddetta "comprensione del contesto") può nascere in un sistema solo se esso possiede, al proprio interno, un modello della realtà esterna che desidera conoscere e descrivere. È assegnando "etichette" al nostro modello del mondo che riusciamo a comunicare e capire quello che ci circonda – e sarà solo tramite un analogo processo di categorizzazione di "pattern salienti" che un computer potrà finalmente capire, associando stimoli esterni ad una propria rappresentazione della realtà. Anche se non siamo sicuri – e nessuno può esserlo – sulla reale forma dell'universo e sulle regole che lo governano, lo nostra proposta ha alcuni vantaggi notevoli: è già ad un elevato stadio di formalizzazione; è facile da implementare in un moderno PC; è concettualmente trasparente e filosoficamente fondata.
Come John McCarthy ben riassume nella citazione che apre questo intervento, se solo sapessimo come programmarli, i computer degli anni Settanta sarebbero davvero "sistemi intelligenti". Solo il futuro ci dirà in cosa la nostra Matematica dei Modelli di Riferimento riuscirà a trasformare i computer del Terzo Millennio.
Bibliografia
- Berto F., Rossi G., Tagliabue J., 2010, The Mathematics of the Models of Reference, College Publications (tr. it. La Matematica dei Modelli di Riferimento, 2010, Lampi di Stampa).
- Canonico A., Rossi G., 2007 Semi-Immortalità, Lampi di Stampa (tr. ing. liberamente disponibile in licenza CC sul sito www.semi-immortality.com)
- Fredkin E., 1990, "Digital Mechanics: an Informational Process Based on Reversible Universal Cellular Automata", Physica D(45):254-270.
- Ilachinski A., 2001, Cellular Automata, World Scientific Publishing.
- Rossi M., Tagliabue J., 2009, "Le Tre Maschere del Convenzionalismo", Rivista di Estetica (41).
- Wolfram S., 2002, A New Kind of Science, Wolfram Media.
Risorse Online
Note
- 1 Non siamo i soli ad utilizzare gli automi cellulari come modelli della realtà fisica. Riferimenti obbligati sono Wolfram (2002) e Friedkin (1990). Per iniziare, la voce di Wikipedia ha una sezione sull'argomento: Wikipedia - Cellular Automaton
- 2 Sebbene l'utilizzo di un modello discreto nello spazio e nel tempo comporti una serie di assunzioni fisiche non-standard, l'utilità del modello per l'I.A. – come spiegato nella conclusione – può essere in larga parte indipendente da questioni di fedeltà fisica. Inoltre, può essere interessante notare come esistano già molti casi in cui fenomeni continui vengono approssimati con soddisfazione utilizzando gli automi cellulari.
- 3 Ovviamente, il nostro universo è (almeno) tridimensionale: tuttavia, l'esposizione della teoria risulta più semplice in 2D. Torneremo al 3D nella parte conclusiva del lavoro, quando collegheremo i Modelli di Riferimento all'attuale implementazione di un'Intelligenza Artificiale generale.
- 4 In particolare, la prospettiva qui assunta è quella nota in filosofia come "convenzionalismo". Si veda ad es. Canonico, Rossi (2007) e Rossi, Tagliabue (2009).
- 5 In modo analogo, erano le nostre pratiche ad evidenziare le "particelle" nel primo universo considerato, senza che ci fosse realmente nessun movimento e nessuna persistenza. Ciononostante, la descrizione basata sulle "particelle" si è rivelata estremamente utile per interpretare i dati.
- 6 Per la definizione formale, si veda Canonico, Rossi (2007), pp. 110-111.
- 7 Come è ovvio, quello che la cella percepisce a t1 è il risultato dell'azione delle celle circostanti a t0.
- 8 Questo è il "big bang" per una particolare configurazione ribattezzata "stella", un pattern periodico di figure simmetriche generabile all'interno del nostro universo – nella figura, le celle di stato "000000" sono rappresentate come punti per ragioni estetiche. Le immagini e il software di simulazione sono liberamente disponibili sul sito dedicato alla Matematica dei Modelli di Riferimento, www.mmdr.it
- 9 Per una dimostrazione di questo fatto, si veda Berto, Rossi, Tagliabue (2010), pp. 43-44.
- 10 Ci sono interessanti considerazioni applicative sul legame tra conservazione di informazione e dispendio energetico nella computazione. Per una prima discussione, si veda Berto, Rossi, Tagliabue (2010), pp. 45-46.
- 11 Per la dimostrazione, si veda Berto, Rossi, Tagliabue (2010), pp. 46-56.
- 12 Come ovvio, il risultato della computazione è ridondante. Questa caratteristica è essenziale al mantenimento delle perfetta reversibilità dell'universo.
- 13 In realtà, l'universo iLabs supporta un formalismo ontologico e computazionale ben più ricco: a partire dalla super-regola si può infatti ricostruire tutta la teoria della ricorsività. Si veda Berto, Rossi, Tagliabue (2010), Cap. IV.
- 14 Come è facile controllare, tale rappresentazione si generalizza a qualsiasi coppia di interi.
- 15 Ovviamente, è possibile definire "differenza" e "somma" anche senza preservare a livello "fisico" la simmetria logica tra le due operazioni. Tuttavia questa rappresentazione ha il pregio di dare un metodo effettivo per ricostruire un'operazione dall'altra in questo particolare automa.
- 16 Cfr. Ilachinski (2001), p. 687.