Intelligenza artificiale… anche se non ce ne occupiamo, sarà lei a occuparsi di noi
Luglio 3, 2024
Tenetevi forte, oggi si parla di uomini: per qualche centimetro in più
Luglio 3, 2024
Mostra tutto

Nota sui meccanismi dell’Intelligenza Artificiale di Franco Graziani

In seguito alla presentazione sull’argomento da parte di Marianna Bergamaschi Ganapini il 23/5/24 ho pensato potesse essere utile avere un’idea un po’ più dettagliata di quali siano i meccanismi dei programmi che implementano questa tecnologia attualmente disponibili su internet.

Il più noto, ChatGPT, già dal nome ci dice qualcosa, fa infatti riferimento alla modalità interattiva, Chat, con la quale possiamo interagire ponendo domande e ricevendo risposte.

GPT sta per Generative Pretrained Transformer, significa che la tecnologia utilizzata si basa sui Transformer generativi preaddestrati. I transfomer sono un modello di programma (algoritmo se preferite) che è stato proposto nel 2017 da un gruppo di specialisti di Google con un articolo dal nome fascinoso “Attention is all you need” (Vaswani et al.).

Il punto fondamentale del meccanismo di attention risiede nel fatto che permette ad un programma di interpretare (tradurre) correttamente un linguaggio contestuale cioè un linguaggio in cui i termini (token nell’accezione di questa tecnologia) hanno un significato non univoco ma determinato dal contesto della frase e dell’argomento in cui è inserito il termine.
Il problema è vecchio come l’uomo dal momento in cui ha sviluppato il linguaggio e arcinoto ai traduttori professionisti e non.
Basti pensare al problema dei falsi amici e non solo.
I linguaggi non contestuali sono invece quelli in cui ogni termine ha un solo significato: tutti i linguaggi di programmazione appartengono a questa categoria.

Vi propongo due testi che potete trovare in rete i cui link sono i seguenti:

1. https://medium.com/@amanatulla1606/transformer-architecture-explained-2c49e2257b4c
2. https://medium.com/@amanatulla1606/the-attention-mechanism-797e51c45d46

Il primo è una descrizione generale sulla struttura di un programma di IA basato sui transformer, il secondo permette di entrare più nel dettaglio del meccanismo di attention: mi sembra interessante avere un’idea della struttura matematica e delle operazioni di preparazione dei dati di input che permettono di passare dal linguaggio composto di parole alla sua rappresentazione puramente numerica adatta alla manipolazione da parte di un programma che opera su un computer. Tanto per sfatare l’aura di magia che avvolge di frequente l’IA e facilmente trasmette aspettative esagerate e timori.

Riguardo alla preparazione dei dati, cioè le fasi di tokenization – embedding – positional encoding, faccio notare che l’attività di pretrainig (e di post training) si basa sulla disponibilità delle banche dati esistenti su Internet.

Il paradigma della traduzione rappresenta, oltre alla funzione strettamente correlata al linguaggio naturale, un problema che può essere facilmente esteso a molti altri campi dell’azione umana.

Le applicazioni dell’IA si stanno sviluppando molto rapidamente e in modo molto pervasivo interessando campi che possono avere un impatto diretto sulla nostra vita: dalla guida autonoma delle automobili ai sistemi di cura e diagnosi in ambito sanitario, per non parlare di gestione dei teatri militari, l’IA da combattimento.

Si pone quindi un problema di gestione e controllo di questi automi che vivono e agiscono con noi e per noi. L’UE è stato il primo ente nazionale e sovranazionale a proporre un quadro normativo e legislativo nel quale sviluppare l’insieme delle tecnologie riguardanti l’IA.
Molti sono gli aspetti che coinvolgono l’IA, non ultimo, come per il cambiamento climatico, lo statuto dei contratti assicurativi. Magari bisognerà dotare i prodotti che fanno uso di tecnologie di IA di scatole nere.

1 N. Chomsky & G. A. Miller, Finite state languages. Information and control, 1958
2 Crawford, Kate, Né intelligente né artificiale, Bologna, Il Mulino, 2021

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *