Riprogrammare lโ€™etica: lโ€™hacker mindset nellโ€™era dellโ€™AI

Ci sono libri che segnano, altri che ispirano, altri ancora che mettono in discussione le fondamenta di ciรฒ che sei. Per me “L’etica hacker” (2001) di Pekka Himanen ha rappresentato qualcosa che va oltre: un compagno silenzioso che ha orientato, negli anni, scelte, approcci, e un certo modo di guardare al lavoro, alla tecnologia, alla collaborazione. Non รจ stato solo un testo: รจ stato un cambio di mindset.

Quando lo lessi la prima volta, ormai piรน di vent’anni fa, non era solo la storia di una controcultura nata nei laboratori del MIT o nelle stanze dei pionieri dellโ€™open source. Era la dimostrazione concreta che si poteva lavorare per passione, condividere senza calcoli, apprendere per curiositร , innovare senza chiedere il permesso.

E soprattutto, era possibile costruire un mondo digitale piรน aperto, umano e meritocratico.

Negli anni, questo spirito รจ diventato parte del mio modo di pensare e di agire. L’ho portato nei progetti, nelle aziende, nelle lezioni in aula. L’ho trasmesso ai miei team, ai collaboratori, agli studenti. E ancora oggi รจ un riferimento che ritorna, soprattutto in un momento in cui l’intelligenza artificiale sta ridefinendo profondamente l’equilibrio tra uomo e macchina, tra creativitร  e automazione, tra responsabilitร  e delega.

Qualche giorno fa, parlando di competenze nell’era dell’AI, durante l’evento di iKairos โ€ข Mentoring ed economia sociale, ho affermato che il manifesto dell’etica hacker, nella sua visione originaria, puรฒ e deve essere rivisto alla luce delle sfide odierne. Perchรฉ i principi che lo sostenevano non sono invecchiati. Anzi. Hanno solo bisogno di un nuovo contesto in cui esprimersi. E forse dovrebbe diventare manifesto alla base di alcuni insegnamenti.

L’etica hacker nasce negli anni ’60 e ’70 come espressione di una nuova cultura emergente attorno al mondo dei computer. Nei laboratori del MIT e tra le community dei primi sviluppatori si forma un modo radicalmente diverso di concepire il lavoro, il sapere, la collaborazione. Il termine “hacker”, prima ancora di essere associato a intrusioni informatiche, definisce una figura che smonta, esplora, migliora, condivide.

L’hacker, quello vero, รจ un artigiano del codice mosso da passione, non da tornaconto. Uno spirito libero che rifiuta lโ€™autoritarismo, le regole imposte, le gerarchie chiuse.

Nel 2001, Pekka Himanen raccoglie quellโ€™ereditร  e la organizza in un sistema valoriale. Il suo libro รจ una vera e propria dichiarazione di indipendenza culturale rispetto allโ€™etica protestante del lavoro, fatta di sacrificio, dovere, e produttivitร .

Lโ€™etica hacker, al contrario, si fonda su passione, creativitร , libertร , condivisione. Il lavoro รจ vissuto come gioco esplorativo. Lโ€™accesso alla conoscenza รจ un diritto. Il merito รจ superiore al titolo. La tecnologia non รจ solo strumento: รจ terreno di espressione personale e collettiva.

Questa visione ha contaminato generazioni di innovatori. Ha ispirato il movimento open source, lโ€™idea stessa di community digitale, il pensiero meritocratico nelle organizzazioni fluide. Ma soprattutto ha lasciato una traccia culturale che oggi, nellโ€™era dellโ€™Intelligenza Artificiale, puรฒ essere riattivata come codice sorgente per leggere un futuro che si complica.

Viviamo un tempo in cui le macchine non sono piรน solo strumenti, ma soggetti conversazionali, agenti autonomi, creatori di contenuti. Lโ€™intelligenza artificiale si insinua nei processi creativi, nelle relazioni, nella formazione. Ridefinisce i ruoli, accelera le scelte, amplia (o restringe) lโ€™accesso alle opportunitร . I principi dellโ€™etica hacker, ne sono convinto, possono essere riletti come una grammatica di riferimento per orientarsi.

Per questo ho ripreso il Manifesto originale, e lโ€™ho riscritto alla luce del 2025, cercando di coglierne la continuitร  e la trasformazione.

Oggi, nella convergenza tra AI e creativitร , la visione hacker trova una nuova casa.

Non รจ lโ€™AI che minaccia lโ€™arte, รจ la sua adozione inconsapevole. La sfida non รจ resistere allโ€™automazione, ma integrarla in modo critico, curioso, anche ironico dove necessario. Come farebbe un hacker davanti a una macchina nuova: la smonta, la esplora, la spinge oltre i limiti. E magari la usa per disegnare qualcosa che prima non era possibile.

Oggi un artista รจ anche chi addestra un modello generativo sul proprio stile. Chi sperimenta prompt per generare variazioni visive, musicali, testuali. Chi ibrida. Chi contamina. Lโ€™hacker di oggi non รจ solo un coder: รจ un “creatore aumentato”, che gioca con i linguaggi della macchina per raccontare cose che prima non aveva voce per dire.

Nellโ€™educazione, questa visione suggerisce un ribaltamento radicale. Non si tratta di proteggere la scuola dallโ€™AI, ma di ripensare la scuola con lโ€™AI come laboratorio permanente.Lโ€™apprendimento non รจ trasmissione passiva, ma esplorazione.

Unโ€™aula hacker รจ un luogo dove si smontano algoritmi, si analizzano bias, si creano strumenti. Dove si insegna a usare lโ€™AI per creare valore, non per copiarlo. Dove gli studenti non sono utenti, ma sperimentatori. E i docenti, non trasmettitori, ma facilitatori di senso.

In questo senso, formare nuove competenze non รจ solo una questione tecnica. รˆ culturale. Significa coltivare la capacitร  di porre domande nuove. Di interpretare modelli. Di saper leggere un output generato da una macchina e chiedersi: perchรฉ ha risposto cosรฌ? Quali dati ha usato? Cosa manca?

Anche nelle relazioni umane, lโ€™etica hacker ha qualcosa da dire. In unโ€™epoca in cui chatbot apparentemente empatici, avatar conversazionali e interfacce simulate creano nuove forme di interazione, lโ€™hacker ethic suggerisce di mantenere luciditร . Non demonizzare la tecnologia, ma comprenderne la natura. Non rifiutare la relazione mediata, ma riconoscerne i limiti. Lโ€™empatia non รจ solo output simulato, รจ ascolto attivo, รจ vulnerabilitร  reale. E questo รจ ancora umano.

Nel lavoro e nelle organizzazioni, lโ€™approccio hacker si traduce in apertura, sperimentazione, decentralizzazione. Una leadership che sa condividere processi, coinvolgere team nel co-design di strumenti intelligenti, responsabilizzare sullโ€™uso dellโ€™AI. Non si tratta di temere lโ€™automazione, ma di scegliere cosa automatizzare e cosa proteggere. Di disegnare processi che valorizzino lโ€™iniziativa, non la deresponsabilizzazione.

Lโ€™organizzazione hacker non รจ una rete caotica: รจ una comunitร  di scopo, dove ogni nodo ha autonomia e interconnessione: lโ€™adozione dellโ€™AI puรฒ diventare un driver di empowerment distribuito, se accompagnata da trasparenza, documentazione condivisa, strumenti formativi aperti.

E poi ci sono loro: gli hacker di domani.

Non saranno sviluppatori. Saranno artisti, insegnanti, ricercatori, imprenditori. Persone capaci di leggere la tecnologia non come un fine, ma come un mezzo. Persone che sapranno dove mettere le mani, ma soprattutto perchรฉ mettercele. Non solo skill, ma mindset.

Saranno quelli che useranno lโ€™AI per risolvere problemi, ma anche per porre domande nuove. Che non cercheranno scorciatoie, ma nuove strade. Che non si accontenteranno dellโ€™efficienza, ma andranno in cerca del senso.

Ecco perchรฉ oggi, piรน che mai, serve riconsiderare lโ€™etica hacker. Non per nostalgia, ma per visione.

Perchรฉ se lโ€™AI รจ il fuoco della nostra epoca, come dicevo in una riflessione di ieri, qualcuno deve insegnare come usarlo. E come non bruciarsi.

LLAMA 2: Rivoluzione Open Source nell’Intelligenza Artificiale Generativa

Con l’annuncio di Meta che rende disponibile il codice sorgente di LLaMA 2, il campo dell’intelligenza artificiale generativa (GenAI) รจ testimone di un punto di svolta significativo a mio avviso, e forse, considerato che non ne ho visto scrivere molto, anche sottovalutato. Questa decisione democratizza l’accesso a uno dei modelli di linguaggio piรน avanzati, offrendo a sviluppatori, ricercatori e appassionati di tecnologia di tutto il mondo la possibilitร  di esplorare e innovare liberamente. LLaMA 2 si distingue per la sua profonda capacitร  di comprensione e generazione del linguaggio umano, rivaleggiando e in alcuni casi superando modelli ben noti come GPT-3.5 e GPT-4 di OpenAI.

Cos’รจ LLaMA 2

LLaMA 2 rappresenta una soluzione all’avanguardia nella GenAI, sviluppata con tecniche di apprendimento di ultima generazione. Il modello รจ progettato per imitare il modo in cui gli esseri umani comunicano, offrendo capacitร  di generazione e comprensione del testo che trovano applicazione in una vasta gamma di contesti, dalla costruzione di chatbot avanzati alla creazione di contenuti testuali per assistenza nella scrittura e risposta automatica, banalmente alle email.

LLaMA 2: Una Risorsa Preziosa

Rilasciato con i pesi del modello e il codice per facilitare l’addestramento e il fine-tuning, LLaMA 2 รจ addestrato su un corpus di 2 trilioni di token, garantendo una comprensione e una capacitร  generativa particolarmente significativa. La sua superioritร  nei benchmark esterni lo rende una risorsa per chi oggi รจ al lavoro nell’AI generativa, stimolando l’innovazione e promuovendo lo sviluppo di applicazioni sempre piรน sofisticate e responsabili.

Innovazione Aperta e Crescita nel Campo dell’AI Generativa

L’iniziativa di Meta di rendere LLaMA 2 liberamente accessibile รจ emblematico di un impegno verso l’innovazione aperta, consentendo una collaborazione nel campo dell’AI alla community di accademici, sviluppatori, progettisti e aziende. Questo approccio non solo accelera il progresso tecnologico ma incoraggia anche una riflessione critica sull’uso responsabile dell’AI, con Meta che fornisce linee guida per gli sviluppatori e iniziative di collaborazione per gli accademici.

Genesi e Sviluppo di LLAMA

Il percorso di LLAMA inizia รจ stato avviato da menti di OpenAI e Meta, unite non troppo tempo fa per fare vita ad una nuova direzione nell’intelligenza artificiale. Nata nel 2022, LLAMA รจ il frutto di un’ambizione condivisa: rivoluzionare il modo in cui interagiamo con l’informazione digitale, sfruttando le potenzialitร  dell’AI per superare i limiti dei tradizionali motori di ricerca e dei chatbot. La sua creazione segna un punto di svolta, rappresentando un salto qualitativo verso un’interazione piรน naturale, intuitiva e produttiva tra l’utente e la macchina.

La visione alla base di LLAMA รจ chiara: rendere l’accesso all’informazione non solo universalmente disponibile ma anche intrinsecamente piรน significativo. Questo obiettivo ambizioso si concretizza attraverso l’implementazione di tecnologie all’avanguardia in apprendimento automatico e elaborazione del linguaggio naturale (NLP), permettendo a LLAMA di comprendere e rispondere alle query degli utenti in modi che vanno oltre la semplice restituzione di dati. La piattaforma si distingue per la sua capacitร  di analizzare il contesto delle domande, offrendo risposte mirate che riflettono una comprensione profonda non solo del testo della query ma anche delle intenzioni e delle esigenze informative dell’utente.

Sviluppato con un occhio rivolto al futuro, LLAMA simboleggia a mio avviso un’impegno verso l’innovazione continua. Attraverso cicli iterativi di apprendimento e miglioramento, il modello si adatta e evolve, anticipando e rispondendo alle mutevoli dinamiche del digitale e alle crescenti aspettative degli utenti.

LLAMA-2 caratteristiche ed architettura

LLAMA-2 รจ uno dei progressi piรน significativi nell’ambito dell’IA dall’epoca di pionieri come AlexNet e i lavori fondamentali sui Transformer e una delle piรน complete architetture di grandi reti neurali per l’intelligenza generativa (GenAI). Rilasciato da Meta con una licenza aperta sia per scopi di ricerca che commerciali, LLAMA-2 non รจ semplicemente un altro modello nel vasto mare dell’AI, ma un balzo in avanti nell’innovazione aperta, segnando un punto di svolta per Meta nel contributo all’innovazione aperta in AI.

La struttura di LLAMA-2, dettagliata in un documento di 77 pagine, fornisce una panoramica esaustiva che permette ai data scientist di ricreare e personalizzare i modelli per i propri dataset. Con un addestramento su 2 trilioni di token, LLAMA-2 supera tutti i benchmark open source di un ampio margine e si colloca al livello di performance di GPT-3.5 nelle valutazioni umane. La novitร  piรน significativa risiede nel suo miglioramento rispetto all’architettura di OpenAI, in particolare nel bilanciamento tra sicurezza e utilitร , dove le prestazioni del modello non degradano man mano che diventa piรน sicuro.

LLAMA-2 introduce avanzamenti notevoli come l’attenzione per query di gruppo (Grouper query attention), l’attenzione fantasma (Ghost Attention), il ridimensionamento della temperatura in contesto (In-Context Temperature re-scaling) e la percezione temporale (Temporal Perception). Queste innovazioni, insieme alla disponibilitร  su piattaforme come HuggingFace, WatsonX e Azure, facilitano l’adozione del modello, riducendo i costi e le barriere all’entrata. Ora รจ possibile personalizzare un modello LLM di 70B su una singola GPU, una possibilitร  inimmaginabile solo sei mesi fa.

LLAMA-2 รจ presente in varianti da 7B, 13B e 70B parametri, inclusa una versione istruita specificamente per chat, denominata LLaMA-Chat, nelle stesse tre dimensioni. Rispetto ai modelli Llama-1 precedenti, LLAMA-2 si distingue per i termini di licenza, un aumento del 40% della dimensione del corpus di preaddestramento, il raddoppio della lunghezza del contesto del modello a 4K, e l’adozione dell’attenzione per query di gruppo per la variante da 70B. L’aspetto piรน impattante รจ il nuovo approccio alla sicurezza con modelli di ricompensa per la Sicurezza e l’Utilitร , che supera la maggior parte degli altri modelli nelle valutazioni umane.

L’addestramento di LLAMA-2 si basa sull’uso dell’algoritmo di codifica bytepair (BPE), applicando l’architettura transformer standard con pre-normalizzazione usando RMSNorm, la funzione di attivazione SwiGLU e l’incorporamento posizionale rotativo. I dettagli includono l’uso dell’ottimizzatore AdamW con una programmazione del tasso di apprendimento di tipo coseno, un riscaldamento di 2000 passaggi e la decadenza del tasso di apprendimento finale al 10% del picco. Il modello ha dimostrato eccellenti prestazioni in varie attivitร , come la codifica, le Q&A in contesto, il ragionamento di senso comune e le valutazioni di conoscenza.

La personalizzazione del modello utilizza tecniche di fine-tuning supervisionato (SFT) e apprendimento rinforzato con feedback umano (RLHF), partendo da dati di istruzione tuning disponibili pubblicamente e annotando circa 27.540 istanze con un forte focus sulla qualitร  dei dati. L’approccio al fine-tuning e il modello di ricompensa mirano a bilanciare efficacemente sicurezza e utilitร , superando la tradizionale compensazione tra questi due aspetti e spingendo LLAMA-2 a diventare un punto di riferimento per l’adozione sicura delle LLM in ambito aziendale.

Come funziona LLAMA-2

Il processo attraverso il quale LLAMA-2 viene addestrato, affinato e raffinato utilizza tecniche all’avanguardia di fine-tuning supervisionato (SFT) e di apprendimento rinforzato con feedback umano (RLHF), stabilendo nuovi standard per la personalizzazione e l’efficienza dei grandi modelli linguistici (LLM). Questo approccio multifase non solo permette a LLAMA-2 di eccellere in compiti diversificati, come la codifica, le Q&A in contesto, il ragionamento di senso comune e le valutazioni di conoscenza, ma lo rende anche uno strumento prezioso per applicazioni aziendali grazie alla sua maggiore sicurezza e utilitร .

Durante la fase di SFT, LLAMA-2 viene inizialmente addestrato su un set di dati di istruzione pubblicamente disponibili, arricchito da una minuziosa annotazione di circa 27.540 istanze con un’enfasi sulla qualitร . Questo processo sfrutta un programma di apprendimento rateale di tipo coseno, iniziando con un tasso di apprendimento di 2*10^-5 e impiegando un decadimento del peso di 0.1, una dimensione del batch di 64 e una lunghezza di sequenza di 4096 token, ottimizzando il modello attraverso 2 epoche. L’obiettivo di addestramento segue un approccio auto-regressivo, dove la perdita sui token del prompt dell’utente viene annullata e la back-propagation viene eseguita solo sui token di risposta.

Nella fase RLHF, la raccolta dei dati umani viene eseguita seguendo una procedura specifica: gli annotatori creano un prompt e valutano due risposte generate dal modello in base a criteri stabiliti, assicurando una diversitร  migliorata. Questi dati, categorizzati lungo le dimensioni della sicurezza e dell’utilitร , fungono da base per il Modello di Ricompensa, che valuta le risposte del modello e il prompt corrispondente, producendo un punteggio scalare che indica la qualitร  dell’output generato.

L’innovazione piรน rilevante introdotta da LLAMA-2 รจ la sua capacitร  di superare il compromesso comunemente osservato tra sicurezza e utilitร , ottenendo prestazioni superiori in entrambi i criteri. Per raggiungere questo obiettivo, Meta ha addestrato due modelli di ricompensa distinti: uno ottimizzato per l’utilitร , denominato Helpfulness RM, e un altro per la sicurezza, denominato Safety RM. Questi modelli utilizzano la stessa architettura e gli stessi iperparametri dei modelli di linguaggio preaddestrati, eccetto per la testa di classificazione per la previsione del prossimo token, che viene sostituita con una testa di regressione per generare la ricompensa scalare.

La formazione del modello di ricompensa si avvale di dati di preferenza umana strutturati in un formato di etichetta di classificazione binaria, dove le risposte vengono categorizzate come scelte e rifiutate, garantendo che la risposta scelta riceva sempre un punteggio superiore rispetto alla sua controparte. Questo processo di addestramento, insieme all’innovativo approccio al fine-tuning e alla capacitร  di LLAMA-2 di bilanciare efficacemente sicurezza e utilitร , posiziona il modello come un punto di riferimento per l’adozione sicura e produttiva delle LLM in ambito aziendale e oltre.

Unicitร  di LLAMA nel Panorama AI

Il rilascio di LLAMA-2 segna un cambiamento epocale nel campo dell’intelligenza artificiale, posizionandosi come un catalizzatore per l’innovazione aperta. La decisione di Meta di offrire LLAMA-2 con una licenza aperta, sebbene non esattamente “open source” nel senso tradizionale, sottolinea un impegno verso la democratizzazione dell’accesso alle tecnologie AI avanzate. Questo approccio, che promuove la condivisione di conoscenze e risorse, rappresenta un invito alla comunitร  globale di ricercatori e sviluppatori a collaborare, innovare e spingere ulteriormente i confini di ciรฒ che l’intelligenza artificiale puรฒ realizzare.

Il modello LLAMA-2, con la sua architettura avanzata e le sue capacitร  di elaborazione del linguaggio naturale, รจ stato addestrato su un corpus di 2 trilioni di token, battendo i benchmark open source di un ampio margine e avvicinandosi alle prestazioni di GPT-3.5 nelle valutazioni umane. Questo risultato non รจ solo una testimonianza della potenza computazionale di LLAMA-2 ma anche della sua efficacia nell’interpretare e rispondere a una vasta gamma di query in modo contestualmente pertinente e sicuro.

LLAMA-2 rappresenta, quindi, non solo un traguardo tecnologico ma anche un invito alla collaborazione e alla condivisione delle conoscenze nel campo dell’IA. Il suo impatto sull’innovazione aperta e la ricerca collaborativa promette di accelerare ulteriormente lo sviluppo di soluzioni AI che sono sia potenti che responsabili, guidando la trasformazione digitale in maniera etica e sostenibile.

Comparazione e contesto di utilizzo

Nel contesto dell’evoluzione rapida dell’intelligenza artificiale, il confronto tra LLAMA 2, GPT-3.5 e GPT-4 rivela differenze fondamentali che influenzano la scelta del modello piรน adatto a specifici progetti. LLAMA 2 emerge come una soluzione economica e efficiente, particolarmente vantaggiosa per compiti che richiedono risposte in tempo reale e un alto grado di accuratezza, come la sintesi di notizie e l’individuazione di incongruenze factuali. La sua natura open-source favorisce una trasparenza e una personalizzazione che possono essere particolarmente attraenti per chi cerca un controllo maggiore sulle capacitร  e sull’implementazione del modello.

D’altro canto, GPT-3.5 e GPT-4, con le loro architetture piรน complesse e una capacitร  di contestualizzazione e di elaborazione di dati multimodali (nel caso di GPT-4), si posizionano come soluzioni ideali per compiti che richiedono una profonda comprensione del contesto o la gestione di una grande quantitร  di conoscenza. GPT-4, in particolare, con la sua capacitร  multimodale, offre possibilitร  uniche nel trattamento e nella generazione di testo, immagini e altri tipi di dati, rendendolo ineguagliabile per applicazioni che beneficiano di questa versatilitร .

Per lo sviluppo di chatbot e la creazione di contenuti, la scelta tra questi modelli dipende dall’equilibrio tra costi, complessitร  del progetto e aspettative di performance. LLAMA 2 si rivela un’opzione versatile e aperta per le piccole imprese e progetti che valorizzano la personalizzazione e l’efficienza. GPT-3.5 colpisce per la sua capacitร  di gestire conversazioni complesse e supporto linguistico ampio, rendendolo adatto a imprese che operano su scala globale. GPT-4, infine, si distingue per la sua abilitร  nel risolvere problemi avanzati e nel mantenere un alto livello di professionalitร  e creativitร  nella risoluzione dei problemi, stabilendosi come la scelta preferibile per applicazioni critiche e per chi desidera minimizzare l’intervento umano nella generazione di contenuti.

La decisione su quale modello adottare dovrebbe quindi basarsi su una valutazione attenta delle specifiche esigenze del progetto, considerando fattori come il budget, la natura delle attivitร  da svolgere e il livello di qualitร  richiesto. La comprensione delle forze e dei limiti di ciascun modello รจ essenziale per sfruttare al meglio le potenzialitร  dell’IA e innovare efficacemente nel proprio campo di applicazione.