LocalAI: la guida per costruire un ecosistema di AI privata, dagli LLM agli agenti con memoria

Per mesi ho visto ripetersi la stessa scena: entusiasmo enorme sull’AI generativa, proof-of-concept ovunque, e poi, quando arriva il momento di portare l’AI dentro processi reali, una domanda che taglia corto: “Dove vivono i dati?”. Subito dopo ne arriva un’altra: “Quanto ci costerà davvero?”. E subito dopo la terza: “Cosa succede se domani cambia un pricing, un accesso, una policy, un modello?”.

È da questa triade (dati, costi, dipendenza) che nasce l’idea della guida su LocalAI. Non come esercizio tecnico, ma come scelta di architettura. E, in fondo, come scelta culturale: riportare l’intelligenza sotto il controllo di chi la usa.

Guida completa a LocalAI, LocalAGI e LocalRecall” è pensata per costruire un ecosistema di Intelligenza Artificiale privato su hardware consumer: dal server di inferenza agli agenti autonomi, passando per la memoria. Ho provato a scrivere la risorsa che avrei voluto avere io: un percorso unico, pratico, con un filo logico, capace di trasformare pezzi sparsi in una stack coerente.

Il punto di partenza è LocalAI: un server di inferenza che espone API compatibili con OpenAI e permette di eseguire modelli (testo, immagini, audio, embeddings) sul proprio hardware. La compatibilità non è un dettaglio: significa poter “sganciare” un’app dal cloud e reindirizzarla in locale con modifiche minime.

Ma un sistema utile non è solo un modello che risponde. Serve memoria, serve contesto, serve recupero delle informazioni, serve continuità. Per questo la guida si estende a LocalRecall: lo strato di memoria che implementa RAG (retrieval-augmented generation), cioè la capacità di interrogare una base di conoscenza esterna e alimentare il modello con informazioni pertinenti, riducendo errori e allucinazioni e aumentando la qualità delle risposte.

E poi c’è l’ultimo salto: dagli LLM agli agenti. Qui entra LocalAGI, pensato per creare e orchestrare agenti autonomi (anche in modalità no-code/low-code), collegandoli al “cervello” (LocalAI) e alla “memoria” (LocalRecall). Quando questa triade funziona, non stai più giocando con una chat: stai costruendo un sistema capace di fare piani, eseguire task, usare strumenti, ricordare, migliorare.

La struttura del libro riflette questa progressione, perché l’AI locale non è un singolo componente: è un’architettura. Nella prima parte si costruiscono le fondamenta (installazione, modelli, backend, funzionalità principali e ottimizzazioni, con attenzione alla sicurezza). Nella seconda si costruisce la memoria (LocalRecall e le scelte di storage, dalla semplicità alla scalabilità). Nella terza si costruisce l’intelligenza attiva (LocalAGI e la logica agentica). E nella quarta si scende su casi d’uso e appendici operative.

Un aspetto che ho voluto rendere esplicito è che “locale” non significa “romantico”. Significa pragmatico:

  • Privacy: i dati non devono lasciare la macchina, quando non è necessario.
  • Costi: sposti spesa da OPEX variabile (token) a CAPEX + energia, rendendo il budget più prevedibile.
  • Personalizzazione: puoi scegliere modelli, configurazioni, pipeline, senza vendor lock-in.
  • Resilienza: puoi far funzionare parti del sistema anche offline o in rete chiusa.

E poi c’è una parola che spesso manca nel dibattito: responsabilità. Avere controllo significa anche doversi occupare di sicurezza: proteggere endpoint, chiavi, accessi, permessi, logging. La guida insiste su questo perché l’AI locale non è “auto-magicamente” sicura: è solo più governabile, se la governi.

Per chi è questa guida?

Per chi sviluppa e vuole un’alternativa seria al cloud. Per chi fa IT e deve ragionare su TCO e compliance. Per chi costruisce prodotti e vuole embedded AI senza consegnare tutto a terzi. Ma anche per chi, semplicemente, vuole capire la stack: cosa sono i backend di inferenza, perché esistono gli embeddings, come si fa RAG, come si orchestrano agenti, e quali trade-off stai accettando quando dici “usiamo un LLM”.

Nella Nota dell’Autore ho scritto una cosa che per me è centrale: questi strumenti non sono solo strumenti tecnici. Rappresentano una filosofia, accessibilità, trasparenza, controllo, e un invito a contribuire a un ecosistema open-source che sta accelerando a vista d’occhio. La guida è un punto di partenza, non un punto di arrivo. Ma è il punto di partenza che mancava: chiaro, pratico, completo.

OpenClaw: la guida per costruire un assistente AI personale che agisce (e non solo risponde)

C’è un equivoco diffuso sull’AI: pensiamo che il suo destino naturale sia conversare. In realtà, la conversazione è solo l’interfaccia più comoda per comandare qualcosa. Il salto vero arriva quando quel “qualcosa” può agire: cercare, compilare, scrivere, organizzare, verificare, iterare. È il momento in cui smetti di chiedere “spiegami” e inizi a dire “fallo”.

OpenClaw si colloca esattamente lì: non un chatbot, ma un assistente personale agentico progettato per eseguire task complessi interagendo con sistema operativo, browser e applicazioni. La guida nasce per raccontare questa differenza senza hype: cosa è, come funziona, come si installa, e soprattutto come si rende sicuro.

Uno dei punti che chiarisco subito è la filosofia: OpenClaw non è un’interfaccia conversazionale fine a sé stessa. È un motore di automazione controllato dal linguaggio naturale. Quando gli scrivi, non ti aspetti solo testo, ma un’azione concreta: creare file, cercare informazioni, modificare documenti, inviare messaggi, completare workflow. Questo cambia completamente sia il potenziale, sia i rischi.

Per orientarsi, serve un modello mentale chiaro dell’architettura. Per questo la guida parte dai componenti fondamentali:

  • Gateway: il cuore del sistema, orchestrazione e sessioni.
  • CLI: lo strumento di gestione e diagnostica.
  • Nodi: estensioni per distribuire capacità su più macchine (es. un nodo macOS per iMessage).
  • Skills: istruzioni in formato SKILL.md per estendere capacità senza dover “hardcodare” tutto.

Questa modularità è il motivo per cui OpenClaw può diventare “il tuo” assistente, non “un” assistente generico: scegli cosa installare, quali canali attivare, quali skill concedere, quali permessi dare. E qui arriviamo alla parte più importante della guida: la sicurezza.

Un agente che può toccare file system, browser, email e credenziali non è neutro. È potenzialmente pericoloso, anche se non c’è nessuna intenzione malevola. Basta un prompt sbagliato, una configurazione permissiva, una skill non verificata, o un attacco di prompt injection, per creare danni reali. Per questo dedico un capitolo al threat model e a un principio che considero non negoziabile: “Access Control Before Intelligence”. Prima i confini, poi i superpoteri.

La guida include checklist e pratiche concrete: isolamento (hardware dedicato o virtualizzazione), permessi minimi sul file system, policy di allowlist per chi può contattare l’agente, prudenza nell’installazione di skills di terze parti, profili browser dedicati, audit periodici. L’obiettivo è rendere l’automazione sostenibile, non rischiosa.

Poi c’è il tema deployment: un assistente personale ha senso se è affidabile e sempre disponibile, ma anche se è coerente con le tue esigenze.

Per questo confronto tre opzioni pratiche:

  1. Mac Mini: ottimo per prestazioni/consumi e, soprattutto, per integrazioni Apple (quando servono).
  2. Raspberry Pi 5: entry-level, low cost, sempre acceso, perfetto per sperimentare con impatto energetico minimo.
  3. VPS in cloud: massima accessibilità e scalabilità, ma richiede disciplina di sicurezza (non esporre porte “nude”, usare tunnel/VPN/reverse proxy).

Una volta installato, arriva la parte “da vita reale”: collegare canali di messaggistica, scegliere modelli LLM, gestire fallback, e costruire un set di skills utile per il proprio lavoro. Qui la guida prova a essere concreta: mostra logiche, policy di accesso, e pattern d’uso (non solo teoria).

E soprattutto scende su casi d’uso. Non “demo da conferenza”, ma esempi che rispecchiano il lavoro quotidiano: ricerca strutturata e sintesi in un file, debugging su codice e log, pianificazione e verifica, monitoraggio e alerting, gestione documentale e riassunti. L’idea è far vedere come ragiona un agente: obiettivo, piano, azione, osservazione, correzione.

Chiudo con un messaggio semplice: OpenClaw è un punto di svolta perché sposta l’AI dalla risposta all’azione. Ma ogni svolta richiede consapevolezza. La guida è pensata per farti ottenere il massimo dal paradigma agentico senza perdere di vista ciò che conta: confini, audit, responsabilità. Perché un assistente personale che agisce è utile solo se resta al tuo servizio, non se diventa una nuova superficie di rischio.

Pelle Digitale: quando il mondo diventa interfaccia e l’intelligenza diventa ambiente

Ci sono libri che nascono per spiegare una tecnologia. “Pelle Digitale” pubblicato con EGEA nasce per spiegare una condizione. Una nuova condizione dell’umano, che non riguarda solo chi “lavora nel tech”, ma chiunque viva in un ambiente sempre più intelligente, sensorizzato e predittivo.

L’idea centrale è questa: stiamo entrando in un’era in cui l’intelligenza smette di essere un software che consultiamo e diventa un’atmosfera che respiriamo. Un’infrastruttura invisibile che collega sensori IoT, edge device, algoritmi e modelli in una rete globale. I dati diventano impulsi. Gli oggetti smettono di essere “cose” separate e diventano organi di un ecosistema più grande.

In apertura del libro parlo di transizione profonda: non un upgrade, ma un cambio di paradigma. La tecnologia non si sovrappone più al mondo: si radica nel mondo. Lo spazio diventa interfaccia. L’esperienza diventa persistente e contestuale. La relazione tra fisico e digitale non è più una “connessione”: è una dissoluzione del confine.

Il catalizzatore di questa metamorfosi ha un nome chiave: spatial computing. Non è “solo” AR/VR. È un principio operativo che rende ogni luogo un potenziale punto di accesso: casa, città, oggetti, corpo. È la trasformazione della realtà in un layer interpretato, aumentato e governato da modelli. E quando la realtà diventa un layer, la domanda non è più “quale app userò?”, ma “quale realtà sto abitando?”.

Per raccontare questa trasformazione ho scelto una struttura in otto pilastri, perché lo shift non è monodimensionale: è simultaneo e sistemico. Questi sono i capitoli del viaggio:

  1. L’intelligenza invisibile: la rete globale che unifica dispositivi, dati e decisioni.

  2. La nuova grammatica dell’interazione: come cambiano i linguaggi tra umani, interfacce e sistemi.

  3. Il mondo come interfaccia: la città e lo spazio come UI diffusa.

  4. Il corpo e la mente estesa: quando la tecnologia non è “fuori”, ma diventa parte della cognizione.

  5. Relazioni aumentate: socialità, identità, presenza e mediazione algoritmica.

  6. L’economia dell’attenzione e dell’intenzione: la competizione non è più solo per il tempo, ma per il “volere”.

  7. Il paradosso dell’opacità: più sistemi intelligenti, meno comprensione del “perché” dietro le scelte.

  8. L’umanesimo aumentato: la necessità di una nuova alleanza tra innovazione e valori umani.

Questa sequenza è intenzionale: parte dall’infrastruttura e arriva alla responsabilità. Perché, a un certo punto, non basta più descrivere il fenomeno. Serve prendere posizione.

Uno degli snodi del libro è il conflitto tra promessa e ombra. Da un lato: un mondo più efficiente, sicuro, personalizzato, capace di anticipare bisogni e amplificare capacità. Dall’altro: controllo pervasivo, delega cognitiva, perdita di autonomia, complessità indecifrabile. La pelle digitale può essere un esoscheletro che ci rende migliori o una gabbia elegante che ci rende docili

Per questo “Pelle Digitale” non si chiude con una sintesi, ma con un Manifesto per un umanesimo aumentato. L’idea è semplice: il futuro non è qualcosa che “ci capita”. È qualcosa che progettiamo, decisione dopo decisione, interazione dopo interazione. E se siamo co-creatori di questo sistema nervoso invisibile, allora siamo anche responsabili della sua direzione.

Quando dico “umanesimo aumentato” non intendo un ottimismo ingenuo. Intendo un compito: riportare l’uomo al centro non come slogan, ma come criterio di design. Vuol dire chiedersi quali valori devono guidare lo sviluppo e l’adozione delle tecnologie; come preservare autenticità dell’esperienza umana in un mondo mediato; come evitare che l’innovazione invisibile diventi un automatismo economico privo di etica.

Come si usa, concretamente, questo libro?

Si usa come lente: per rileggere prodotti, servizi e piattaforme non per feature, ma per impatto sul comportamento e sulla percezione. Si usa come mappa: per capire dove stiamo mettendo intelligenza (e dove stiamo togliendo agency). Si usa come strumento di conversazione: perché lo shift non va affrontato da soli, ma dentro organizzazioni, scuole, istituzioni, famiglie.

Se “Pelle Digitale” ha un obiettivo, è questo: rendere visibile l’invisibile. Dare parole e struttura a ciò che spesso percepiamo solo come ansia diffusa o entusiasmo confuso. E trasformare quella percezione in scelta consapevole: non subire la pelle digitale, ma diventare architetti del modo in cui ci avvolgerà.

Dal “perché” al “come”: tre libri per orientarsi tra pelle digitale, AI locale e agenti autonomi

Negli ultimi mesi ho lavorato su tre testi diversi, ma legati da un filo unico: capire cosa sta diventando il digitale quando smette di essere “uno schermo” e diventa ambiente, infrastruttura e, soprattutto, comportamento. “Pelle Digitale” prova a nominare il cambiamento (e le sue implicazioni umane). La guida su LocalAI spiega come costruire un ecosistema di AI privata e controllabile. La guida su OpenClaw porta tutto sul piano operativo: un assistente che non si limita a rispondere, ma agisce.

 


Negli ultimi mesi sono usciti tre miei lavori che, a prima vista, sembrano parlare a pubblici diversi: un saggio, due guide pratiche. In realtà, sono tre capitoli della stessa domanda: cosa succede quando la tecnologia smette di essere un “mezzo” e diventa uno “strato” della realtà? Uno strato che ci avvolge, ci legge, ci anticipa, ci indirizza. E che, proprio per questo, va capito prima ancora che usato.

Il primo punto è semplice e scomodo: non stiamo vivendo un’ennesima ondata di innovazione. Stiamo attraversando un cambio di postura dell’umano. Il digitale non è più un luogo separato (il web, l’app, la piattaforma). È un sistema nervoso diffuso fatto di sensori, modelli, agenti, edge, interfacce spaziali. Una “intelligenza invisibile” che diventa infrastruttura del quotidiano, mentre noi continuiamo a raccontarcela come una serie di prodotti e feature.

Da qui nasce “Pelle Digitale”: un tentativo di dare un nome alla convergenza tra AI e mondo fisico, e di ragionare sul prezzo (e sul valore) di questa simbiosi. Perché se la tecnologia migra “dalla tasca alla pelle”, cambiano le regole dell’esperienza, della percezione, della relazione e del potere. Non è un libro sulle tendenze: è una mappa per non subire lo shift.

Il secondo punto è operativo: se l’AI diventa una componente strutturale, allora serve una scelta di architettura. E la scelta non è solo tecnica: è politica, economica, culturale. “AI locale” significa, prima di tutto, riprendersi controllo su dati, costi, personalizzazione e continuità operativa. È una forma di sovranità digitale: non delegare tutto al cloud per abitudine, ma decidere dove vive la tua intelligenza, con quali vincoli, con quali garanzie. 

È il senso della “Guida completa a LocalAI, LocalAGI e LocalRecall”: un percorso pratico per costruire un ecosistema privato (LLM, memoria, agenti) su hardware consumer, con strumenti open-source e API compatibili. Non è un manuale “da laboratorio”: è una guida pensata per chi vuole capire davvero cosa sta installando e perché, e per chi vuole passare dalla demo al sistema.

Il terzo punto è l’ultimo miglio: quando l’AI smette di essere solo conversazione e diventa azione. Qui entrano gli agenti autonomi e la nuova categoria degli “assistenti che fanno cose”: non solo risposte, ma task, workflow, automazioni, verifiche, iterazioni. “OpenClaw: La Guida Completa all’Assistente AI Personale” nasce per spiegare come funziona (davvero) un agente che interagisce con sistema operativo, browser e strumenti quotidiani, e soprattutto come lo si governa in sicurezza.

Se devo sintetizzare il filo rosso, è questo: stiamo costruendo un mondo in cui il digitale diventa ambiente. Un ambiente può essere accogliente o ostile. Può amplificare autonomia o erodere libertà. Può rendere le persone più capaci o più dipendenti. E la differenza la fanno design, governance e responsabilità.

Per questo i tre libri, scritti nel primo trimestre del 2026, possono essere letti come una sequenza naturale, dal senso all’implementazione:

  1. “Pelle Digitale” per capire il contesto: cosa sta succedendo al rapporto tra corpo, spazio, interfacce e intelligenza.
  2. “LocalAI” per costruire la base: un’infrastruttura AI privata (inferenza, memoria, agenti) sotto il tuo controllo.
  3. “OpenClaw” per passare all’azione: un assistente agentico, con architettura modulare e una disciplina di sicurezza “prima dei superpoteri”.

E se invece vuoi una lettura “per ruolo”, ecco tre percorsi possibili.

Se guidi un’azienda, un team, un prodotto: parti da “Pelle Digitale” per mettere ordine nelle implicazioni (attenzione, opacità, relazioni aumentate, umanesimo aumentato) e poi scendi su LocalAI per capire cosa significa progettare sistemi AI sostenibili, non solo esperimenti.

Se sei tecnico (dev, data, IT, security): parti da LocalAI per costruire stack, costi e privacy; poi OpenClaw per capire come si traduce l’AI in agenti “operativi” e quali sono i rischi reali quando un modello può toccare file, browser e credenziali.

Se sei curioso e vuoi un quadro completo: parti da “Pelle Digitale”, ma tieni LocalAI e OpenClaw come “laboratori”: ti aiutano a trasformare concetti in oggetti, e oggetti in pratiche.

Il punto, per me, non è aggiungere contenuti al rumore. È offrire tre strumenti di orientamento: una mappa concettuale, una guida infrastrutturale, una guida agentica. Perché la vera domanda non è “cosa può fare l’AI?”. La domanda è “che tipo di mondo stiamo costruendo quando la rendiamo ovunque?”.

Leggi anche: AI locale e agenti con memoria