10 ragioni per portare l’AI privata al tavolo del board
Quando un’azienda inizia a costruire prodotti su AI, la prima scelta รจ quasi sempre la stessa: ci si appoggia ai grandi provider americani, e si lascia la AI privata come ipotesi da valutare “piรน avanti”. OpenAI, Anthropic, Google, qualche volta Mistral. Sono comodi, documentati, hanno API stabili, hanno modelli che funzionano davvero bene, hanno reparti enterprise che rispondono alle email.
Per le prime settimane, va benissimo cosรฌ. Il problema arriva dopo, quando il prodotto smette di essere un prototipo e diventa qualcosa su cui dipende un pezzo di fatturato, di reputazione, di rapporto col cliente. ร a quel punto che la domanda cambia, e diventa una domanda di architettura, non piรน di tool. Quanto controllo abbiamo davvero sul fondamento di quello che stiamo costruendo?
Negli ultimi mesi ho lavorato su questa domanda con diversi CEO e CTO di aziende italiane, e mi sono convinto che la AI privata vada considerata seriamente per almeno dieci ragioni. Non come fissazione tecnica, non come scelta ideologica anti-Big Tech, ma come opzione architetturale concreta che merita un posto al tavolo del board accanto alle proposte cloud-only.
I dati del cliente finiscono in posti che non controllate
Un contratto enterprise con OpenAI o Anthropic vi dร garanzie legali importanti: zero retention, niente training sui vostri dati, audit trail. Ma il dato tecnico resta: quando il vostro cliente invia una richiesta, quel testo viene processato dentro un data center che non รจ vostro, da un’infrastruttura che non vedete, sotto giurisdizioni che cambiano in base a dove sta il fornitore. Per applicazioni che trattano contratti, dati sanitari, proprietร intellettuale, strategie commerciali, questa distanza fisica fra dato e azienda รจ esattamente il punto su cui si stanno irrigidendo i clienti enterprise. Una banca italiana che valuta un vostro prodotto AI non vuole solo sapere che siete GDPR-compliant. Vuole sapere dove gira il modello e chi puรฒ guardarci dentro.
Le fondamenta sono in affitto
Costruire un prodotto AI completamente sopra un servizio esterno รจ comodo per la velocitร di sviluppo, ma รจ l’equivalente di costruire un edificio su un terreno di cui non avete il rogito. Funziona finchรฉ funziona. Il giorno in cui il proprietario decide di cambiare le regole del condominio, vi ritrovate a discuterle dalla posizione piรน debole possibile. Non sto dicendo che OpenAI o Anthropic siano cattivi padroni di casa, anzi. Sto dicendo che la relazione resta strutturalmente asimmetrica, e questa asimmetria diventa rischio quando il vostro prodotto รจ in produzione presso clienti che si aspettano continuitร per anni.
Quanto durano davvero le API che state usando
Modelli che vengono deprecati. Endpoint che spostano comportamento da una versione all’altra. Limiti di token che si modificano. Policy d’uso che si stringono o si allargano. Funzionalitร beta che diventano premium. Le aziende che hanno costruito prodotti seri sopra le API dei grandi provider lo sanno: ogni rilascio รจ anche un piccolo lavoro di regressione testing per capire cosa รจ cambiato senza preavviso. La vostra roadmap di prodotto non รจ mai veramente vostra finchรฉ dipende dalla roadmap di qualcun altro, soprattutto quando quel qualcun altro rilascia tre versioni maggiori l’anno.
Erediterete la reputazione di chi vi dร il modello
Il nome famoso oggi rassicura il vostro cliente. Domani puรฒ finire dentro uno scandalo, una controversia regolatoria, una scelta commerciale impopolare, un caso di sicurezza, un’inchiesta giornalistica. Quando succede, il vostro prodotto eredita istantaneamente la coda di quella reputazione. I clienti piรน sofisticati lo sanno e mettono nelle loro RFP domande sempre piรน specifiche su quale modello state usando, dove gira, chi lo controlla. La risposta “usiamo il provider X” รจ giร oggi una risposta che apre conversazioni invece di chiuderle.
I costi non sono sotto il vostro controllo
Potete ottimizzare i prompt, ridurre i token in uscita, fare prompt caching, scegliere il modello piรน piccolo per ogni task. Sono tutti esercizi utili, e li facciamo tutti. Perรฒ il prezzo finale al token lo decide qualcun altro, e lo decide guardando le proprie esigenze di margine, non le vostre. Negli ultimi due anni i costi dei modelli sono scesi rapidamente, ed รจ una buona notizia per chi รจ entrato adesso. Ma non c’รจ nessuna garanzia che continuino a scendere allo stesso ritmo, e ci sono diversi segnali di prezzi che stanno iniziando a risalire su modelli premium con context window molto lunghe o capacitร agentic specifiche. Per chi pianifica un business plan a tre anni, รจ una variabile che vale la pena guardare con attenzione. Su questo tema ho scritto di recente in Quanta intelligenza artificiale stai davvero governando?.
La demo non รจ la produzione
Quando si dimostra un proof of concept, si usa quasi sempre il modello piรน potente disponibile. Funziona bene perchรฉ costa, e perchรฉ si lavora su volumi piccoli. Quando lo stesso prodotto va in produzione con cento clienti, mille clienti, diecimila utenti finali, i conti cambiano: i volumi salgono, la latenza diventa un problema reale, il budget per ogni interazione si stringe, e all’improvviso il modello che faceva la magia nella demo รจ troppo costoso per girare a regime. Comincia la caccia al modello “abbastanza buono” piรน economico, e quella caccia si fa molto meglio quando il modello sotto รจ una commodity che potete sostituire, non un servizio chiuso che dovete riconfigurare ogni volta.
I grandi provider americani non sono imbattibili
C’รจ un’idea diffusa, e secondo me sbagliata, che i grandi player AI siano destinati a vincere sempre perchรฉ hanno inventato la categoria. Non hanno inventato la categoria. Hanno estratto un enorme valore da una combinazione storicamente fortunata di dati pubblici scrapati prima delle restrizioni, infrastruttura GPU comprata in massa al momento giusto, distribuzione ai consumer arrivata prima di tutti gli altri. Tutte cose imitabili da chiunque abbia abbastanza capitale e tempo. Mistral in Europa, DeepSeek e Qwen in Cina, Meta con Llama, Cohere, Stability, decine di laboratori piรน piccoli stanno giร pubblicando modelli open-weight competitivi su task specifici. L’ecosistema sta inevitabilmente convergendo verso una commoditizzazione almeno parziale, ed รจ ragionevole pensare che fra tre anni il “vincitore” del 2024 non sarร piรน automaticamente la scelta obbligata del 2027.
La sovranitร digitale รจ diventata clausola contrattuale
Fino al 2023, parlare di sovranitร digitale veniva visto come un argomento politico da convegno, lontano dalle decisioni operative di un’azienda. Nel 2026 รจ diventato un capitolo dei contratti enterprise. Il combinato disposto di GDPR, AI Act europeo, Schrems II, scadenze del PNRR e tensioni geopolitiche fra Stati Uniti, Europa e Cina sta riportando a casa una domanda che sembrava sepolta: dove sta fisicamente il software critico della mia azienda, e chi ha potere giurisdizionale su di esso? Per le aziende che lavorano con la pubblica amministrazione, con la difesa, con il settore bancario o sanitario italiano, questa domanda si รจ giร trasformata in clausole contrattuali specifiche. Per tutte le altre aziende, รจ solo questione di tempo prima che arrivi nelle gare e nelle due diligence.
Il vendor lock-in tecnico รจ un debito che si accumula in silenzio
Ogni volta che ottimizzate un prompt per un modello specifico, sviluppate una tool integration su un’API specifica, costruite memoria semantica sopra un embedding-as-a-service specifico, state accumulando un debito tecnico di portabilitร . Quel debito non si vede nei primi sei mesi, perchรฉ tutto funziona. Si vede al ventiquattresimo mese, quando provate a fare una proof of concept con un altro provider per ragioni di prezzo o di feature e scoprite che la migrazione costa quanto rifare metร del prodotto da zero. Quel debito si riduce drasticamente se il modello sotto รจ un’astrazione che potete sostituire, e si azzera se quel modello vive dentro un’infrastruttura che possedete. La domanda da farsi oggi non รจ solo quanto costa cominciare con un provider, รจ quanto costerebbe cambiarlo fra due anni.
AI Act e compliance non sono un problema futuro
Dall’agosto 2026 entrano in vigore i primi obblighi sostanziali del Regolamento europeo sull’AI per i sistemi ad alto rischio. Le aziende che usano modelli proprietari di terze parti per casi d’uso classificati ad alto rischio si troveranno a dover dimostrare conformitร su dati di training, valutazioni di bias, documentazione tecnica, sistemi di monitoraggio, gestione del rischio. Su un modello chiuso, gran parte di queste informazioni vi vengono fornite o non vi vengono fornite dal provider. Su un modello che gira nella vostra infrastruttura, anche se รจ un modello open-weight scaricato da Hugging Face, la documentazione รจ almeno auditable, il fine-tuning รจ tracciabile, il dataset usato รจ esplicito. La differenza, per chi opera in finanza, sanitร , HR, pubblica amministrazione, sta diventando rilevante in modo concreto e a breve termine.
Per chi vuole iniziare, c’รจ LocalAI.io
La AI pubblica resta utile, e in molti casi resta la scelta giusta per le prime fasi di sperimentazione di un prodotto. Perรฒ se la vostra applicazione dipende strutturalmente da privacy, controllo dei costi, sovranitร e autonomia strategica, allora la AI privata non รจ una fissazione tecnica, รจ semplicemente buona architettura.
Su questo tema ho investito personalmente come cofondatore di LocalAI.io, un progetto open-source che permette di costruire ecosistemi di AI privata a partire dai modelli open-weight giร esistenti, con tutto lo stack che serve per portare un prodotto in produzione: gateway compatibile con le API OpenAI, gestione di modelli multipli, RAG, agenti con memoria, deployment on-premise o su cloud privato. LocalAI รจ usato oggi in produzione da aziende che hanno deciso di avere il proprio strato AI in casa, e da team che vogliono mantenere la flessibilitร di cambiare modello senza rifare il prodotto. Per chi vuole capire come funziona nel concreto, ho scritto una guida operativa completa qualche mese fa. Vale la pena darci un’occhiata se queste dieci ragioni hanno toccato qualche corda del vostro contesto.
La domanda finale resta sempre la stessa, e si fa piรน seria man mano che il vostro prodotto AI cresce. Su cosa state costruendo davvero, comoditร immediata di chi vi dร il modello, oppure controllo nel lungo periodo di chi tiene insieme il vostro business? Se รจ una conversazione che vi sta riguardando, c’รจ la pagina Advisory con i formati di collaborazione che propongo a CEO e leadership team che stanno affrontando questi temi.
