Anthropic spegne Fable 5 e Mythos 5: open weights di frontiera e sovranitร tecnologica
Venerdรฌ sera, ora di Washington, Anthropic ha disattivato i suoi due modelli piรน capaci, Claude Fable 5 e Claude Mythos 5, per tutti i clienti del mondo, e il dibattito sugli open weights รจ ripartito di colpo. A tre giorni dal lancio. La causa รจ una direttiva di export control del governo americano, che vieta lโaccesso a qualsiasi cittadino straniero, dentro e fuori dagli Stati Uniti, compresi i dipendenti stranieri della stessa azienda. Una conformitร selettiva era impossibile, lโinterruttore รจ stato abbassato per chiunque, ovunque, e in molti hanno letto il blocco come la spinta che mancava verso i modelli open weights. I due modelli erano disponibili da pochi giorni, ed รจ la prima volta che una direttiva di questo tipo colpisce cosรฌ, in una sera, i modelli di punta di un laboratorio americano.
Ethan Mollick, su LinkedIn, ha scritto una previsione che va nella direzione opposta.

Il blocco non porterร piรน modelli a pesi aperti. Semmai, scrive Mollick, vedremo la fine dei modelli di frontiera open weights. Il ragionamento รจ lineare: se un modello di classe Mythos รจ considerato rischioso, neanche la Cina avrร interesse a lasciarlo aperto, e un modello del genere non lo costruisci senza una concentrazione di calcolo che sta dentro un Paese, visibile e regolabile.
Ho lasciato un commento sotto il suo post, e provo qui ad allargarlo.

Sul meccanismo Mollick ha ragione, per la punta assoluta. Sulla conclusione servono due correzioni, e tutte e due portano esattamente dove passo le mie giornate, lโinferenza locale e la sovranitร tecnologica, il lavoro che faccio in LocalAI.
La logica del footprint tiene
Un modello al vertice della capacitร oggi nasce da una concentrazione di GPU che occupa data center fisici, dentro una giurisdizione precisa, con consumi, forniture e contratti tracciabili. La definizione che gira da tempo nei documenti regolatori รจ quella di calcolo regolabile, regulatable compute: un addestramento al vertice lascia tracce fisiche, il consumo elettrico fuori scala, le dimensioni dei data center, lโacquisto di decine di migliaia di acceleratori, e tutto questo uno Stato lo identifica e lo raggiunge. Le stesse restrizioni americane sullโexport dei chip piรน avanzati esistono perchรฉ quel calcolo si vede, si conta, si puรฒ fermare a monte. Venerdรฌ lo Stato lo ha fatto, in una sera.
Un modello aperto da sette o settanta miliardi di parametri, invece, una volta scaricato vive di vita propria, e una copia su un portatile non si richiama indietro con una direttiva. ร la differenza che molti hanno colto subito, chi tiene i pesi in locale non se li vede togliere da nessun governo. Mollick anticipa lโobiezione cinese, e fa bene. Al vertice vero, quello dei modelli piรน potenti in assoluto, nessuno dei due blocchi ha convenienza a far circolare i pesi liberamente. Su questo gli concedo tutto, il tetto si chiude su entrambi i lati.
Dallโ1,2% a quasi il 30% in un anno
La parola ยซfrontieraยป, perรฒ, nel suo post indica il soffitto, la classe Mythos. La capacitร che muove davvero lโadozione sta un gradino sotto, nel near-frontier, piรน che sufficiente per quasi tutto quello che le aziende fanno ogni giorno: estrarre dati da un contratto, classificare richieste, alimentare un sistema RAG, scrivere bozze, far girare agenti su compiti delimitati. Per questi lavori la distanza dal soffitto si รจ assottigliata fino a diventare irrilevante, e il modello piรน potente in assoluto non cambia lโesito di unโestrazione di campi o dello smistamento di un ticket. E lรฌ la Cina accelera, in chiaro.
Qwen di Alibaba, Kimi di Moonshot, GLM di Zhipu, DeepSeek, e da inizio giugno MiniMax con il suo M3, presentato come primo modello di frontiera open weights che tiene insieme coding di alto livello, un milione di token di contesto e input multimodale. I numeri raccontano lo spostamento meglio di qualsiasi tesi. Uno studio di OpenRouter su centomila miliardi di token, ripreso insieme ad Andreessen Horowitz, misura la quota dei modelli open source cinesi sullโuso globale degli LLM salita da circa lโ1,2% di fine 2024 a quasi il 30% un anno dopo. Il paper della Commissione USA-Cina di marzo riporta una stima di un partner di a16z secondo cui intorno allโottanta per cento delle startup americane costruisce su modelli base cinesi, e segnala che tra novembre e dicembre 2025 sette dei dieci modelli piรน scaricati su Hugging Face venivano da laboratori cinesi. I modelli proprietari occidentali restano davanti, intorno al settanta per cento dellโuso complessivo, ma la pendenza della curva aperta รจ tutta da una parte. Lโadozione poi si autoalimenta, piรน sviluppatori scaricano un modello e piรน nascono strumenti, integrazioni e materiali intorno, e piรน quel modello diventa la scelta ovvia per il progetto successivo. ร un volano che lavora a favore di chi pubblica i pesi, e in questo momento a pubblicarli con piรน aggressivitร รจ la Cina.
Fine del frontier open weights occidentale
A chiudersi, allora, non รจ il layer aperto, รจ la sua sponda occidentale. Se gli Stati Uniti regolano chiuso il proprio gradino alto e lโEuropa continua a scivolare fuori dai vertici, con Mistral che esce dai primi posti tra i laboratori di punta, lo strato aperto del near-frontier non sparisce, passa di mano. Passa ai laboratori cinesi, che lo tengono aperto proprio perchรฉ lโapertura รจ una leva competitiva contro le API chiuse americane, un modo per entrare negli stack di tutto il mondo mentre lโalternativa si blinda.
Il blocco ha messo in chiaro un contrasto che diversi osservatori hanno colto subito. Un modello di frontiera open weights come M3 lo scarichi e lo fai girare sul tuo hardware, e nessun governo te lo spegne a distanza, mentre due modelli di punta serviti da un endpoint centralizzato sono spariti per chiunque nel giro di una sera. La parte scomoda della previsione di Mollick รจ questa: una chiusura del vertice occidentale dettata dalla sicurezza puรฒ consegnare lo standard aperto a Pechino, e regalare a un concorrente sistemico la posizione di default su cui costruiscono sviluppatori e imprese.
Per lโEuropa la posta รจ alta. Se lo strato aperto che entra negli stack diventa cinese, lโautonomia digitale che il continente insegue da anni si ritrova a poggiare su modelli sviluppati sotto unโaltra giurisdizione, con unโaltra catena di fornitura e un altro sistema di valori a monte. Mistral resta la carta europea piรน seria, e proprio per questo il suo arretramento dai vertici pesa oltre il singolo laboratorio. La sovranitร tecnologica, in questo scenario, smette di essere una parola da convegno e diventa una scelta su quale ecosistema di modelli vuoi poter usare anche tra cinque anni.
Una sera รจ bastata a spegnere due modelli
Qui arriva la parte che vedo meglio dal mio mestiere. Per il valore che conta in produzione, la capacitร di frontiera non รจ mai stata lโelemento che fa la differenza. In produzione la differenza la fa la continuitร del servizio, e una sera come quella di venerdรฌ la mette alla prova piรน di qualsiasi benchmark. Due modelli spariti per direttiva, a tre giorni dal lancio, con Amazon a cui รจ stato chiesto di revocare lโaccesso in tutte le regioni, e nessuno dei clienti che ci aveva costruito sopra un processo ha avuto voce in capitolo.
ร una traiettoria, piรน che un episodio isolato. Il Dipartimento della Difesa aveva giร etichettato Anthropic come rischio per la catena di fornitura, e lโazienda ha aperto un contenzioso contro quella classificazione. Quando un fornitore si trova in mezzo a una tensione del genere, la volatilitร regolatoria smette di essere unโipotesi da slide e diventa una variabile operativa. E cโรจ un secondo lato, speculare, se lโottanta per cento delle startup americane gira su modelli cinesi quellโesposizione un domani puรฒ diventare a sua volta oggetto di una direttiva: la dipendenza da un fornitore lontano รจ un rischio qualunque sia la bandiera del fornitore. La lezione che le aziende portano a casa questa settimana รจ architetturale, serve un disegno capace di reggere il momento in cui un down o un blocco arrivano davvero. Ne avevo scritto guardando alle opzioni di self-hosting con Mistral, e quel ragionamento oggi vale per chiunque appoggi un processo critico su un solo fornitore lontano.
Routing e inferenza locale, il livello che resta tuo
Lโarchitettura che regge a tutto questo รจ agnostica rispetto al modello: un livello di astrazione e di routing che, nel momento esatto in cui qualcosa a monte si rompe, sposta il traffico da unโAPI di frontiera a un modello aperto che gira in casa. ร quello che costruiamo in LocalAI, un motore open source che funziona come sostituto diretto delle API di OpenAI e di Anthropic, cosรฌ lo stesso codice che ieri chiamava Fable 5 oggi puรฒ chiamare un Qwen o un DeepSeek sul tuo hardware, CPU compresa, senza che i dati escano dalla tua infrastruttura, con agenti, RAG e supporto MCP giร dentro. In termini concreti cambi lโindirizzo dellโendpoint e la chiave, non lโapplicazione che ci sta sopra.
La spinta verso questo disegno non arriva solo da chi vende inferenza locale. VentureBeat, commentando proprio questo blocco, indica come via piรน resiliente unโarchitettura a fallback attivo, con sistemi pensati per essere agnostici rispetto al modello e livelli di routing intelligenti che spostano il traffico da un modello di frontiera a un fallback a pesi aperti nellโistante in cui arriva unโinterruzione o un divieto. Nello stesso caso Anthropic, per non lasciare tutto fermo, ha dirottato le richieste sopravvissute su Opus 4.8, un modello meno capace ma ancora acceso. Lo ha fatto perchรฉ quando il vertice si spegne serve comunque un posto dove ricadere, e quel posto, se รจ davvero tuo, non te lo toglie nessuno.
Compatibilitร diretta vuol dire usare gli stessi SDK e la stessa struttura di chiamata, e il livello di routing decide richiesta per richiesta dove mandare il lavoro, in base a quanto รจ sensibile il dato, al costo e a quanto serve davvero la potenza del modello piรน grande. Una bozza interna resta in casa su un modello locale, una sintesi complessa puรฒ salire sul cloud di frontiera, e se quel cloud non risponde il traffico ricade sul locale senza che lโutente se ne accorga. Per banche, sanitร e pubblica amministrazione lo stesso motore gira on premise o in ambienti isolati dalla rete, dove il dato non ha proprio il permesso di uscire.
Il lock-in vero, quello che fa fallire le migrazioni, vive oltre il modello, negli embedding, nel database vettoriale, nella logica di orchestrazione che hai cucito addosso a un fornitore. Possedere il livello di astrazione significa poterli sostituire un pezzo alla volta, senza riscrivere tutto. E sul costo cambia la natura della spesa, lโinferenza locale ha un costo prevedibile legato allโhardware, piรน che una bolletta a consumo che cresce con lโuso e che un fornitore puรฒ ritoccare quando vuole. ร la stessa famiglia di strumenti, da LocalAI a LocalAGI fino a LocalRecall, di cui avevo raccontato il senso piรน ampio parlando di pelle digitale e di agenti autonomi.
Gli agenti rendono il problema piรน grave
Cโรจ un livello in cui tutto questo pesa il doppio, ed รจ quello degli agenti. Un agente che dipende da una sola API di frontiera per pianificare i passi e chiamare gli strumenti si ferma del tutto nel momento in cui quellโAPI viene tagliata, e non si ferma una funzione, si ferma il processo che gli avevi delegato per intero. Piรน lโagente รจ autonomo e incastrato nei flussi di lavoro, piรน alto รจ il costo di unโinterruzione improvvisa, perchรฉ hai spostato sul modello non una risposta ma una catena di decisioni.
Un livello di routing con fallback locale รจ quello che permette a un agente di degradare con grazia, passando a un modello che gira in casa e continuando a lavorare, magari un poโ piรน lento, invece di spegnersi a metร . ร una delle ragioni per cui LocalAGI sta sopra LocalAI, lโorchestrazione degli agenti vale finchรฉ sotto cโรจ unโinferenza che non puoi perdere da un momento allโaltro.
La difendibilitร si sposta dal modello al controllo
Da mesi insisto su una tesi che questa settimana trova una conferma sgradevole. Quando la capacitร di frontiera diventa una merce che si affitta, finchรฉ non te la spengono, ยซavere il modello miglioreยป smette di essere un fossato difensivo. Lโasset che resta difendibile รจ il controllo, sullโinferenza, sul luogo dove vivono i dati, sul livello di routing che tiene in piedi tutto il resto. La capacitร la noleggi in un pomeriggio, il controllo te lo costruisci, e per questo vale di piรน.
Per lโItalia e per lโEuropa la cosa non รจ teorica. Gli obblighi dellโAI Act per i sistemi ad alto rischio arrivano in pieno il 2 agosto 2026, con gestione del rischio, governance del dato, tracciamento e sorveglianza umana da dimostrare, il GDPR rende il luogo del dato una questione legale prima ancora che tecnica, e la spinta sul cloud sovrano sta giร ridisegnando quali fornitori possono servire i progetti pubblici. Uno stack che possiedi risponde alle tre cose insieme, compliance, residenza del dato e continuitร , e lo fa senza dover sperare che il fornitore a monte non cambi idea.
In pratica si parte mappando le dipendenze AI che hai, processo per processo, per sapere cosa si ferma se un fornitore sparisce. Da lรฌ si introduce un livello di astrazione e di routing tra le applicazioni e i modelli, si tiene pronto un fallback locale per i carichi critici e per i dati sensibili, e si comincia a trattare lโinferenza come si tratta lโenergia di unโazienda, con una fornitura principale e una riserva che non dipende da lei. Nessuno di questi passi richiede di rinunciare ai modelli di frontiera quando servono davvero, chiede solo di non restarne prigionieri.
La cosa che mi resta addosso, finita questa settimana, non รจ la geopolitica del calcolo. ร quanta parte della nostra intelligenza operativa giri giร su un interruttore tenuto da qualcun altro. Ci siamo affezionati a capacitร che non possediamo, che possono cambiare, scadere o essere spente da lontano, e in Pelle Digitale avevo provato a dire che la tecnologia che ci estende รจ anche la tecnologia che ci espone, ogni volta che rinunciamo a governarla. Possedere il livello che ti tiene acceso sta diventando una scelta quotidiana, da rifare ogni mattina invece di darla per acquisita. Senza dubbio รจ la domanda che porto in ogni tavolo in queste settimane, quanta della tua intelligenza operativa sei disposto a lasciare su un interruttore che non tieni in mano?
Fonte: Ethan Mollick, post su LinkedIn, 12 giugno 2026. Sui fatti del blocco: comunicato di Anthropic, CNBC, Tomโs Hardware, VentureBeat. Sui dati di mercato: OpenRouter e Andreessen Horowitz, paper della Commissione USA-Cina (USCC).


