Pelle Digitale: quando il mondo diventa interfaccia e lโ€™intelligenza diventa ambiente

Ci sono libri che nascono per spiegare una tecnologia. โ€œPelle Digitaleโ€ pubblicato con EGEA nasce per spiegare una condizione. Una nuova condizione dellโ€™umano, che non riguarda solo chi โ€œlavora nel techโ€, ma chiunque viva in un ambiente sempre piรน intelligente, sensorizzato e predittivo.

Lโ€™idea centrale รจ questa: stiamo entrando in unโ€™era in cui lโ€™intelligenza smette di essere un software che consultiamo e diventa unโ€™atmosfera che respiriamo. Unโ€™infrastruttura invisibile che collega sensori IoT, edge device, algoritmi e modelli in una rete globale. I dati diventano impulsi. Gli oggetti smettono di essere โ€œcoseโ€ separate e diventano organi di un ecosistema piรน grande.

In apertura del libro parlo di transizione profonda: non un upgrade, ma un cambio di paradigma. La tecnologia non si sovrappone piรน al mondo: si radica nel mondo. Lo spazio diventa interfaccia. Lโ€™esperienza diventa persistente e contestuale. La relazione tra fisico e digitale non รจ piรน una โ€œconnessioneโ€: รจ una dissoluzione del confine.

Il catalizzatore di questa metamorfosi ha un nome chiave: spatial computing. Non รจ โ€œsoloโ€ AR/VR. รˆ un principio operativo che rende ogni luogo un potenziale punto di accesso: casa, cittร , oggetti, corpo. รˆ la trasformazione della realtร  in un layer interpretato, aumentato e governato da modelli. E quando la realtร  diventa un layer, la domanda non รจ piรน โ€œquale app userรฒ?โ€, ma โ€œquale realtร  sto abitando?โ€.

Per raccontare questa trasformazione ho scelto una struttura in otto pilastri, perchรฉ lo shift non รจ monodimensionale: รจ simultaneo e sistemico. Questi sono i capitoli del viaggio:

  1. Lโ€™intelligenza invisibile: la rete globale che unifica dispositivi, dati e decisioni.

  2. La nuova grammatica dellโ€™interazione: come cambiano i linguaggi tra umani, interfacce e sistemi.

  3. Il mondo come interfaccia: la cittร  e lo spazio come UI diffusa.

  4. Il corpo e la mente estesa: quando la tecnologia non รจ โ€œfuoriโ€, ma diventa parte della cognizione.

  5. Relazioni aumentate: socialitร , identitร , presenza e mediazione algoritmica.

  6. Lโ€™economia dellโ€™attenzione e dellโ€™intenzione: la competizione non รจ piรน solo per il tempo, ma per il โ€œvolereโ€.

  7. Il paradosso dellโ€™opacitร : piรน sistemi intelligenti, meno comprensione del โ€œperchรฉโ€ dietro le scelte.

  8. Lโ€™umanesimo aumentato: la necessitร  di una nuova alleanza tra innovazione e valori umani.

Questa sequenza รจ intenzionale: parte dallโ€™infrastruttura e arriva alla responsabilitร . Perchรฉ, a un certo punto, non basta piรน descrivere il fenomeno. Serve prendere posizione.

Uno degli snodi del libro รจ il conflitto tra promessa e ombra. Da un lato: un mondo piรน efficiente, sicuro, personalizzato, capace di anticipare bisogni e amplificare capacitร . Dallโ€™altro: controllo pervasivo, delega cognitiva, perdita di autonomia, complessitร  indecifrabile. La pelle digitale puรฒ essere un esoscheletro che ci rende migliori o una gabbia elegante che ci rende docili

Per questo โ€œPelle Digitaleโ€ non si chiude con una sintesi, ma con un Manifesto per un umanesimo aumentato. Lโ€™idea รจ semplice: il futuro non รจ qualcosa che โ€œci capitaโ€. รˆ qualcosa che progettiamo, decisione dopo decisione, interazione dopo interazione. E se siamo co-creatori di questo sistema nervoso invisibile, allora siamo anche responsabili della sua direzione.

Quando dico โ€œumanesimo aumentatoโ€ non intendo un ottimismo ingenuo. Intendo un compito: riportare lโ€™uomo al centro non come slogan, ma come criterio di design. Vuol dire chiedersi quali valori devono guidare lo sviluppo e lโ€™adozione delle tecnologie; come preservare autenticitร  dellโ€™esperienza umana in un mondo mediato; come evitare che lโ€™innovazione invisibile diventi un automatismo economico privo di etica.

Come si usa, concretamente, questo libro?

Si usa come lente: per rileggere prodotti, servizi e piattaforme non per feature, ma per impatto sul comportamento e sulla percezione. Si usa come mappa: per capire dove stiamo mettendo intelligenza (e dove stiamo togliendo agency). Si usa come strumento di conversazione: perchรฉ lo shift non va affrontato da soli, ma dentro organizzazioni, scuole, istituzioni, famiglie.

Se โ€œPelle Digitaleโ€ ha un obiettivo, รจ questo: rendere visibile lโ€™invisibile. Dare parole e struttura a ciรฒ che spesso percepiamo solo come ansia diffusa o entusiasmo confuso. E trasformare quella percezione in scelta consapevole: non subire la pelle digitale, ma diventare architetti del modo in cui ci avvolgerร .

Dal โ€œperchรฉโ€ al โ€œcomeโ€: tre libri per orientarsi tra pelle digitale, AI locale e agenti autonomi

Negli ultimi mesi ho lavorato su tre testi diversi, ma legati da un filo unico: capire cosa sta diventando il digitale quando smette di essere โ€œuno schermoโ€ e diventa ambiente, infrastruttura e, soprattutto, comportamento. โ€œPelle Digitaleโ€ prova a nominare il cambiamento (e le sue implicazioni umane). La guida su LocalAI spiega come costruire un ecosistema di AI privata e controllabile. La guida su OpenClaw porta tutto sul piano operativo: un assistente che non si limita a rispondere, ma agisce.

 


Negli ultimi mesi sono usciti tre miei lavori che, a prima vista, sembrano parlare a pubblici diversi: un saggio, due guide pratiche. In realtร , sono tre capitoli della stessa domanda: cosa succede quando la tecnologia smette di essere un โ€œmezzoโ€ e diventa uno โ€œstratoโ€ della realtร ? Uno strato che ci avvolge, ci legge, ci anticipa, ci indirizza. E che, proprio per questo, va capito prima ancora che usato.

Il primo punto รจ semplice e scomodo: non stiamo vivendo unโ€™ennesima ondata di innovazione. Stiamo attraversando un cambio di postura dellโ€™umano. Il digitale non รจ piรน un luogo separato (il web, lโ€™app, la piattaforma). รˆ un sistema nervoso diffuso fatto di sensori, modelli, agenti, edge, interfacce spaziali. Una โ€œintelligenza invisibileโ€ che diventa infrastruttura del quotidiano, mentre noi continuiamo a raccontarcela come una serie di prodotti e feature.

Da qui nasce โ€œPelle Digitaleโ€: un tentativo di dare un nome alla convergenza tra AI e mondo fisico, e di ragionare sul prezzo (e sul valore) di questa simbiosi. Perchรฉ se la tecnologia migra โ€œdalla tasca alla pelleโ€, cambiano le regole dellโ€™esperienza, della percezione, della relazione e del potere. Non รจ un libro sulle tendenze: รจ una mappa per non subire lo shift.

Il secondo punto รจ operativo: se lโ€™AI diventa una componente strutturale, allora serve una scelta di architettura. E la scelta non รจ solo tecnica: รจ politica, economica, culturale. โ€œAI localeโ€ significa, prima di tutto, riprendersi controllo su dati, costi, personalizzazione e continuitร  operativa. รˆ una forma di sovranitร  digitale: non delegare tutto al cloud per abitudine, ma decidere dove vive la tua intelligenza, con quali vincoli, con quali garanzie.ย 

รˆ il senso della โ€œGuida completa a LocalAI, LocalAGI e LocalRecallโ€: un percorso pratico per costruire un ecosistema privato (LLM, memoria, agenti) su hardware consumer, con strumenti open-source e API compatibili. Non รจ un manuale โ€œda laboratorioโ€: รจ una guida pensata per chi vuole capire davvero cosa sta installando e perchรฉ, e per chi vuole passare dalla demo al sistema.

Il terzo punto รจ lโ€™ultimo miglio: quando lโ€™AI smette di essere solo conversazione e diventa azione. Qui entrano gli agenti autonomi e la nuova categoria degli โ€œassistenti che fanno coseโ€: non solo risposte, ma task, workflow, automazioni, verifiche, iterazioni. โ€œOpenClaw: La Guida Completa allโ€™Assistente AI Personaleโ€ nasce per spiegare come funziona (davvero) un agente che interagisce con sistema operativo, browser e strumenti quotidiani, e soprattutto come lo si governa in sicurezza.

Se devo sintetizzare il filo rosso, รจ questo: stiamo costruendo un mondo in cui il digitale diventa ambiente. Un ambiente puรฒ essere accogliente o ostile. Puรฒ amplificare autonomia o erodere libertร . Puรฒ rendere le persone piรน capaci o piรน dipendenti. E la differenza la fanno design, governance e responsabilitร .

Per questo i tre libri, scritti nel primo trimestre del 2026, possono essere letti come una sequenza naturale, dal senso allโ€™implementazione:

  1. โ€œPelle Digitaleโ€ per capire il contesto: cosa sta succedendo al rapporto tra corpo, spazio, interfacce e intelligenza.
  2. โ€œLocalAIโ€ per costruire la base: unโ€™infrastruttura AI privata (inferenza, memoria, agenti) sotto il tuo controllo.
  3. โ€œOpenClawโ€ per passare allโ€™azione: un assistente agentico, con architettura modulare e una disciplina di sicurezza โ€œprima dei superpoteriโ€.

E se invece vuoi una lettura โ€œper ruoloโ€, ecco tre percorsi possibili.

Se guidi unโ€™azienda, un team, un prodotto: parti da โ€œPelle Digitaleโ€ per mettere ordine nelle implicazioni (attenzione, opacitร , relazioni aumentate, umanesimo aumentato) e poi scendi su LocalAI per capire cosa significa progettare sistemi AI sostenibili, non solo esperimenti.

Se sei tecnico (dev, data, IT, security): parti da LocalAI per costruire stack, costi e privacy; poi OpenClaw per capire come si traduce lโ€™AI in agenti โ€œoperativiโ€ e quali sono i rischi reali quando un modello puรฒ toccare file, browser e credenziali.

Se sei curioso e vuoi un quadro completo: parti da โ€œPelle Digitaleโ€, ma tieni LocalAI e OpenClaw come โ€œlaboratoriโ€: ti aiutano a trasformare concetti in oggetti, e oggetti in pratiche.

Il punto, per me, non รจ aggiungere contenuti al rumore. รˆ offrire tre strumenti di orientamento: una mappa concettuale, una guida infrastrutturale, una guida agentica. Perchรฉ la vera domanda non รจ โ€œcosa puรฒ fare lโ€™AI?โ€. La domanda รจ โ€œche tipo di mondo stiamo costruendo quando la rendiamo ovunque?โ€.

Interfacce Neurali-Spaziali โ€“ Riscrivere lโ€™Interazione nellโ€™Era dello Spatial Computing

Le interfacce neurali-spaziali rappresentano una svolta epocale nellโ€™interazione uomo-macchina: uniscono lโ€™intelligenza artificiale multimodale, il computing spaziale (AR/VR) e gli input neurali o sensoriali (BCI) per fondere il digitale con il mondo fisico. Questo numero di InsideTheShift esplora come questa convergenza stia creando un nuovo patto tra il corpo umano, lo spazio che ci circonda e i sistemi intelligenti che ci assistono. Esamineremo le implicazioni di interfacce sempre piรน โ€œinvisibiliโ€ e integrate nella realtร , i collegamenti con i trend giร  trattati (dalle cognitive interfaces alla computational intuition) e come questa frontiera tecnologica stia riscrivendo le regole del design, dellโ€™accessibilitร  e della nostra esperienza quotidiana con la tecnologia.

The Shift in Focus

Nel 2024 una dimostrazione allโ€™apparenza discreta in una conferenza tech ha segnalato un cambiamento epocale: unโ€™interfaccia in realtร  aumentata controllata tramite segnali neurali anzichรฉ dispositivi fisici. Nei suoi laboratori, Meta ha mostrato un braccialetto EMG capace di leggere i minuscoli impulsi elettrici che dal cervello viaggiano verso i muscoli della mano, โ€œleggendo nel pensieroโ€ lโ€™intenzione di sfogliare o afferrare un oggetto digitale e traducendola in azione. In pratica, questo significa far scorrere un menu in AR semplicemente pensando di muovere il dito. Questa tecnologia potrebbe rendere obsoleti goffi controller fisici, ampliando il potenziale dello spatial computing fino a eliminare lโ€™intermediario tra noi e il contenuto digitale. รˆ uno scorcio di futuro in cui pensieri e gesti impercettibili interagiscono direttamente con i sistemi digitali.

Questo cambio di prospettiva โ€“ dai dispositivi esterni ai segnali interni โ€“ ridefinisce il concetto stesso di interfaccia. Cosรฌ come il Vision Pro di Apple ha introdotto al grande pubblico lo spatial computing (fondere contenuti digitali e spazio fisico in tempo reale), le tecnologie di interfaccia neurale promettono di fare un passo ulteriore. Lโ€™approccio di Apple con Vision Pro si affida a input โ€œnaturaliโ€ come lo sguardo e il gesto di pinch, mantenendoci presenti nellโ€™ambiente. Ma il salto successivo, prefigurato dalle interfacce neurali, potrebbe rendere quasi invisibile il confine tra intenzione e azione. Unโ€™interfaccia non deve piรน essere qualcosa che tocchiamo o vediamo: puรฒ diventare qualcosa che indossiamo o addirittura parte di noi. Il sistema nervoso umano stesso si sta trasformando in un dispositivo di input. In questo numero ci concentriamo su questa idea trasformativa: il design dellโ€™interazione si sta spostando sotto la pelle e tuttโ€™intorno a noi, portando concetti da fantascienza ai prototipi โ€“ e presto, nelle esperienze quotidiane.

Understanding the Shift

Lo spatial computing รจ il paradigma nascente in cui i contenuti digitali non sono confinati a uno schermo, ma si integrano senza soluzione di continuitร  con lโ€™ambiente fisico. Simon Greenwold lo definรฌ nel 2003 come โ€œinterazione umana con una macchina in cui la macchina mantiene e manipola riferimenti a oggetti e spazi realiโ€. In parole povere, il computing spaziale si riferisce a AR/VR e dispositivi ricchi di sensori che permettono ai computer di comprendere e aumentare lo spazio reale: dalle app AR sullo smartphone ai visori di mixed reality immersiva. Questa tecnologia โ€œfonde il mondo fisico e le esperienze virtuali usando unโ€™ampia gamma di tecnologieโ€, permettendo nuovi modi di interagire con le macchine e dando alle macchine la capacitร  di navigare e capire lโ€™ambiente attorno a no. Innovazioni recenti come Apple Vision Pro โ€“ che Apple significativamente chiama un โ€œcomputer spazialeโ€ โ€“ evidenziano questo cambiamento: le interfacce non sono piรน solo finestre (schermi) attraverso cui guardiamo, ma spazi dentro cui viviamo.

In parallelo, abbiamo le interfacce neurali โ€“ spesso sinonimo di interfacce cervello-computer (Brain-Computer Interface, BCI) โ€“ che collegano il sistema nervoso umano ai computer. Queste vanno da impianti invasivi (come il chip Neuralink di Elon Musk, o il celebre Utah array usato nelle neuroscienze) a wearable non invasivi (come fasce EEG o braccialetti EMG). In tutti i casi, captano segnali bioelettrici (onde cerebrali, impulsi muscolari, ecc.) e li traducono in comandi interpretabili dalle macchine. Sebbene i BCI siano nati nei laboratori di ricerca e in ambito clinico, oggi li vediamo spingersi verso applicazioni consumer. Una distinzione chiave รจ che le interfacce non invasive, che non richiedono chirurgia, sono al centro delle applicazioni mainstream. Ad esempio, il prototipo di bracciale neurale di Meta utilizza sensori EMG sul braccio per rilevare i segnali elettrici dei movimenti muscolari intenzionati dal cervello, senza bisogno di impianti nรฉ addirittura di telecamere. In sostanza, ascolta i segnali nervosi che il cervello invia giร  alla mano. Questa tecnologia si basa su decenni di ricerche BCI che hanno dimostrato la possibilitร  di operare computer con il solo pensiero: dai primi esperimenti in cui scimmie controllavano bracci robotici, fino a pazienti umani che muovevano cursori sullo schermo con la mente. Oggi, sensori migliorati e algoritmi di AI per il decoding stanno aumentando la precisione, rendendo possibile usare tali input neurali nelle interfacce di tutti i giorni. Come ha osservato James Landay dello Stanford HAI, ci aspettiamo โ€œmodelli piรน grandi e multimodaliโ€ con nuove capacitร  entusiasmanti โ€“ e interpretare segnali neurali รจ intrinsecamente una sfida multimodale (che combina elaborazione del segnale, visione artificiale per il contesto, comprensione del linguaggio, ecc.). La convergenza di questi trend prepara il terreno per le interfacce neurali-spaziali.

Interfacce neurali-spaziali รจ dunque ciรฒ che otteniamo allโ€™incrocio di questi due ambiti: ambienti di spatial computing che possiamo controllare โ€“ o che si adattano โ€“ tramite input neurali. Questa convergenza oggi รจ possibile perchรฉ lโ€™AI รจ divenuta abile nel fondere flussi multipli di dati โ€“ quella che chiamiamo AI multimodale. Gli avanzati sistemi di AI attuali sanno analizzare in parallelo dati visivi, comandi vocali e segnali biometrici, trovandovi schemi e significati. Ad esempio, un sistema di AI potrebbe prendere segnali EEG da un visore, dati di eye-tracking da un display AR e informazioni sul contesto ambientale dellโ€™utente, sintetizzando il tutto per inferire cosa lโ€™utente desidera o di cosa ha bisogno. Aumenta cosรฌ in modo esponenziale la larghezza di banda della comunicazione tra umano e macchina. Invece di affidarci a un singolo canale (come solo il tocco o solo la voce), ne abbiamo molti aperti: segnali cerebrali, gesti, sguardo, voce e contesto ambientale simultaneamente. La fusione dei BCI con AR/VR, come osservano i ricercatori su Frontiers in Human Neuroscience, โ€œpuรฒ fornire canali di comunicazione aggiuntivi aumentando la banda dellโ€™interazione umano-AR/VRโ€, sia attraverso comandi attivi che tramite monitoraggio passivo dello stato dellโ€™utente. In altre parole, le interfacce neurali-spaziali promettono interazioni piรน ricche e naturali. Un utente immerso in unโ€™esperienza di spatial computing potrebbe impartire un comando senza muovere un dito, e al contempo il sistema potrebbe contemporaneamente percepire il carico cognitivo o lo stato emotivo dellโ€™utente e adattarsi di conseguenza. In pratica, stiamo insegnando ai computer a cogliere lโ€™atmosfera โ€“ e a leggere lโ€™utente โ€“ allo stesso tempo.

The Core

Al cuore di questo cambiamento vi รจ un nuovo tipo di simbiosi uomo-macchina. Spesso parliamo di interfacce โ€œnaturaliโ€ o โ€œsenza soluzione di continuitร โ€ โ€“ ebbene, le interfacce neurali-spaziali promettono proprio questo, cancellando le cuciture tra il nostro corpo, lโ€™ambiente e il sistema computazionale. Lโ€™interfaccia non รจ piรน un oggetto distinto (uno schermo, una tastiera, un pulsante); si dissolve nel mondo intorno a noi e dentro di noi. Nel numero #7 di InsideTheShift โ€“ Designed to be Lived abbiamo esplorato il passaggio โ€œda interfacce pensate per essere guardate a quelle progettate per essere vissuteโ€, evidenziando come gli strati digitali possano coesistere con la realtร  fisica anzichรฉ farle concorrenza. Le interfacce neurali-spaziali incarnano questa filosofia: la progettazione dello spazio diventa progettazione dellโ€™interfaccia, e il corpo umano diventa un elemento attivo del sistema. Stiamo passando โ€œda interfacce basate su schermo a esperienze prive di interfaccia, incorporate nello spazioโ€, come descrive un lavoro accademico. I confini tra utente e computer sfumano โ€“ la nostra intenzione diventa input, e lโ€™ambiente intorno a noi diventa la tela per lโ€™output.

Riflettiamo su cosa significhi tutto ciรฒ per il design dellโ€™interazione. Anzichรฉ cliccare menu o toccare icone, potremmo semplicemente guardare un oggetto in AR e pensare โ€œapriโ€ โ€“ e quello si apre. Invece di controllare un avatar virtuale con joystick, potrebbe essere il nostro sistema nervoso e i biosensori a guidarlo: il nostro livello di stress, misurato via EEG e frequenza cardiaca, potrebbe modulare in tempo reale la difficoltร  di un videogioco; i movimenti oculari potrebbero pilotare un drone virtuale in modo naturale come girare lo sguardo. In sostanza, lโ€™intenzione diventa il nuovo click. รˆ unโ€™estensione radicale di quanto discusso nel numero #2 di InsideTheShift โ€“ Cognitive Interfaces, dove lโ€™AI iniziava a interpretare lโ€™intento dellโ€™utente dal linguaggio naturale e dal contesto. Ora quella interpretazione si estende ai segnali neurali e fisiologici. Lโ€™unitร  di interazione non รจ piรน il movimento di un mouse o il tap su uno schermo โ€“ รจ una combinazione di sguardo, pattern di onde cerebrali, micro-movimenti muscolari e parole pronunciate, tutti orchestrati insieme. Stiamo avvicinandoci a ciรฒ che InsideTheShift #13 ha descritto come Computational Intuition: interfacce cosรฌ intelligenti da capire ciรฒ che vogliamo senza comandi espliciti, sfruttando segnali sottili e un vasto contesto. Unโ€™interfaccia neurale-spaziale dotata di AI multimodale puรฒ sviluppare una sorta di sesto senso riguardo allโ€™utente โ€“ unโ€™intuizione computazionale che anticipa bisogni o rileva problemi (ad esempio notando dai segnali cerebrali un calo di attenzione o un sovraccarico, e offrendo aiuto in modo proattivo).

Fondamentalmente, questo nuovo paradigma ridefinisce la relazione tra umano e macchina. Non รจ piรน un modello dellโ€™utensile (dove diciamo esplicitamente al computer cosa fare), bensรฌ un modello di partnership. Lโ€™interfaccia diventa unโ€™estensione dellโ€™utente. In effetti, quando ben realizzata, lโ€™interfaccia quasi scompare. Mark Weiser, pioniere dellโ€™ubiquitous computing, disse notoriamente che โ€œle tecnologie piรน profonde sono quelle che scompaionoโ€ฆ si integrano nel tessuto della vita quotidiana fino a diventare indistinguibili da essa.โ€ Le interfacce neurali-spaziali puntano esattamente a questo ideale. I tuoi occhiali AR, i tuoi auricolari intelligenti o i futuri cerchietti neurali dovrebbero sembrare parte naturale dei sistemi di feedback del tuo corpo โ€“ quotidiani quanto la vista o la propriocezione. Nel numero #5 di InsideTheShift โ€“ Integrated Intelligence, abbiamo immaginato unโ€™intelligenza intessuta nei nostri ambienti e prodotti. Ora vediamo quella visione prendere forma: unโ€™intelligenza integrata non solo attorno a noi, ma dentro di noi (attraverso link neurali) e tra noi e il mondo (attraverso il computing spaziale). Il nocciolo di questo cambiamento รจ un nuovo patto uomo-macchina: noi concediamo alla tecnologia un accesso piรน intimo a noi stessi (i nostri dati neurali, il nostro spazio fisico) e in cambio essa fornisce assistenza che si percepisce quasi come unโ€™estensione della nostra mente e dei nostri sensi. รˆ una visione affascinante, che puรฒ potenziare le capacitร  umane e forse amplificare la nostra cognizione โ€“ in pratica la realizzazione high-tech dellโ€™antico sogno di fondere senza soluzione di continuitร  mente, corpo e strumento.

The Broader Shift

Gli effetti a cascata delle interfacce neurali-spaziali potrebbero essere vastissimi. Prima di tutto, cโ€™รจ il potenziale per unโ€™enorme accessibilitร  e inclusivitร . Per persone con mobilitร  limitata o disabilitร , il poter controllare dispositivi con segnali neurali รจ rivoluzionario. Chi non puรฒ usare le mani non sarebbe piรน escluso da unโ€™esperienza di spatial computing โ€“ potrebbe navigare un ambiente aumentato o comunicare tramite unโ€™interfaccia cerebrale. La stessa tecnologia di interfaccia neurale โ€œpotrebbe trasformare lโ€™accessibilitร  della tecnologiaโ€, nota XR Today, permettendo a persone con paralisi o disabilitร  motorie di interagire con contenuti digitali in modo avanzato. Un visore che legge i movimenti oculari, o un impianto cerebrale che traduce i pensieri in movimenti di un cursore, possono aprire il mondo informatico a chi finora gli strumenti tradizionali lโ€™hanno precluso. In senso piรน ampio, man mano che le interfacce diventano piรน adattive (ad es. regolando la dimensione dei font o le modalitร  di input basandosi sui feedback neurali dellโ€™utente), la tecnologia potrร  personalizzarsi sui bisogni e sul contesto di ciascuno.

Da grandi poteri derivano grandi responsabilitร  โ€“ e rischi. Lโ€™idea di una tecnologia che attinge direttamente ai nostri cervelli e corpi solleva questioni cruciali. Una รจ la privacy: i dati neurali sono estremamente personali. Se i nostri dispositivi possono letteralmente leggere i nostri pensieri (anche solo a livello di intenzioni o stati emotivi), come proteggere quella privacy mentale? Gli studiosi hanno giร  iniziato a discutere di โ€œneurodirittiโ€ โ€“ il diritto alla libertร  cognitiva e alla riservatezza dei dati cerebrali. Il mondo medico e gli eticisti avvertono che man mano che i BCI entrano nellโ€™uso reale, dovremo prevenire usi impropri dei dati neurali. Cโ€™รจ chi teme un futuro in cui le pubblicitร  si adattino alle reazioni inconsce, o in cui i datori di lavoro monitorino lโ€™attenzione dei dipendenti tramite metriche cerebrali. Questi scenari rendono fondamentale integrare da subito la privacy by design nelle interfacce neurali. Un altro tema รจ la sicurezza: unโ€™interfaccia cerebrale violata da un hacker sarebbe lโ€™incubo cibernetico per eccellenza. Anche il caso piรน semplice di interfacce non invasive โ€“ poniamo un visore AR che influenza i tuoi sensi โ€“ va protetto da manipolazioni malevole. Dobbiamo poi considerare lโ€™etica del design: affidando piรน agenzia allโ€™AI (per esempio un sistema che auto-regola lโ€™ambiente o filtra informazioni in base allo stato mentale rilevato), chi mantiene il controllo? Eliminare tastiere e schermi puรฒ potenziare gli utenti, ma anche disorientare o ridurre la scelta consapevole se gestito male. Mantenere la sovranitร  umana in questo circuito รจ fondamentale โ€“ un tema che abbiamo toccato in diversi numeri passati. Il sistema deve ampliare, non prevaricare, le nostre intenzioni.

Dobbiamo anche considerare i cambiamenti sociali e culturali. Man mano che la tecnologia si sposta sotto la pelle, il confine tra ciรฒ che รจ โ€œumanoโ€ e ciรฒ che รจ โ€œmacchinaโ€ si fa sfumato, ponendo questioni di accettazione. Le persone saranno disposte a indossare dispositivi neurali quotidianamente? I segnali iniziali sono incoraggianti: la societร  sta gradualmente normalizzando i wearable come gli smartwatch che tracciano costantemente le nostre biometrie, e gli occhiali AR sono sul punto di una piรน ampia adozione. Tuttavia, qualsiasi passo falso (per esempio uno scandalo legato alla privacy o un dispositivo che causa danni) potrebbe innescare reazioni pubbliche negative, simili alla vicenda di Google Glass. Dunque design e implementazione dovranno essere human-centered e trasparenti, per guadagnare fiducia. Sul piano culturale, potremmo vedere nuove forme di espressione digitale โ€“ immaginiamo condividere uno โ€œstato neuroโ€ oppure designer che creano esperienze responsive ai pattern cerebrali collettivi di una folla. Arte, intrattenimento, istruzione โ€“ tutti potrebbero trasformarsi. Una classe, ad esempio, potrebbe usare la mixed reality con BCI passivi per capire quando gli studenti sono confusi o annoiati e adeguare dinamicamente la lezione. I luoghi di lavoro potrebbero impiegare interfacce spaziali per potenziare la collaborazione, con mediatori AI che percepiscono quando qualcuno ha unโ€™idea sulla punta della lingua ma esita a esprimerla. Queste possibilitร  si ricollegano al concetto trattato in InsideTheShift #10 Temporal Interfaces โ€“ la tecnologia che riconfigura come viviamo il tempo e i ritmi. Le interfacce neurali-spaziali potrebbero, ad esempio, aiutarci a gestire i nostri tempi cognitivi (ricordandoci di fare una pausa quando viene rilevata stanchezza mentale, o catturando idee nel momento in cui emergono). Potrebbero registrare flussi di esperienza per rivederli in seguito (una sorta di memoria esternalizzata), mescolando ulteriormente passato e presente nel nostro modo di lavorare. In sintesi, lo shift piรน ampio ci porta verso un mondo in cui tecnologia e vita sono intrecciate piรน che mai, con un potenziale sia di empowerment sia di sfide nel ridefinire i confini.

Whatโ€™s Next

Guardando al futuro, il percorso delle interfacce neurali-spaziali probabilmente si dispiegherร  per fasi. Nel breve termine vedremo piรน esperimenti e prodotti pionieristici che lasciano intravedere il possibile. Aziende come Meta hanno segnalato che lโ€™AR senza controller รจ nei loro piani (gli occhiali Orion, attesi nei prossimi anni, puntano a basarsi su input neurali da polso). Il visore Galea di OpenBCI โ€“ che integra EEG, EMG, EDA e altro in headset VR/XR di fascia alta โ€“ sta entrando in beta e probabilmente stimolerร  una serie di ricerche e sviluppo indie. Possiamo aspettarci che laboratori accademici e startup affineranno gli algoritmi per decodificare i segnali neurali, usando modelli di AI avanzati (potenzialmente arrivando a integrare architetture stile large language model per interpretare i complessi dati cerebrali). Sarร  cruciale la collaborazione tra discipline: neuroscienziati, esperti di AI, designer AR ed eticisti che lavorano assieme per risolvere gli ostacoli tecnici e definire linee guida. Allโ€™orizzonte, forse fra 5-10 anni, potremmo vedere occhiali AR mainstream (da Apple, Meta, Snapchat o altri) integrare discretamente capacitร  di interfaccia neurale โ€“ magari iniziando con semplici elettrodi EMG o EEG incorporati in fascette o auricolari. Potrebbe essere qualcosa di sottile, come il tuo auricolare AR che legge lโ€™attivitร  cerebrale per capire se stai prestando attenzione a una riunione virtuale. Proprio come gli assistenti vocali sono passati da curiositร  a funzionalitร  standard degli smartphone, gli input neurali potrebbero fare il salto da sperimentali a attesi.

Standard ed etica dovranno tenere il passo rapidamente. Lโ€™IEEE, ad esempio, ha lanciato unโ€™iniziativa sullo Spatial Computing per il Metaverso focalizzandosi su HMI (interfacce uomo-macchina) e โ€œbrain-machine interface, occhiali AR e tecnologie HMDโ€, con lโ€™obiettivo di sviluppare linee guida per compatibilitร  e sicurezza degli utenti. Gli enti regolatori potrebbero iniziare a redigere normative specifiche sul neurotech (potremmo vedere qualcosa di simile al GDPR ma per i dati cerebrali). Sul fronte tecnico, per lโ€™adozione sarร  fondamentale risolvere le questioni di comfort dei sensori e calibrazione โ€“ nessuno vuole unโ€™interfaccia che richieda gel appiccicosi sul cuoio capelluto o continue ricalibrazioni. Dobbiamo quindi aspettarci progressi in termini di indossabilitร  (dispositivi piรน comodi ed eleganti) e usabilitร  (auto-calibrazione, personalizzazione tramite AI). Un altro trend probabile: le interfacce ibride. Anzichรฉ puntare su un solo canale, i futuri sistemi combineranno input cerebrale con eye-tracking, voce e gesto nel mix che funziona meglio. I primi studi sugli utenti indicano giร  che lโ€™interazione multimodale migliora lโ€™affidabilitร  โ€“ ad esempio, se il segnale cerebrale รจ rumoroso, uno sguardo veloce o un battito di ciglia di conferma possono disambiguare lโ€™intenzione.

A piรน lungo termine, il confine tra potenziare e aumentare potrebbe sfumare. Oggi le interfacce neurali mirano ad assistere o ripristinare (aiutare una persona disabile a comunicare, o permettere a un utente AR di controllare i menu piรน velocemente). Ma gli sviluppi futuri potrebbero spingersi nel campo del miglioramento cognitivo โ€“ usare queste interfacce per potenziare effettivamente memoria, attenzione o altre funzioni mentali attraverso unโ€™integrazione stretta con lโ€™AI. Ciรฒ solleva questioni profonde (ed echi da fantascienza): se avessimo un co-processore AI per il cervello, cosa significherebbe per il pensiero individuale e la creativitร ? Sebbene tali scenari siano speculativi, non sono piรน pura fantasia. Potremmo davvero vedere prime forme di โ€œprotesi digitaliโ€ per la mente nella nostra vita. Immaginiamo una lente a contatto AR che non solo mostri informazioni ma stimoli determinati pattern neurali per migliorare apprendimento o umore. Il passo ancora successivo potrebbe essere interfacce bi-direzionali: non solo leggere lโ€™attivitร  neurale ma anche scriverla (alcuni laboratori giร  lavorano su loop di neurofeedback e perfino protesi visive rudimentali che inviano immagini al cervello). Le implicazioni sarebbero immense โ€“ dal curare la depressione con stimolazione neurale su misura, fino forse un giorno a condividere pensieri direttamente da cervello a cervello. Ognuno di questi passi richiederร  che la societร  valuti attentamente benefici e rischi. Ma se la storia insegna qualcosa, il momentum del progresso tecnologico รจ difficile da rallentare. Le interfacce neurali-spaziali stanno arrivando, gradualmente ma inesorabilmente, e rappresentano una frontiera che dobbiamo approcciare con entusiasmo ma anche con prudenza.

Takeaways

  • Le interfacce neurali-spaziali fondono AI multimodale, computing spaziale (AR/VR) e input neurali, creando interazioni digitali immersive guidate da gesti sottili e segnali cerebrali.

  • Lโ€™interfaccia diventa โ€œinvisibileโ€: il corpo e lo spazio fisico sono ora parte integrante del sistema di interazione. Intenzioni, sguardi e stati mentali possono attivare comandi senza bisogno di touch screen o controller.

  • Queste tecnologie promettono maggiore accessibilitร : persone con disabilitร  motorie potranno controllare interfacce complesse col pensiero o piccoli movimenti, aprendo nuovi orizzonti di inclusione

  • Le interfacce neurali-spaziali abilitano esperienze adattive e contestuali: sistemi in grado di โ€œpercepireโ€ il carico cognitivo o lโ€™emozione dellโ€™utente e modificare lโ€™esperienza di conseguenza (ad es. adattando la difficoltร  di un compito in tempo reale).

  • Servono perรฒ approcci ethics-first: tutela dei dati neurali personali (neurorights), sicurezza contro abusi o hacking, e design centrato sullโ€™uomo per mantenere controllo e fiducia dellโ€™utente.

  • A breve vedremo piรน dispositivi wearable con sensori neurali (braccialetti EMG, cerotti EEG) integrati in occhiali AR o auricolari. La multimodalitร  (voce+sguardo+BCI) sarร  fondamentale per affidabilitร  e usabilitร 

  • Standardizzazione e linee guida (es. iniziative IEEE) saranno cruciali per garantire compatibilitร  hardware/software e un ecosistema aperto e sicuro

  • Nel lungo termine, le interfacce neurali potrebbero evolvere in potenziamenti cognitivi e comunicazione diretta cervello-cervello, ponendo sfide senza precedenti ma ampliando le possibilitร  umane.

  • Questo shift prosegue temi giร  trattati: dalle cognitive interfaces (interfacce AI conversazionali) alle integrated intelligence (AI diffusa nellโ€™ambiente) fino alla computational intuition (sistemi che intuiscono bisogni). Le interfacce neurali-spaziali sono la naturale estensione di questi trend.

  • Siamo allโ€™alba di un nuovo patto tra uomo e tecnologia: piรน profondo, pervasivo e intimo. Il corpo diventa la nuova periferica, lo spazio il nuovo schermo, lโ€™intelligenza artificiale il nuovo intermediario. Sta a noi guidarne lo sviluppo in modo responsabile.

The Shift Continues

La storia della tecnologia รจ una storia di distanze che si accorciano sempre di piรน โ€“ tra noi e i nostri strumenti, tra le nostre intenzioni e la loro realizzazione. Le interfacce neurali-spaziali sono forse il passo piรน audace in questo viaggio, nel quale molta della frizione residua viene eliminata. In questo diciassettesimo numero di InsideTheShift abbiamo visto come fili un tempo separati โ€“ AI, AR, wearables, tecnologie neurali โ€“ si stiano intrecciando in un nuovo tessuto esperienziale. รˆ un tessuto in cui digitale e fisico, mente e macchina si interconnettono. Ma, come in ogni grande tessitura, siamo anche i tessitori. Le scelte di design, le decisioni etiche e i salti creativi che compiamo ora daranno forma a come questo arazzo si dispiegherร . Ci darร  potere e includerร  tutti, o ci avvolgerร  in nuovi dilemmi? Probabilmente entrambe le cose, e il nostro compito รจ orientarlo verso la prima possibilitร .

Ripensando alle edizioni precedenti โ€“ dalle interfacce cognitive, alle dimensioni temporali, fino ai sistemi intuitivi โ€“ emerge un fil rouge chiaro: la spinta verso una tecnologia sempre piรน human-centric, che si adatta a noi invece di costringerci ad adattarci ad essa. Le interfacce neurali-spaziali sono un apice di questo trend, ma al contempo un nuovo inizio. Ci spingono a ridefinire concetti fondamentali: cosa significa comunicare quando persino il silenzio parla (attraverso segnali cerebrali)? Cosa significa progettare quando lโ€™โ€œinterfacciaโ€ รจ ovunque e in nessun luogo? Come preservare dignitร  e autonomia umana quando persino i nostri pattern neurali potrebbero far parte del flusso di input/output?

Sono domande impegnative, ma affrontarle con luciditร  รจ proprio ciรฒ che entusiasma la comunitร  di innovatori e pensatori che InsideTheShift riunisce. Lo shift che stiamo vivendo non รจ un singolo balzo, ma unโ€™evoluzione costante โ€“ una che richiede curiositร , spirito critico e visione in egual misura.

Man mano che questo shift continua, vi invito a immaginarne le possibilitร  senza perdere di vista i principi. Figuriamoci un anziano che ritrova autonomia grazie a un assistente domestico controllato col pensiero; un gruppo di amici in cittร  diverse che condivide uno spazio di realtร  mista che reagisce al loro umore collettivo; o una AI che non solo risponde alle tue domande ma percepisce lโ€™istante stesso in cui ne stai formulando una. Futuri del genere sono a portata di mano. Sta a noi guidare questa tecnologia affinchรฉ accresca la nostra umanitร , e non la offuschi.

La convergenza fra interfacce neurali e spatial computing sta riscrivendo il linguaggio dellโ€™interazione. Un linguaggio che diventerร  intimamente personale, riccamente multimodale e, si spera, universalmente abilitante. Insieme, come sempre, continueremo a decifrare questo linguaggio e a scriverne il futuro. Lo shift va avanti โ€“ e tutti noi, in un certo senso, ne siamo gli autori.

DeepMind Genieย 3: svolta epocale per lโ€™addestramento robotico?

DeepMind ha presentato Genie 3, un modello generativo di world simulation che, dato un prompt testuale (o unโ€™immagine), costruisce in tempo reale un ambiente virtuale interattivo e persistente. In pratica, digitando una descrizione si materializza un mondo navigabile, non il solito video di pochi secondi, ma uno spazio โ€œvideoludicoโ€ esplorabile a piacimento.

La cosa si fa davvero interessante unendolo a SIMA, un agente AI generalista in grado di apprendere compiti in una varietร  di giochi 3D: il primo puรฒ generare infiniti scenari di training, il secondo puรฒ imparare al loro interno. Questa combinazione apre prospettive inedite per la robotica, il sim-to-real e la generalizzazione dellโ€™intelligenza artificiale.

Dalle parole ai mondi 3D interattivi

La maggior parte dei generatori di immagini o video AI oggi produce contenuti brevi e non interattivi. Genieย 3, invece, fa un salto di categoria: trasforma un input testuale in un mondo tridimensionale navigabile in prima persona, con coerenza fisica e visiva su orizzonti temporali ben piรน lunghi del classico clip di 8 secondi. Digitando una descrizione, ad esempio โ€œun sentiero di lava ai piedi di un vulcano attivoโ€ , il sistema renderizza una scena 3D a 24 frame al secondo e risoluzione 720p, in cui lโ€™utente puรฒ muoversi liberamente con controlli da videogame.

Lโ€™ambiente reagisce in tempo reale ai movimenti e ai comandi: se giri la telecamera o avanzi, il panorama cambia fluidamente; se aggiungi via testo un evento (โ€œinizia a piovereโ€), Genie 3 modifica al volo le condizioni meteo nella simulazione. In demos, il team DeepMind ha mostrato scenari estremamente diversi tra loro, dallโ€™aspro paesaggio vulcanico a una costa flagellata da un uragano, fino a un villaggio incantato di funghi giganti โ€“ tutti generati e manipolabili istantaneamente dallโ€™AI.

Quello che rende questi mondi sorprendenti รจ il livello di coerenza spazio-temporale: oggetti e paesaggi rimangono stabili anche cambiando inquadratura o tornando in un luogo giร  visitato, grazie a una sorta di โ€œmemoriaโ€ interna che si estende fino a circa un minuto. In altre parole, Genieย 3 ricorda dove ha messo le montagne o gli alberi, evitando salti logici o apparizioni/disparizioni incoerenti man mano che lโ€™utente esplora.

Un aspetto particolarmente interessante รจ la possibilitร  di partire non solo da testo ma anche da immagini. I ricercatori hanno mostrato che Genieย 3 puรฒ essere iniziato con un singolo fotogramma (ad esempio la foto di un dipinto famoso) e โ€œgonfiareโ€ quella scena in un ambiente tridimensionale navigabile.

Immaginate di scattare una foto o dipingere un bozzetto, e poi poterci entrare dentro: ad esempio camminare tra i cipressi sullo sfondo di un quadro o esplorare lโ€™interno di una concept art. Questo apre possibilitร  creative enormi. Un artista puรฒ dipingere uno scenario surreale e poi usarlo come livello di gioco; un designer puรฒ importare schizzi o foto di riferimento e ottenere uno stage 3D immediatamente pronto da esplorare. Allo stesso modo, un filmmaker che oggi si scontra col โ€œmuro degli 8 secondiโ€ nei video generativi, con Genieย 3 vede crollare quel limite: essendo un world model persistente, permette di scegliere inquadrature e traiettorie di camera a piacere, estendendo le sequenze fin dove lo consentono la fantasia (e il budget computazionale) senza degradare subito in noise. In sintesi, Genieย 3 trasforma la generazione AI da contenuto passivo a esperienza interattiva: non piรน immagini da guardare, ma mondi vivi da esplorare. รˆ come se dessimo un tovagliolo a Bobย Ross per uno schizzo estemporaneo e subito dopo potessimo fare due passi dentro il paesaggio che ha dipinto.

Dal punto di vista tecnico, raggiungere questo risultato non รจ banale. Genie 3 utilizza unโ€™architettura auto-regressiva simile a quella dei grandi modelli linguistici, generando ogni nuovo frame in base ai frame precedenti e allโ€™azione corrente dellโ€™utente.ย Questo significa garantire coerenza frame-to-frame senza perรฒ appoggiarsi a unโ€™esplicita modellazione 3D sottostante: a differenza di approcci come NeRF o gaussian splatting che costruiscono una mappa geometrica per avere consistenza, qui la soliditร  della scena โ€œemergeโ€ dallโ€™aver previsto correttamente la sequenza di pixel nel tempo. รˆ un approccio piรน flessibile, perchรฉ consente di alterare liberamente il mondo in corso dโ€™opera (aggiungere oggetti, cambiare ambiente) senza dover rigenerare un intero modello geometrico; tuttavia รจ computazionalmente pesante, dato che il modello deve โ€œricordareโ€ e ri-renderizzare ad ogni frame tutto ciรฒ che conta della traiettoria passata. DeepMind sottolinea che Genieย 3 rappresenta il primo modello di world generation capace di interazione in tempo reale, migliorando al contempo realismo e coerenza rispetto al precedente Genieย 2. In appena otto mesi, infatti, il salto da Genie 2 a Genie 3 รจ notevole: Genie 2 (fine 2024) manteneva la scena per ~10 secondi prima di โ€œdimenticareโ€ e rigenerare incoerentemente, mentre Genie 3 regge diversi minuti di esplorazione continua prima che la memoria svanisca.ย Inoltre Genieย 2 richiedeva di fornirgli a priori la sequenza di azioni (movimenti) che lโ€™utente avrebbe fatto, poi generava il video risultante; Genieย 3 invece reagisce live agli input dellโ€™utente come un vero motore grafico. Siamo insomma davanti a un prototipo di motore generativo per mondi virtuali. Google DeepMind รจ probabilmente il primo laboratorio AI a spingersi cosรฌ avanti su questo fronte, considerandolo un tassello strategico verso lโ€™AGI (Artificial General Intelligence).

Naturalmente, siamo ancora in fase di ricerca (Genieย 3 per ora รจ distribuito solo come anteprima limitata a pochi accademici e creator selezionati). Eppure le capacitร  dimostrate, per quanto imperfette, hanno giร  fatto gridare a molti che โ€œquesto รจ il piรน vicino che siamo arrivati allโ€™Holodeck di Star Trekโ€. Prima di discutere sfide e limiti, vediamo perchรฉ un sistema come Genieย 3 potrebbe rivoluzionare lโ€™addestramento degli agenti AI e dei robot, e come si inserisce nelle tendenze piรน ampie dellโ€™informatica spaziale e dellโ€™UX nel mondo dellโ€™AI.

Un nuovo terreno di gioco per agenti AI e robotica

DeepMind definisce Genieย 3 un general purpose world model, ovvero un modello capace di simulare dinamicamente ambienti diversi utilizzando la sua comprensione del mondoย Perchรฉ questo conta? Perchรฉ fornisce alle intelligenze artificiali un campo di addestramento illimitato e sicuro. Invece di imparare in condizioni reali (costose o rischiose) o su dati statici, gli agenti possono esercitarsi in compiti complessi dentro simulazioni realistiche e sempre nuove. In altre parole, i world model come Genie offrono allโ€™AI โ€œmondi-giocattoloโ€ dove sperimentare, fallire e riprovare, il tutto a velocitร  accelerata e senza causare danni nel mondo vero. Non a caso DeepMind vede questi sistemi come fondamentali sulla strada verso agenti in grado di agire nel mondo reale.

Proprio qui entra in scena SIMA, lโ€™altro pezzo del puzzle. SIMA (acronimo di Scalable, Instructable Multiworld Agent) รจ un agente AI generalista presentato sempre da DeepMind questโ€™anno, progettato per muoversi e seguire istruzioni in una vasta gamma di ambienti virtuali 3D. A differenza degli agenti specializzati in un singolo videogioco o simulazione, SIMA รจ stato addestrato su 9 giochi diversi (in collaborazione con 8 studi di videogame) piรน alcuni ambienti di ricerca, imparando centinaia di abilitร  di base โ€“ dal navigare e raccogliere oggetti fino al pilotare unโ€™astronave, ed รจ capace di capire comandi in linguaggio naturale e tradurli in azioni (mouse e tastiera virtuali). Lโ€™obiettivo non era battere record di punti, ma seguire istruzioni varie in mondi sempre diversi, un poโ€™ come farebbe un umano che prova tanti giochi nuovi.

Il risultato notevole รจ che lโ€™agente โ€œgeneralistaโ€ ha superato gli specialisti: nei test, un singolo modello SIMA addestrato su tutti e 9 i giochi ha ottenuto prestazioni migliori in ciascun gioco rispetto a modelli addestrati solo su quel gioco. Non solo โ€“ quando un agente SIMA veniva allenato su 8 giochi su 9, se la cavava quasi allo stesso livello di un agente dedicato nel 9ยฐ gioco mai visto prima. Questo รจ un fatto cruciale: indica unโ€™ottima capacitร  di generalizzazione e trasferimento delle competenze. In pratica, lโ€™AI che โ€œha visto un poโ€™ di tuttoโ€ riesce a orientarsi anche in situazioni nuove, talvolta meglio di unโ€™AI che ha grindato un solo compito in modo ossessivo. รˆ un risultato controintuitivo ma che rispecchia un principio umano: saper imparare ad imparare da contesti vari puรฒ essere piรน potente che ottimizzarsi in un singolo dominio.

Ora, se colleghiamo i puntini, lโ€™accoppiata Genie 3 + SIMA appare formidabile. Il punto di forza di Genie 3 โ€“ generare mondi sempre diversi a richiesta โ€“ รจ esattamente ciรฒ di cui hanno bisogno agenti tipo SIMA per diventare ancora piรน versatili. DeepMind stesso ha giร  iniziato a testare i due in tandem: hanno generato con Genie 3 alcuni mondi di prova e ci hanno immerso una versione recente dellโ€™agente SIMA, istruendolo a perseguire vari obiettivi allโ€™interno di quei mondi. SIMA interagiva con Genie 3 mandandogli comandi di navigazione (es. vai avanti, gira a destra, prendi lโ€™oggetto) e Genie reagiva aggiornando lโ€™ambiente, il tutto senza avere conoscenza โ€œinternaโ€ dello scopo dellโ€™agente โ€“ simula semplicemente il risultato delle sue azioni.

Il fatto notevole รจ che Genieย 3, mantenendo coerenza per minuti e supportando sequenze di azioni piรน lunghe rispetto al passato, permette ora allโ€™agente di completare compiti piรน complessi senza reset dellโ€™ambiente. DeepMind vede questa tecnologia come un ingrediente chiave verso sistemi piรน generali e infine lโ€™AGI, dove agenti simulati giocano un ruolo crescente nello sviluppo e test di capacitร  prima di applicarle al mondo reale.

Perchรฉ รจ importante per la robotica?

Oggi per addestrare robot si fa largo uso di simulazioni e di tecniche come la domain randomization: in pratica, si creano tante varianti di un ambiente (ad es. decine di cucine virtuali con colori, illuminazioni e arredi diversi) e ci si allena il robot, cosรฌ quando lo si trasferisce in una cucina reale che non ha mai visto, รจ piรน probabile che generalizzi bene senza rimanere spiazzato da un dettaglio fuori posto.

Genieย 3 porta questo concetto allโ€™estremo: invece di variare manualmente alcuni parametri in un simulatore, genera da zero mondi completamente nuovi, con fisiche, oggetti, texture e layout ogni volta differenti. Il robot quindi non impara solo su โ€œtutti i tipi di cucinaโ€, ma su ambienti che vanno ben oltre la sua missione specifica, costringendolo a sviluppare capacitร  di adattamento piรน profonde. Come ha scritto Ben Dickson, di fronte alla scarsitร  inevitabile di dati reali per addestrare robot in ogni scenario possibile, avere infiniti mondi sintetici da esplorare potrebbe consentire agli agenti di scoprire soluzioni del tutto nuove ai problemi. Non sappiamo ancora quale sarร  la killer application di Genie 3 โ€“ nemmeno DeepMind puรฒ prevederlo con certezza โ€“ ma scommette che dentro questa โ€œscatola magicaโ€ ci sia un potenziale enorme da sbloccare col giusto approccio.

Le ricadute pratiche vanno oltre il classico robot domestico. Pensiamo alle operazioni autonome in settori come logistica, manifattura, costruzioni, trasporti: poter simulare a piacere migliaia di scenari rari o pericolosi โ€“ un guasto improvviso a un macchinario, un ostacolo inatteso sul percorso di un veicolo, condizioni meteo estreme in cantiere โ€“ e addestrare agenti AI ad affrontarli, prima di metterli in campo, sarebbe di enorme aiuto. Con Genieย 3 รจ teoricamente possibile โ€mintareโ€ (coniarsi) infiniti mondi con combinazioni diverse di fattori di disturbo, molto oltre ciรฒ che si potrebbe progettare manualmente. Inoltre, il fatto che un modello generativo possa valutare il comportamento di un altro agente in simulazione (vedi SIMA) apre alla possibilitร  di usare lโ€™AI non solo per training ma anche per testing: Genie puรฒ funzionare da banco di prova per vedere dove il robot sbaglia piรน spesso, quali condizioni lo mandano in tilt, e quindi aiutare gli ingegneri a identificare le debolezze di un sistema prima che sia fuori nel mondo. DeepMind evidenzia proprio questo aspetto: Genie 3 fornisce un vasto spazio dove addestrare agenti come robot o sistemi autonomi, ma anche dove valutarne le prestazioni e sondarne i limiti in sicurezza.

Va detto che giร  oggi simulatori avanzati e digital twin vengono usati in ambito industriale, ad esempio per ottimizzare linee produttive o testare robotica mobile nei magazzini. Tuttavia, creare e mantenere a mano queste simulazioni รจ costoso e richiede aggiornamenti continui per riflettere la realtร . Un sistema come Genieย 3 lascia intravedere un futuro in cui molte di queste esperienze virtuali possano essere generate on-demand dallโ€™AI, semplicemente descrivendo la situazione desiderata. Certo, non รจ garantito che la simulazione generata sia perfettamente accurata in ogni dettaglio (anzi, come vedremo a breve, al momento non lo รจ). Ma potrebbe bastare a coprire casi โ€œlong tailโ€ difficilmente programmabili a mano.

Elon Musk ha commentato di aspettarsi giร  dallโ€™anno prossimo videogiochi generati interamente dallโ€™AI, dinamici e imprevedibili, โ€œpotrai letteralmente descrivere il gioco che vuoi e lui prenderร  vitaโ€. Al di lร  dellโ€™hype, รจ chiaro che se questa tecnologia matura, avrร  impatto anche nellโ€™industria dei videogame e della simulazione formativa: scenari unici per ogni partita, NPC (personaggi) comportamentialmente generati, missioni che si adattano sul momento. Siamo ai primissimi passi, ma Genieย 3 indica la strada verso mondi virtuali plasmati dalla creativitร  dellโ€™utente insieme allโ€™intelligenza della macchina, piรน che da un team di sviluppatori che pre-scrive tutto.

Verso lo Spatial Computing: il mondo diventa lโ€™interfaccia

La comparsa di modelli come Genie 3 si inserisce in una trasformazione piรน ampia del rapporto fra digitale e reale, quello che dall’uscita del mio libro Spatial Shift ho definito The Shift verso lo spatial computing. Per decenni abbiamo interagito con la tecnologia attraverso schermi bidimensionali: monitor, smartphone, tablet. Le informazioni stavano dietro un โ€œvetroโ€, separate dal mondo fisico. Ora quella barriera si sta dissolvendo. Come ho detto e scritto piรน volteย  โ€œlo spazio intorno a noi sta diventando lโ€™interfacciaโ€.

In altre parole, invece di portare noi verso i contenuti sullo schermo, le nuove tecnologie portano contenuti e intelligenza dentro il nostro contesto fisico. Lo spatial computing e lโ€™AI insieme fanno โ€œuscireโ€ lโ€™informazione dagli schermi, integrandola nellโ€™ambiente che viviamo. Genieย 3, pur operando ancora in un dominio virtuale su monitor, incarna perfettamente questa filosofia: prende conoscenza (da testi, immagini, dati) e la incarna in un mondo digitale concreto con cui possiamo interagire quasi fosse reale. รˆ il concetto di ambiente che prevale su quello di interfaccia: lโ€™utente non clicca bottoni su un menu, ma si muove dentro uno spazio e vive lโ€™esperienza.

Si intravede qui una convergenza con la realtร  aumentata e virtuale. Prodotti come Apple Vision Pro, Meta Quest o Magic Leap sono i primi spiragli verso un computing immersivo, in cui contenuti 3D compaiono intorno a noi integrandosi con il mondo reale. DeepMind Genieย 3 spinge in avanti il lato AI di questa equazione: mondi 3D generati a comando, personalizzati al volo.

Non รจ difficile immaginare un futuro in cui indossando un visore AR/VR si possa letteralmente โ€œspawnareโ€ ambienti tramite AI generativa: per training, per intrattenimento o per creativitร . Un tecnico potrebbe, stando nel proprio ufficio, chiedere al computer di mostrargli una ricostruzione virtuale della fabbrica in scala 1:1 e provare a interagirci; un progettista potrebbe visualizzare e modificare prototipi di veicoli o edifici come ologrammi spaziali generati dallโ€™AI. In generale, lโ€™AI unita allo spatial computing promette di far dissolvere lโ€™interfaccia fino a renderla trasparente: โ€œnon sarร  il prossimo gadget, ma il contesto il vero protagonistaโ€, come sintetizza Darunte.

Quando lโ€™intelligenza vive nello spazio intorno a noi, i flussi di lavoro possono diventare cosรฌ naturali da non accorgerci nemmeno della โ€œtecnologiaโ€, vediamo solo il compito che stiamo svolgendo, arricchito da informazioni contestuali. Lโ€™informatica ambientale (ambient computing) รจ proprio questo: intelligenza diffusa, attivata dalla nostra presenza e dalle nostre intenzioni, piรน che da click o tap su uno schermo.

Genie 3 puรฒ essere visto come un precursore di un โ€œsistema operativo spazialeโ€ generativo. Oggi genera mondi di fantasia su uno schermo, ma concettualmente ci sta dicendo che possiamo chiedere a unโ€™AI di creare ambienti completi in cui poi entriamo e compiamo azioni. รˆ una sorta di Holodeck a bassa risoluzione: uno spazio virtuale creato dallโ€™intelligenza artificiale su cui abbiamo un certo controllo. Se guardiamo avanti di qualche anno, possiamo immaginare di avere ambienti generati in real time non solo nel computer ma nelle stanze intorno a noi โ€“ proiettati via occhiali AR o tramite installazioni immersive โ€“ dove persone e agenti virtuali coesistono.

Ad esempio, potremmo mescolare ambienti reali e simulati: un robot potrebbe allenarsi metร  del tempo in VR su scenari generati, e lโ€™altra metร  spostarsi nel nostro mondo fisico, portandosi dietro lโ€™esperienza accumulata. Giร  ora alcune aziende fanno addestramento in VR per operatori (come simulatori di impianti industriali): un modello come Genie renderebbe la creazione di questi scenari molto piรน rapida e dinamica, magari anche interattiva con lโ€™utente (lo scenario che si adatta alle azioni del tirocinante in VR).

Cโ€™รจ poi lโ€™aspetto dellโ€™esperienza utente (UX) e del design in era di AI generativa. Tradizionalmente, progettare unโ€™esperienza significava definire ogni stato dellโ€™interfaccia, ogni possibile percorso utente, in modo deterministico. Se invece lโ€™ambiente o lโ€™interfaccia vengono creati on-the-fly da unโ€™AI in base a una richiesta, come si garantisce una buona UX? Si apre un nuovo campo in cui i designer dovranno definire vincoli, regole e linee guida per lโ€™output generativo, piuttosto che progettare ogni pixel.

Ad esempio, come faccio a dire a Genie 3 cosa non deve fare? Come inserisco dei punti fermi (es. un oggetto che deve assolutamente essere presente e funzionare in un certo modo) senza soffocare la creativitร  spontanea del modello? Nel contesto gaming, gli sviluppatori potrebbero voler generare livelli con Genie, ma vorranno anche controllare difficoltร , obiettivi e comportamenti dei NPC (non-player characters).

Insomma, serviranno strumenti di directability e scripting capaci di dialogare con il modello generativo. Alcuni progetti nascenti (es. la startup Intangible AI fondata da ex-Unity) puntano proprio a iniettare maggior controllabilitร  in questi mondi generati proceduralmente. Si profila il ruolo di un โ€œAI experience designerโ€: una figura che non disegna schermate, ma allena e modula i modelli perchรฉ producano esperienze utente coerenti, sicure e piacevoli. รˆ un cambio di paradigma nel design: dallโ€™essere creatori dei contenuti a essere curatori di sistemi generativi. Chi saprร  padroneggiare questโ€™arte, definire vincoli creativi allโ€™AI senza bloccarne lโ€™inventiva โ€“ avrร  un enorme vantaggio.

La sfida non รจ piรน costruire prodotti, ma progettare ambienti intelligenti e context-aware in cui gli utenti vivono.ย 

La UX diventa quasi regia di unโ€™esperienza dinamica, piรน che statico design di interfacce.

Sfide aperte e passi necessari

Nonostante lโ€™entusiasmo per Genieย 3, ci sono diversi limiti e questioni aperte da affrontare perchรฉ questa tecnologia possa avere impatti concreti su larga scala. Anzitutto, le limitazioni tecniche attuali: la versione di ricerca di Genie 3 puรฒ sostenere solo pochi minuti di interazione continua prima che la coerenza inizi a degradare.

Non siamo quindi vicini a mondi persistenti per ore o giorni di simulazione; tuttavia, il trend di miglioramento dal Genie 2 suggerisce che la finestra temporale potrร  estendersi con modelli piรน grandi e ottimizzati. Altra limitazione รจ la fisica imperfetta: sebbene il modello mostri comprensione di concetti fisici base (gravitร , illuminazione, dinamiche di fluidi in modo qualitativo), puรฒ produrre fenomeni bizzarri o poco accurati. Sono stati osservati, ad esempio, personaggi che camminano allโ€™indietro senza motivo, o oggetti che compenetrano altri oggetti โ€“ insomma glitch nel rispetto delle leggi fisiche. Questo pone un problema se lโ€™obiettivo รจ usare queste simulazioni per addestrare robot: come garantire che un robot impari il comportamento giusto se il mondo virtuale talvolta โ€œbaraโ€ sulla fisica? I ricercatori stessi riconoscono che, allo stato attuale, mondi cosรฌ non sono affidabili al punto da garantire che un agente addestrato lรฌ si comporterร  correttamente nel mondo reale. Semmai, possono essere utili per far emergere casi in cui lโ€™agente fallisce (dentro la simulazione stessa) e quindi indicare che non sarebbe ancora pronto per la realtร .

In altre parole, per adesso possiamo usare Genieย 3 piรน come stress test per agenti che come oracolo definitivo di validazione.

Un altro vincolo รจ lโ€™azione limitata dellโ€™agente allโ€™interno di Genie 3: attualmente puรฒ inviare comandi di navigazione (muoversi nello spazio), ma non puรฒ ad esempio afferrare oggetti, premere pulsanti o costruire cose dettagliate nel mondo generato. Lโ€™interazione fisica complessa e la presenza di piรน agenti indipendenti nello stesso ambiente sono frontiere ancora aperte nella ricerca. Inoltre, al momento Genieย 3 accetta soltanto prompt testuali come input iniziale, non immaginib, ย la possibilitร  di partire da una foto o da uno screenshot di un videogioco e โ€œentrarciโ€ resta per ora un intrigante demo, ma non รจ supportata out-of-the-box nellโ€™anteprima attuale. Su questo punto, curiosamente, il predecessore Genie 2 consentiva input misti testo+immagine, mentre Genie 3 pare aver sacrificato questa flessibilitร  per concentrarsi sulla generazione interattiva in tempo reale. Non รจ detto che in futuro non si riacquisti anche la semina visiva (anzi, si parla giร  di esperimenti per fornire video di input in Genie 3, ad esempio per continuare scene dal mondo reale).

Oltre ai limiti tecnici, ci sono sfide pratiche di adozione. Questi modelli sono enormemente affamati di calcolo: generare grafica 3D fotorealistica via AI frame dopo frame richiede potenza computazionale molto maggiore rispetto a riprodurre scene con un tradizionale motore 3D basato su assets predefiniti. Genieย 3 per ora gira su infrastrutture specializzate; portarli in applicazioni consumer o nei flussi di lavoro quotidiani richiederร  ottimizzazioni e probabilmente nuovo hardware (es. i progressi di NVIDIA nel settore fanno pensare che GPU dedicate a AI world generation diventeranno realtร ).

Cโ€™รจ anche un tema di tooling e integrazione: i creativi e sviluppatori dovranno avere strumenti intuitivi per collaborare con questi generatori di mondi. Non basta rilasciare unโ€™API che sputa fuori ambienti: serviranno interfacce per editare, correggere, salvare e versionare i mondi generati. In ambito professionale, uno studio vorrร  poter dire โ€œok, la versione 3 del livello generato ieri era quasi buona, la riprendo e la modifico un poโ€™ invece di rigenerarla da capo oggiโ€. Questo implica capacitร  di controllo fine sui contenuti generati, memorizzazione di seed o parametri per riprodurre ambienti, e magari funzioni di esportazione verso formati standard (immagini, mesh 3D, ecc.) per rifinire il lavoro con software tradizionali. La qualitร  grezza dei modelli generativi da sola non basta: lโ€™esperienza utente per i creator sarร  cruciale quanto i progressi dellโ€™AI.

Vanno considerati aspetti di sicurezza e responsabilitร . DeepMind, ben conscia della natura aperta e โ€œmagicaโ€ di Genie 3, sta procedendo con cautela: il modello รจ distribuito a un piccolo gruppo in forma di ricerca controllata, proprio per studiarne i rischi e mitigare usi impropri. Un mondo generato in cui lโ€™utente puรฒ vagare pone sfide nuove per la moderazione dei contenuti: cosa impedisce che un prompt generi scene violente, o traumatizzanti, o implicitamente offensive? Bisognerร  incorporare vincoli e filtri robusti nei modelli, perchรฉ un conto รจ generare unโ€™immagine sgradevole (giร  problematico), un altro รจ trovarsi immersi in una scena sgradevole. Anche la proprietร  intellettuale รจ un tema: usare dipinti famosi come โ€œseedโ€ per mondi 3D รจ affascinante, ma bisognerร  chiarire i diritti su quelle creazioni derivate.

Se un utente crea un livello ispirato a un artwork esistente, quellโ€™artista andrebbe compensato? E se il mondo generato contiene marchi o elementi riconoscibili, di chi รจ la responsabilitร ? Sono dilemmi giร  sollevati con la generazione di immagini e musica da parte delle AI, ma nel caso di mondi complessi si aggiunge la difficoltร  di monitorare ogni dettaglio generato. Serviranno quindi policy di utilizzo e controlli accurati prima di un rilascio pubblico piรน ampio. DeepMind dichiara di voler sviluppare Genie in modo responsabile, con feedback interdisciplinare, proprio per capirne le implicazioni e i potenziali impatti negativi.

La scelta di limitare lโ€™accesso e raccogliere le prospettive di eticisti, creatori e ricercatori fa parte di questo approccio prudente

Designed to Be Lived : quando lโ€™interazione smette di essere visiva e diventa spaziale.

Dallo schermo allo spazio digitale da abitare

The Shift In Focus

Apple ha appena reso il testo piรน difficile da leggere. E no, non รจ un errore: รจ un cambio di prospettiva. Con lโ€™introduzione dellโ€™interfaccia โ€œLiquid Glassโ€ su visionOS 2 per il visore Vision Pro, molti utenti si sono sentiti spaesati e hanno reagito con perplessitร  (e le solite polemiche) prima ancora di comprenderne il senso. Caratteri meno leggibili, trasparenze ovunque, elementi dellโ€™interfaccia sospesi nellโ€™aria: non รจ solo una scelta estetica ardita, ma una fase di training invisibile con cui Apple prepara il terreno. Lโ€™azienda sta addestrando il nostro sguardo a una nuova grammatica del vedere: unโ€™interfaccia che non blocca piรน la realtร  ma la lascia filtrare, uno spazio digitale che non compete col mondo fisico ma vi convive. In altre parole, lโ€™interfaccia non รจ piรน qualcosa da osservare su uno schermo piatto โ€“ diventa qualcosa da abitare intorno a noi.

Questa transizione rappresenta uno shift percettivo profondo: si passa dalle interazioni bidimensionali su display, mediate da tocchi e swipe, a interazioni immersive in un ambiente che integra reale e virtuale. Il design dello spazio diventa esso stesso interfaccia. Non a caso, il tema centrale di questa edizione รจ proprio il Spatial Shift: il passaggio dai tradizionali schermi 2D alle interfacce immersive, percettive e ambientali che ci circondano. Apple, con Vision Pro e la nuova interfaccia โ€œLiquid Glassโ€, sta inaugurando quella che potremmo chiamare una fase di allenamento cognitivo degli utenti verso questo futuro di interazioni spaziali. Il focus si sposta dallโ€™esperienza utente su schermo (UX) a una esperienza spaziale (โ€œSXโ€) pervasiva. รˆ uno spostamento che coinvolge tecnologia, design e comportamenti umani โ€“ uno shift da tenere bene a fuoco.

Educare lโ€™utente a un nuovo paradigma percettivo

Understanding the Shift

Per capire la portata di questo cambiamento, conviene osservare la strategia ricorrente di Apple nellโ€™introdurre nuove interfacce. In passato รจ giร  successo: la rimozione del tasto Home dallโ€™iPhone fu inizialmente vissuta come un fastidio; i nuovi gesti parevano poco intuitivi e la curva di apprendimento era scoraggiante. Eppure in breve tempo quei gesti sono diventati la norma, tanto che oggi un iPhone col tasto fisico ci sembra archeologia tecnologica. Lo stesso copione si รจ visto con lโ€™eliminazione improvvisa del jack audio per le cuffie (accolta da proteste feroci) che ha perรฒ spianato la strada al paradigma wireless-first, e ancor prima con lโ€™addio alla tastiera fisica sui telefoni, spazzata via in favore del touchscreen. Ogni cambiamento ha seguito lo stesso iter: disorientamento iniziale, adattamento rapido, standardizzazione definitiva. Prima ci lamentiamo, poi ci abituiamo, infine non vogliamo piรน tornare indietro.

Questa ripetuta trasformazione non รจ solo una questione tecnica, ma di psicologia dellโ€™utente. Apple da sempre progetta non solo prodotti, ma comportamenti: esercita una sottile pedagogia tecnologica abituando gradualmente le persone a nuovi paradigmi. Anche stavolta, con Vision Pro e visionOS, la scelta di unโ€™interfaccia semi-trasparente e โ€œdifficileโ€ รจ una leva gentile che spinge a guardare in modo diverso. Lโ€™utente รจ costretto a non fissare piรน elementi grafici netti su uno schermo, bensรฌ a prestare attenzione a contenuti digitali che si fondono con lโ€™ambiente. Apple sta di fatto educando il nostro modo di vedere: prepara un futuro in cui interagiremo attraverso occhiali AR, o magari lenti a contatto intelligenti e micro-proiettori ambientali, dove sarร  la realtร  stessa il canvas di informazioni. Per arrivarci, lโ€™interfaccia deve cominciare giร  oggi a perdere opacitร  e a uscire dai suoi confini tradizionali. Nel silenzio, Apple sta giร  dicendo addio al concetto stesso di โ€œdisplayโ€ come lo conosciamo, inaugurando un paradigma in cui lo schermo non cโ€™รจ piรน โ€“ perchรฉ lโ€™interazione avviene tutto intorno a noi.

In questo contesto, Vision Pro non va visto solo come un nuovo gadget, ma come un vero punto di rottura cognitivo. Indossare un computer spaziale modifica la nostra postura e la nostra attenzione, cambia perfino la nozione di โ€œappโ€ e di notifica: in un ambiente tridimensionale, una notifica non รจ piรน un semplice alert, ma una presenza accanto a noi; un gesto nellโ€™aria diventa linguaggio espressivo, mentre lo sguardo funge da puntatore e focus semantico. Insomma, Apple sta ribaltando assunti decennali di interazione uomo-computer. E lo fa con la consueta determinazione: non chiederร  il permesso di cambiare, ma cambierร  โ€“ con pazienza e precisione, forte di una visione che spesso รจ chiara solo col senno di poi. Noi utenti, come sempre, inizialmente ci lamenteremo; poi ci adatteremo; infine chiameremo tutto ciรฒ progresso. Capire questo processo รจ fondamentale per comprendere lo shift in atto: Apple sta allenando la nostra percezione oggi per prepararci alle interfacce di domani.

Interfacce percettive e la fine del display tradizionale

The Core

Al centro di questa evoluzione cโ€™รจ unโ€™idea dirompente: lโ€™interfaccia del futuro non sarร  progettata per essere guardata, ma per essere vissuta. Non piรน una Graphical User Interface confinata in una finestra luminosa, bensรฌ una โ€œinterfaccia percettivaโ€ diffusa nello spazio attorno a noi. รˆ un cambiamento radicale di paradigma. Per decenni abbiamo misurato il progresso in pollici di schermo, densitร  di pixel e brillantezza dei display. Ora il display รจ destinato a dissolversi nellโ€™ambiente: il futuro non รจ un nuovo schermo, รจ lโ€™assenza di schermo. I contenuti e le funzioni digitali verranno distribuiti tra diversi elementi: forse un bracciale smart per il controllo interattivo, un device in tasca per la potenza di calcolo, un paio di occhiali (o lenti a contatto) per la visualizzazione. Il dispositivo non starร  piรน โ€œdi fronteโ€ a noi, ma su di noi e intorno a noi. In breve, lโ€™esperienza sarร  ambientale, invisibile, continua.

Questa prospettiva richiama un principio noto nel design: il buon design tende a diventare invisibile. Come osserva Don Norman (guru dellโ€™usabilitร ), un prodotto ben progettato si adatta talmente bene ai nostri bisogni da risultare quasi impercettibile nella sua funzione. Unโ€™interfaccia perfetta non attira attenzione su di sรฉ, ma ci permette di svolgere compiti e vivere esperienze in modo naturale. รˆ ciรฒ a cui mira il paradigma spaziale: tecnologie cosรฌ integrate nel contesto da non sembrare neppure โ€œtecnologiaโ€ nel senso tradizionale. Del resto, giร  nel 1991 il visionario Mark Weiser scriveva che โ€œle tecnologie piรน profonde sono quelle che scompaiono. Si intrecciano nel tessuto della vita quotidiana fino a diventare indistinguibili da essaโ€. Oggi quella profezia sembra realizzarsi: lโ€™interfaccia si dissolve nellโ€™ambiente, lo spazio stesso diventa lโ€™interfaccia.

Pensiamo alle implicazioni di questa dissoluzione del display. Per gli utenti significa meno barriere tra mondo digitale e fisico: le informazioni ci โ€œvengono incontroโ€ negli spazi che abitiamo, anzichรฉ costringerci a piegare la testa su uno schermo. Ciรฒ potrebbe rendere la tecnologia piรน umana e a misura dei nostri sensi, restituendo centralitร  al nostro modo naturale di percepire lo spazio. Non a caso si parla di โ€œspatial computingโ€: un calcolo computazionale che non vive piรน dentro uno scatolo luminoso, ma si espande nellโ€™ambiente. In termini di progettazione, questo richiede un cambio di mentalitร : dal design di interfacce 2D si passa al design di esperienze tridimensionali, dove entrano in gioco la prospettiva, la distanza, il tatto, il sonoro e persino la cinestetica del corpo. Si passa dalla classica UX alla SX (Spatial Experience), una disciplina ancora in definizione che combina principi di UX design con architettura, psicologia ambientale e design sensoriale.

In sintesi, il cuore dello shift in atto รจ la trasformazione dellโ€™interfaccia da elemento visibile e separato, a ambiente invisibile e incorporato nella nostra realtร . รˆ una nuova era in cui โ€œlo spazio รจ il nuovo schermoโ€. Chi progetta tecnologie dovrร  pensare meno a pixel e pannelli, piรน a esperienze situate nello spazio dellโ€™utente. E lโ€™utente, da parte sua, dovrร  sviluppare nuovi alfabeti percettivi per interagire con informazioni che si presentano nel mondo reale invece che su un vetro. รˆ un cambio di core paradigm paragonabile a quello introdotto dallo smartphone, se non piรน grande: allora il telefono divenne una finestra universale sul digitale; ora quella finestra si spalanca e scompare, perchรฉ il digitale permea direttamente la stanza in cui siamo.

Oltre Apple: tentativi, fallimenti e visioni ambientali

The Broader Shift

Sebbene Apple stia guidando con Vision Pro questa transizione, il paradigma delle interfacce ambientali รจ nellโ€™aria da tempo e coinvolge lโ€™intero settore tecnologico. Da anni si parla di ambient computing, cioรจ di un computing ubiquo che ci assiste ovunque in modo naturale, senza dover fissare uno schermo. Google, per esempio, descrive la sua missione hardware proprio in termini di ambient computing: tecnologie sempre presenti nella vita quotidiana, pronte allโ€™uso โ€œin qualsiasi momento, in modo che sembri naturaleโ€. Lโ€™idea รจ di interagire con lโ€™ambiente e avere i servizi digitali che rispondono ai nostri gesti, voce e bisogni, invece di farci concentrare su un dispositivo specifico.

Tuttavia, realizzare davvero questa visione si sta rivelando complesso. Alcuni prodotti recenti che provavano ad anticipare il futuro post-schermo hanno incontrato difficoltร  e fallimenti, dimostrando che il timing e lโ€™UX devono essere maturi. Ad esempio, il Rabbit R1 (nella foto, a sinistra) e il Humane AI Pin (a destra) sono due dispositivi lanciati con lโ€™obiettivo di superare lo smartphone tradizionale. Il Rabbit R1, presentato nel 2024, รจ un piccolo gadget tascabile con schermo da 2,9 pollici e un assistente AI integrato, concepito per svolgere in autonomia molte funzioni oggi legate al telefono. Il suo fondatore lo ha descritto come un dispositivo AI-native talmente ambizioso da poter sostituire lo smartphone (prima o poi) โ€“ โ€œsolo non subitoโ€, ammise realisticamente. Nelle intenzioni, il R1 avrebbe dovuto essere un tuttofare intelligente, un coltellino svizzero digitale capace di usare le nostre app per noi attraverso un modello di AI chiamato โ€œLarge Action Modelโ€. In pratica perรฒ, giร  dai primi test รจ parso chiaro che lโ€™idea superava le capacitร  concrete del prodotto: lโ€™R1 non รจ abbastanza potente per rimpiazzare un telefono e finisce per sembrare piรน che altro un assistente vocale evoluto con un piccolo schermo aggiunto. La visione di Rabbit โ€“ per quanto intrigante โ€“ รจ risultata poco definita e prematura rispetto alla tecnologia attuale. Non a caso, di recente Jony Ive (storico designer di Apple) ha liquidato sia il Rabbit R1 che lโ€™AI Pin come โ€œprodotti molto scadentiโ€, criticando la mancanza di reale innovazione in quelle proposte.

Ancora piรน emblematica รจ la parabola del Humane AI Pin, una sorta di spilla intelligente progettata da ex-dirigenti Apple per offrire unโ€™esperienza computing senza schermo. Humane presentava il Pin come lโ€™inizio di un futuro post-smartphone, in cui passeremo meno tempo con la testa chinata sugli schermi e piรน tempo di nuovo nel mondo reale. Lโ€™AI Pin, lanciato a fine 2023, si agganciava agli abiti e combinava fotocamera, micro-proiettore laser e unโ€™assistente AI (sistema operativo CosmOS) per rispondere a comandi vocali ed eseguire varie operazioni al volo. Nelle promesse, doveva fare da filtrato intelligente tra noi e il mondo digitale: niente app da aprire, niente display da toccare โ€“ bastava chiedere allโ€™assistente per telefonare, mandare messaggi, tradurre conversazioni o ottenere informazioni sugli oggetti intorno a noi. In teoria, un computer indossabile che โ€œnon รจ un telefono, ma neanche non lo รจโ€, completamente basato sullโ€™intelligenza ambientale.

Purtroppo, tra la visione e la realtร  si รจ aperto un divario. Al debutto, il Pin si รจ rivelato acerbo e malfunzionante su molti fronti: dalla batteria misera (2-3 ore di autonomia) ai ritardi nelle risposte vocali, dallโ€™interazione tramite proiezione sul palmo (affascinante ma problematica in ambienti luminosi e scomoda nei gesti) fino a funzioni base mancanti. Il verdetto dei recensori รจ stato impietoso โ€“ โ€œpromette di liberarti dallo smartphone, ma cโ€™รจ un problema: semplicemente non funzionaโ€ titolava The Verge. Dopo un debutto costellato di bug e limiti, Humane ha visto sfumare rapidamente lโ€™entusiasmo: nel giro di pochi mesi lโ€™azienda ha cercato acquirenti e infine รจ stata venduta a HP, che ha spento il progetto e ritirato dal mercato tutti gli AI Pin giร  venduti. Un epilogo amaro per un dispositivo lanciato a $699 piรน abbonamento mensile, che avrebbe dovuto mostrare la via di una โ€œambient intelligenceโ€ indossabile ma si รจ scontrato con la realtร  di unโ€™esperienza utente frustrante e tecnologie non allโ€™altezza.

Casi come Rabbit R1 e Humane AI Pin evidenziano quanto sia difficile anticipare il paradigma giusto al momento giusto. Spesso lโ€™idea puรฒ essere valida (meno schermi, piรน presenza nel mondo reale) ma la maturitร  dellโ€™ecosistema e dellโ€™UX risulta ancora insufficiente. Queste sperimentazioni perรฒ non sono vane: indicano una direzione. Come scriveva un commentatore, il Pin di Humane prometteva un futuro oltre lo smartphone โ€œdi gran lunga oltre ciรฒ che la sua tecnologia puรฒ fare nel presenteโ€ โ€“ un poโ€™ come accadde negli anni โ€™90 a General Magic con il suo Magic Link (un antesignano PDA creato da ex Apple, rivelatosi troppo avanti per lโ€™epoca). I fallimenti insegnano che serve tempo per colmare il gap fra visione e realtร . E insegnano anche che certe idee richiedono un ecosistema integrato per prosperare: proprio ciรฒ in cui Apple tradizionalmente eccelle. Infatti, come notava Fast Company, spesso i prodotti Apple hanno successo perchรฉ possono contare su reti di sviluppatori e contenuti che li rendono utili e appetibili, mentre startup come Humane hanno tentato di imporre hardware radicalmente nuovo senza un adeguato parco di applicazioni e servizi di terze parti pronti allโ€™uso.

Dal punto di vista culturale, questa transizione porta con sรฉ anche riflessioni profonde. Il filosofo Byung-Chul Han osserva come la nostra societร  digitale abbia trasformato gli oggetti in โ€œnon-coseโ€, sostituendo la tangibilitร  degli oggetti cari con esperienze fugaci e swipe effimeri su schermi. In altre parole, molta della โ€œmagiaโ€ degli oggetti fisici si รจ persa in favore di interazioni digitali disincarnate. Lโ€™idea di unโ€™interfaccia percettiva ambientale potrebbe rappresentare un tentativo di ricucire lo strappo: riportare il digitale dal regno disincarnato dello schermo a una presenza piรน concreta nel nostro spazio, ridando corpo e contesto alle informazioni. Anche Don Norman, con la sua enfasi sul design umano-centrico, indirettamente ci ricorda che la tecnologia dovrebbe adattarsi ai comportamenti naturali delle persone e non viceversa โ€“ e un computing ubiquitario, integrato nellโ€™ambiente, promette proprio di rispettare maggiormente le nostre abitudini sensoriali e sociali. Lโ€™obiettivo ultimo, condiviso da molti innovatori, รจ un futuro in cui lโ€™informatica sia pervasiva ma discreta, potente ma invisibile, costantemente disponibile ma quasi impercettibile nella routine quotidiana. Arrivarci richiede conquiste sia tecniche (miniaturizzazione, AI sempre piรน intelligente, nuove interfacce neuronali magari) sia di design ed ergonomia (nuovi linguaggi dโ€™interazione intuitivi, rispetto per lโ€™attenzione e i limiti cognitivi umani). Siamo, in definitiva, di fronte a uno shift non solo tecnologico ma anche di mindset collettivo: reimmaginare il rapporto uomo-macchina in termini piรน simbiotici e meno mediati da artefatti visibili.

Scenari futuri e opportunitร  allโ€™orizzonte

Whatโ€™s Next

Guardando avanti, la domanda non รจ piรน se questo spatial shift accadrร , ma quando e come si compirร . Apple sembra seguire un piano ben preciso. Il Vision Pro in uscita (per ora un dispositivo costoso rivolto a sviluppatori e early adopter) รจ probabilmente solo il primo passo: una sorta di fondamenta su cui costruire un ecosistema di applicazioni spaziali e abituare gli sviluppatori al nuovo paradigma. Giร  lโ€™anno prossimo o entro un paio dโ€™anni, possiamo aspettarci unโ€™evoluzione verso hardware piรน compatto โ€“ magari un Apple Glass leggero, occhiali AR pensati per il grande pubblico โ€“ una volta superate le attuali sfide di produzione e autonomia. Nel frattempo Apple ha iniziato a seminare concetti e interfacce (come il Liquid Glass di visionOS 2) che fungono da ponte cognitivo: ci abitua a testi semi-trasparenti oggi, cosรฌ domani saremo pronti a indossare un display sugli occhi senza trovare strano vedere il mondo attraverso lโ€™informazione digitale.

In parallelo, lโ€™intero settore tech si muove verso lโ€™immersivo e il percettivo. Meta sta investendo nella sua visione di realtร  mista (gli ultimi Quest e prototipi di occhiali AR), Google continua la ricerca su occhiali e sensori ambientali (puntando a realizzare la promessa dellโ€™ambient computing integrato nei suoi servizi cloud), e persino nuove collaborazioni emergono: ad esempio Jony Ive e Sam Altman (OpenAI) hanno annunciato di lavorare insieme a un dispositivo AI innovativo per il 2026 โ€“ segno che lโ€™idea di un gadget personale potenziato dallโ€™AI e privo di interfaccia tradizionale รจ tuttโ€™altro che tramontata, anzi alletta i protagonisti della scena tecnologica. Possiamo aspettarci quindi una proliferazione di esperimenti nei prossimi anni: dagli assistenti personali ambientali (in auto, in casa, integrati nellโ€™IoT) a interfacce neuronali piรน dirette (Neuralink e affini), fino a piattaforme software che ridefiniscono il concetto di โ€œappโ€ in chiave spaziale e contestuale.

Dal punto di vista del business, si apre una nuova frontiera di opportunitร . Chi saprร  definire gli standard delle interfacce spaziali โ€“ linguaggi gestuali, formati per contenuti AR, protocolli per oggetti intelligenti โ€“ potrebbe dominare il prossimo ecosistema come Apple e Google hanno dominato lโ€™era smartphone con iOS e Android. Immaginiamo nuovi servizi: mappe che non si guardano sul telefono ma compaiono direttamente lungo il nostro percorso in strada, e-commerce che materializza schede prodotto in forma di ologrammi nel salotto prima dellโ€™acquisto, assistenti AI che ci sussurrano consigli nellโ€™orecchio contestualmente a ciรฒ che stiamo guardando. Interi settori (dal retail allโ€™education, dalla sanitร  allโ€™intrattenimento) verranno ripensati in chiave di esperienze miste fisico-digitali. Aziende di design dovranno unire competenze di UX, realtร  aumentata e persino architettura dโ€™interni per progettare spazi interattivi. E sul piano culturale e sociale, dovremo monitorare attentamente lโ€™impatto: queste tecnologie potrebbero renderci piรน liberi dagli schermi, piรน presenti nella vita reale โ€“ o, se mal gestite, creare una nuova ondata di sovrastimolazione e dipendenza, stavolta distribuita ovunque andiamo. La differenza la farร  un approccio etico e human-centric: come garantire che lโ€™AR non diventi una continua distrazione invasiva? Come proteggere la privacy in un mondo di sensori ambientali? Come mantenere un controllo consapevole sui flussi informativi che ci raggiungono in realtร  aumentata? Queste sono sfide aperte, di design, di regolamentazione e di educazione allโ€™uso.

Quel che รจ certo, riprendendo le parole del mio libro โ€œSpatial Shiftโ€, รจ che siamo allโ€™alba di un cambiamento epocale nel nostro modo di vivere, pensare e relazionarci. Un cambiamento paragonabile a ciรฒ che fu lโ€™introduzione dellโ€™iPhone, ma amplificato dalla convergenza simultanea di piรน tecnologie mature: intelligenza artificiale sempre piรน avanzata, sensori ambientali diffusi, realtร  mista e 3D, connettivitร  pervasiva. Questa convergenza sta preparando il terreno per riscrivere radicalmente le regole dellโ€™interazione uomo-macchina e, di conseguenza, tanti modelli di business e di uso quotidiano. Siamo in un momento di rara energia innovativa, in cui device come Vision Pro o esperimenti come lโ€™AI Pin fanno parlare di una nuova entusiasmante fase del tech come non succedeva da anni. Ma โ€“ come sempre accade nelle grandi transizioni โ€“ lโ€™hype iniziale dovrร  tradursi in adozione reale e valore pratico. La strada dei prossimi anni vedrร  iterazioni continue: prototipi, versioni beta, successi sorprendenti e flop clamorosi. รˆ un processo di learning by doing collettivo, dove ogni tentativo (anche fallito) contribuisce ad avvicinarci allโ€™obiettivo finale: un computing realmente invisibile, naturale e potenziante.

Dentro lo shift, verso un futuro da abitare

The Shift Continues

In conclusione, lo shift continua. Siamo solo alle prime pagine di questa nuova storia tecnologica: come hanno ammesso i fondatori di Humane, โ€œoggi non siamo nemmeno al primo capitolo, ma alla prima paginaโ€ di un futuro in cui lโ€™AI ambientale e le interfacce spaziali ridisegneranno la nostra relazione con la tecnologia. Ogni giorno che passa aggiungiamo un tassello โ€“ una riga di codice in visionOS, un nuovo sensore indossabile, un gesto che diventa standard โ€“ e ci spingiamo un poโ€™ piรน in lร  verso lโ€™era dellโ€™interfaccia diffusa. Allโ€™inizio potrร  sembrare strano, scomodo o prematuro (come tutte le grandi rivoluzioni allโ€™inizio sembrano). Ma se la storia recente ci insegna qualcosa รจ che ci abituiamo in fretta ai nuovi paradigmi, quando questi risolvono problemi reali o migliorano la qualitร  della vita. E a quel punto, voltandoci indietro, ci chiederemo come potevamo vivere chiusi dentro gli schermi senza abitare anche il lato digitale del nostro spazio.

Questo numero di InsideTheShift ha voluto esplorare il passaggio dalle interfacce da osservare a quelle da vivere, dai pixel ai luoghi aumentati, dagli oggetti alle esperienze. รˆ uno shift che coinvolge tecnologia, business, cultura e design in egual misura. Continueremo a seguirne gli sviluppi nelle prossime edizioni, analizzando come evolvono i dispositivi, le piattaforme e โ€“ soprattutto โ€“ le abitudini delle persone. Come sempre, restiamo dentro lo shift per coglierne per tempo le opportunitร  e le sfide. Ci aspetta un futuro in cui lโ€™interazione uomo-macchina sarร  tanto pervasiva quanto trasparente, un futuro da costruire con visione ma anche con responsabilitร . Il viaggio continua: la spatial shift รจ iniziata, e saremo qui a raccontarla passo dopo passo.

Stay Inside the Shift.

Il resto dei Toolbox, delle risorse linkate e dei takeaway lo trovate qui su Substack InsideTheShift in inglese.

Beyond Virtual: come lo Spatial Computing sta ridisegnando il futuro del gaming

Ieri ho partecipato allโ€™Italian Gaming Expo a Roma con uno speech dal titolo โ€œBeyond Virtual: Spatial Computing and XR for the Future of Gamingโ€. Unโ€™occasione utile per mettere a fuoco un tema che seguo da tempo con passione e studio, e che ho affrontato anche nel mio libro Spatial Shift: la convergenza tra intelligenza artificiale, tecnologie immersive e nuovi ambienti digitali.

Questa volta ho voluto declinare quei concetti sul settore del gaming, che forse piรน di altri sta giร  vivendo una trasformazione profonda, non tanto nel linguaggio estetico o nella logica del gameplay, ma nel modo in cui esperienze, ambienti e contenuti si relazionano allo spazio fisico e alla nostra presenza nel mondo reale.

Il punto di partenza รจ semplice quanto radicale: stiamo entrando in una nuova fase del computing. Dopo lโ€™epoca desktop, quella mobile e quella cloud, oggi siamo nellโ€™alba di unโ€™era spatial, dove lโ€™interazione con i contenuti digitali si libera dallo schermo e si distribuisce nellโ€™ambiente che ci circonda. Lo chiamiamo spatial computing, ed รจ molto piรน di unโ€™estensione dellโ€™AR o della VR. รˆ un cambio di paradigma nel modo in cui il digitale โ€œviveโ€ nello spazio.

Spatial computing: dal dispositivo allโ€™ambiente

In questa nuova fase non interagiamo piรน con il contenuto โ€œguardando dentroโ€ un device. Il contenuto si proietta fuori. Lo spazio intorno a noi diventa un canvas digitale su cui appaiono elementi immersivi, persistenti, personalizzati. Non รจ solo una questione di effetto wow: รจ una trasformazione sistemica del nostro rapporto con lโ€™informazione, la narrazione e il gioco.

Come sottolinea Cathy Hackl, una delle voci piรน lucide su questi temi, โ€œspatial computing isnโ€™t about devices, itโ€™s about contextโ€. รˆ il contesto che conta. รˆ lรฌ che si gioca la sfida: capire come, dove e quando interagiamo. E soprattutto: chi costruisce questi contesti?

Nel gaming questa transizione รจ giร  visibile. Giochi come Pokรฉmon GO hanno mostrato per primi la possibilitร  di costruire esperienze ludiche sovrapposte al mondo reale. Ma oggi siamo ben oltre: visori come Meta Quest 3 o Apple Vision Pro ci permettono di trasformare il salotto in uno spazio ibrido dove avatar, elementi digitali e oggetti fisici convivono. Il gioco non si svolge piรน in una finestra digitale, ma intorno a noi, in tempo reale, connesso a ciรฒ che facciamo, vediamo e sentiamo.

Il gioco entra nel mondo reale

Questo shift ha due implicazioni molto forti per chi progetta e costruisce contenuti ludici.

La prima รจ che lโ€™ambiente stesso diventa parte integrante dellโ€™esperienza. Non parliamo piรน di livelli predefiniti da navigare con un controller, ma di spazi reali in cui ci si muove fisicamente e in cui ogni elemento โ€“ un muro, una sedia, una finestra โ€“ puรฒ diventare parte attiva della narrazione. Lโ€™ambiente non รจ piรน lo sfondo, รจ il gameplay.

La seconda รจ che il corpo torna ad essere centrale. Il corpo non come ostacolo, ma come interfaccia. Con la computer vision, lโ€™eye tracking, il motion sensing e il feedback aptico, il giocatore non รจ piรน โ€œfuori dal giocoโ€ ma dentro, presente, immerso e co-autore dellโ€™esperienza.

In questo scenario, il design cambia pelle. Non si tratta piรน di scrivere regole per un mondo chiuso, ma di orchestrare esperienze in ambienti aperti, dinamici, interattivi e spesso condivisi. Il confine tra gaming, fitness, socialitร , formazione o comunicazione diventa sempre piรน sottile.

AI, generazione procedurale e ambienti intelligenti

Unโ€™altra variabile che sta accelerando tutto questo รจ lโ€™intelligenza artificiale.

Non รจ unโ€™esagerazione dire che la convergenza tra AI e spatial computing sta ridisegnando le fondamenta stesse dellโ€™intrattenimento.

Lโ€™AI generativa consente oggi di creare NPC autonomi e realistici, mondi generati dinamicamente, missioni che si adattano in tempo reale al comportamento del giocatore. Ma soprattutto, permette a ogni esperienza di essere personalizzata e situata. Un gioco spatial puรฒ cambiare non solo in base al tuo livello o alle tue scelte, ma in base al luogo in cui sei, allโ€™ora del giorno, a chi hai intorno.

Stiamo passando da ambienti digitali โ€œchiusiโ€ a ecosistemi intelligenti in grado di leggere, interpretare e rispondere. La logica stessa della progettazione cambia: da una narrativa predefinita a una co-costruita, dove il giocatore entra in relazione attiva con il contesto. รˆ un salto concettuale e tecnico, ma รจ anche una grande opportunitร  per re-immaginare il concetto stesso di gioco.

Il gaming come infrastruttura esperienziale

Molti considerano il gaming un sottoinsieme dellโ€™intrattenimento. In realtร , oggi sta diventando sempre piรน una piattaforma culturale, unโ€™infrastruttura esperienziale. Lo vediamo nei mondi persistenti di Fortnite o Roblox, dove i confini tra gioco, socialitร , evento e commercio si fondono. Lo vediamo nella logica dei digital twin, nei training simulator in XR, nei giochi educativi in MR. Il linguaggio ludico sta diventando la grammatica con cui interpreteremo una parte crescente della realtร  aumentata che abiteremo nei prossimi anni.

Il gioco non รจ piรน uno spazio-tempo separato. รˆ un layer aggiuntivo che si sovrappone alla vita. Puรฒ accendersi durante una camminata in cittร , durante una sessione di allenamento, o mentre esploriamo un museo. Diventa strumento di coinvolgimento, apprendimento, relazione.

Opportunitร  e nuove domande

Tutto questo apre scenari enormi per chi sviluppa prodotti, contenuti e strategie in ambito gaming e tech. Si apre un nuovo mercato, con nuovi modelli di business e nuove filiere. Ma emergono anche domande nuove, profonde, che non possiamo ignorare.

Chi possiede lo spazio virtuale sovrapposto a quello fisico? Come si tutelano la privacy, i dati ambientali, i comportamenti biometrici raccolti dai dispositivi XR? Come si regolamenta lโ€™accesso, la moderazione, la sicurezza in un gioco che si svolge nel mondo reale, tra persone vere?

Sono le domande che iniziano ad affiorare oggi, ma che saranno centrali domani, quando milioni di persone inizieranno ad abitare queste esperienze spatial ogni giorno.

Oltre il virtuale

Lo spatial computing non รจ una moda passeggera. รˆ un cambio di fase.

E il gaming non รจ semplicemente uno dei primi settori a esserne toccato: รจ il motore culturale che puรฒ guidarne lโ€™evoluzione.

Come ha detto Tim Sweeney, CEO di Epic Games:

โ€œAR glasses will become the entertainment platform of the future, replacing smartphones, tablets, and maybe even TVs.โ€

Non รจ piรน questione di se, ma di quando.

E soprattutto, di come costruire esperienze che non si limitino a stupire, ma che abbiano valore, coerenza e impatto.

Per questo credo che oggi piรน che mai sia il momento di pensare oltre il virtuale โ€“ e iniziare a progettare quello che viene dopo.

Il futuro dell’Immersivitร  nello Sport: intervista in universitร  parlando di tecnologia, spatial computing e fan engagement

Nel mondo dello sport, le tecnologie immersive come la realtร  aumentata (AR) e la realtร  virtuale (VR) stanno rivoluzionando l’esperienza dei tifosi e l’ottimizzazione delle prestazioni degli atleti. Ho presentato qualche giorno fa il libro “Spatial Shift” che ho recentemente scritto, partecipando a un’intervista con un’universitร  per discutere del futuro dello sport e dell’immersivitร .

In questa intervista, che riporto, ho condiviso la mia visione su come queste tecnologie vengono sfruttate oggi nell’NBA, le loro potenzialitร  future e l’apertura delle societร  sportive all’adozione di queste innovazioni. Scopriamo insieme come AR e VR stanno trasformando il panorama sportivo e quali prospettive ci attendono. Ho anche annunciato la prossima uscita del libro “Sport Tech, una nuova era dello sport business e della trasformazione digitale.”

Come vengono sfruttate queste tecnologie al giorno d’oggi? C’รจ o ci sarร  secondo Lei un’apertura da parte di tutte le societร  sportive all’utilizzo di esse? Le nuove tecnologie, come la realtร  aumentata (AR) e la realtร  virtuale (VR), sono giร  ampiamente sfruttate nell’NBA per migliorare l’esperienza dei tifosi e ottimizzare le performance dei giocatori. Le applicazioni includono la trasmissione di partite in VR per una visione immersiva (da punti in cui sono situate camere 360), l’uso di sensori e analisi avanzate per monitorare e migliorare le prestazioni degli atleti (ed i cui dati sono poi utilizzati per ambiti di simulazione immersiva), e la creazione di contenuti interattivi per i social media che coinvolgono i fan in modo piรน profondo (AI, Video Recognition, Image Recognition). Credo fermamente che tutte le societร  sportive seguiranno questa tendenza, poichรฉ l’adozione di queste tecnologie puรฒ offrire vantaggi competitivi significativi, sia in termini di ingaggio del pubblico che di miglioramento delle prestazioni sportive e diventerร  una condizione necessaria anche di sopravvivenza a tendere in termini di possibili forme di ricavo.

Come si possono coinvolgere sempre piรน emotivamente le persone rispetto ad una partita live vista con i propri occhi? Per coinvolgere emotivamente le persone in modo paragonabile a una partita live, le tecnologie immersive come la VR possono giocare un ruolo cruciale. Offrendo esperienze che replicano la sensazione di essere presenti fisicamente all’evento, si puรฒ creare un legame emotivo piรน forte. Ad esempio, trasmettere le partite in VR permetterร  ai tifosi di vivere l’emozione del gioco da diverse prospettive, come se fossero seduti a bordo campo. L’uso di AR per fornire statistiche in tempo reale, replay e angolazioni esclusive arricchisce l’esperienza visiva e mantiene l’attenzione del pubblico. Il tutto poi deve esser sempre corredato di servizi a valore aggiunto, come loyalty, reward e accesso ad esclusivitร  differenziante. Se prima del covid il fisico era ormai commodity ed il digitale l’opportunitร  derivante dalla novitร , ora stiamo vivendo un processo inverso in cui il digitale รจ l’elemento di commodity in cui avvengono naturalmente fruizioni, interazioni e servizi all’utente con contenuti esclusivi per il digitale, ed il fisico รจ la componente dell’esperienza in cui viene creato un valore unico e raro per l’utente.

Come si possono “convincere” le persone scettiche a provare ad indossare un visore per provare un’esperienza immersiva del genere? Per convincere le persone scettiche a provare i visori VR, รจ fondamentale offrire dimostrazioni gratuite e esperienze pilota che mostrino chiaramente i vantaggi di queste tecnologie. Questo nella fase educativa, senza dubbio. Eventi promozionali in cui i tifosi possono sperimentare la VR senza costi iniziali potrebbero essere molto efficaci. Dopodichรฉ, passata la fase di evangelizzazione, l’utilizzo di testimonianze di celebritร  e atleti che raccontano le loro esperienze positive attraverso l’uso dell’extended reality, possono aumentare l’interesse e ridurre le riserve. Non c’รจ dubbio che per migliorare l’esperienza ed accelerare poi l’adozione del visore ci siano tre condizioni che devono verificarsi nello stesso momento (e ci siamo quasi)

  • ergonomia, semplicitร  d’uso e user experience del device
  • abbattimento del prezzo dei device consumer per la massa
  • creazione di contenuto esclusivo e unico fruibile da device (come sta facendo AppleTV con MLS e contenuti solo visibili in vision pro)

Secondo Lei siamo solo all’inizio, o giร  con quello che accade in NBA siamo ad un buon punto rispetto all’utilizzo di a.r. e v.r. in campo sportivo? Ritengo che siamo ancora agli inizi di un lungo percorso evolutivo nell’uso della AR e VR nello sport e delle nuove tecnologie convergenti (AI e Blockchain incluse). Sebbene l’NBA stia facendo passi significativi nell’adozione di queste tecnologie, sia per temi di cultura, budget e approccio, c’รจ ancora un ampio margine per l’innovazione e la diffusione. Le possibilitร  offerte dal computing spaziale e dall’intelligenza artificiale, come discusso nel mio libro, promettono di trasformare ulteriormente l’esperienza sportiva e di renderla sempre piรน coinvolgente e personalizzata oltre che generare nuove opportunitร  per brand e partner in termini di forme di nuova monetizzazione.

Secondo Lei i visori quando potranno cominciare ad essere accessibili ai piรน in termini di prezzo e di “comoditร ” d’utilizzo? Prevedo che i visori VR diventeranno accessibili al grande pubblico nei prossimi 3-5 anni. La rapida evoluzione tecnologica e la competizione tra i produttori stanno giร  portando a una riduzione dei costi e a miglioramenti significativi nella comoditร  d’uso. La miniaturizzazione dei componenti, l’aumento della durata della batteria e il miglioramento dell’ergonomia sono tutti fattori che contribuiranno a rendere questi dispositivi piรน attraenti e accessibili. L’avvento del Vision pro ha accelerato giร  il contesto di competizione: se da una parte Meta ha iniziato ad adeguare ed evolvere il proprio sistema operativo nella direzione introdotta da Apple con lo Spatial Computing, dall’altra altri competitor di device hardware hanno capito che diminuzione della dimensione, l’integrazione di sensori, camere e display e la progettazione ergonomica per creare accessibilitร  e inclusivitร  sono elementi progettuali necessari.

Molte persone si rifiutano di provare la realtร  virtuale solo perchรฉ devono indossare un caschetto, quindi i visori anche se diventeranno sempre piรน piccoli e accessibili potranno sostituire gli smartphone? O le persone si rifiuteranno perchรฉ si tratta di “indossare” qualcosa sulla propria testa? รˆ vero che molte persone sono riluttanti a indossare un caschetto VR ed in generale per persone sono poco predisposte a modificare il proprio visus se non hanno una reale necessitร  (problemi di vista per capirci…). Con il continuo miglioramento del design e la riduzione delle dimensioni dei visori, ritengo che questa resistenza diminuirร  trasformando il visore da maschera / caschetto ad occhiale, indossabile tutti i giorni (esattamente la strada che sta facendo Meta e Luxottica). Anche se i visori VR potrebbero non sostituire completamente gli smartphone, diventeranno probabilmente un complemento importante per determinate esperienze immersive che non possono essere replicate su uno schermo piatto. La chiave sarร  offrire valore aggiunto che giustifichi l’uso di un dispositivo indossabile, in determinate circostanze. Sono dell’idea che non avremo mai un uso costante di un occhiale in testa, ma utilizzi specifici e fortemente contestualizzate e caratterizzanti in cui saremo ben predisposti a farlo.

Attualmente negli sport, da parte delle societร  รจ piรน utilizzata la realtร  aumentata o la realtร  virtuale? Attualmente, la realtร  aumentata รจ piรน utilizzata rispetto alla realtร  virtuale, soprattutto per le sue applicazioni immediate e facilmente integrabili nelle trasmissioni televisive e nelle app mobili o nei siti internet attraverso la WebAR. La AR รจ utilizzata per sovrapporre grafici, statistiche e replay durante le partite, o per mostrare asset tridimensionali e contestualizzati nello spazio fisico, migliorando l’esperienza visiva senza la necessitร  di attrezzature speciali. La VR sta guadagnando terreno, soprattutto per le esperienze immersive, simulazioni e allenamenti degli atleti.

Nel calcio l’utilizzo di queste tecnologie รจ ancora un miraggio? L’utilizzo della v.r. nella finale di Copa Amรฉrica รจ un approccio o gli esperimenti attualmente si fermeranno a quella partita? Nel calcio, l’adozione delle tecnologie AR e VR sta crescendo. L’uso della VR nella finale di Copa Amรฉrica rappresenta un passo importante verso l’integrazione di queste tecnologie, ma รจ ancora in fase sperimentale. Ritengo che con i successi iniziali e il feedback positivi di queste inizaitive, si creerร  l’effetto “follower” e vedremo un’adozione piรน ampia e sistematica nel prossimo futuro, non solo limitata a eventi singoli ma integrata regolarmente nelle competizioni sportive. Il tema dei diritti da sbloccare รจ in corso, e questo sarร  inoltre un abbattimento enorme di barriere.

In quanto tempo si potrebbe arrivare all’utilizzo totale di queste tecnologie in tutti gli sport? L’adozione totale di AR e VR in tutti gli sport potrebbe avvenire entro i prossimi 5-10 anni. Questo dipenderร  dall’evoluzione tecnologica, dalla riduzione dei costi e dall’accettazione da parte del pubblico e degli atleti. Man mano che le tecnologie diventano piรน avanzate e accessibili, e i benefici diventano piรน evidenti, la loro integrazione nei vari sport diventerร  inevitabile. Questa รจ una valutazione “lineare” ma non ho dubbi sul fatto che potremmo vedere una accelerazione di adozione come successo con il mobile.

Potrebbero capitare casi in futuro di spettatori presenti solo virtualmente allo stadio e non fisicamente? รˆ plausibile e a mio avviso inevitabile, che in futuro vedremo spettatori che partecipano agli eventi sportivi esclusivamente tramite realtร  virtuale. Questo permetterร  ai fan (e non solo) di tutto il mondo di “essere presenti” a una partita senza dover viaggiare, offrendo un’esperienza simile a quella dal vivo, permettendo l’estensione del business per il brand e le opportunitร  di coinvolgere una nuova utenza. L’esperienza fisica – quella di andare allo stadio – manterrร  sempre un fascino unico e anzi, il ruolo di esclusivitร  / raritร  di posti e unicitร , renderร  il fisico ancora piรน attraente e probabilmente vedremo un’integrazione di entrambe le modalitร , fisica e virtuale, per soddisfare le diverse esigenze e preferenze dei tifosi.

SPATIAL SHIFT : La convergenza tecnologica di Computing, Mixed Reality, Artificial Intelligence e Blockchain

Quando nel 2007 Steve Jobs presentรฒ al mondo l’iPhone, pochi potevano immaginare l’impatto rivoluzionario che questo dispositivo avrebbe avuto sulle nostre vite. In quel momento storico, non solo assistevamo alla nascita di un nuovo prodotto, ma eravamo testimoni dell’alba di un’era completamente nuova: l’era dello smartphone, un’epoca in cui la tecnologia mobile avrebbe ridefinito il modo in cui comunichiamo, ci connettiamo, lavoriamo, giochiamo e viviamo.

Oggi, mentre scrivo queste righe, sento un senso di dรฉjร  vu, una sensazione che lโ€™”iPhone moment” sta per arrivare di nuovo, ma per una tecnologia diversa, o forse meglio, per una convergenza di diverse tecnologie che stanno arrivando ad una fase di maturitร , tutte nello stesso momento. Forse come non รจ mai successo in modo cosรฌ impattante. Un momento che sta preparando il terreno per una trasformazione altrettanto monumentale e che appunto non riguarda solo una tecnologia come successe con il mobile, ma riguarda lโ€™intelligenza artificiale, la blockchain, la mixed reality e diverse altre tecnologie come la sensoristica, la connettivitร  e che stanno definendo la nuova fase di internet.

Una fase che viene battezzata come web3 e che porta internet dal bidimensionale (2D) al tridimensionale (3D) integrando in questo processo di transizione una serie di nuovi paradigmi legati allโ€™ownership delle informazioni, la decentralizzazione, lโ€™intelligenza artificiale ed una nuova capacitร  computazionale e capacitร  di interazione.

Il cambiamento introdotto da questa convergenza tecnologica e lo sviluppo di nuovi dispositivi che stanno entrando sul mercato stanno consentendo la crescita di un altro trend che prende il nome di Spatial Computing. Il computing spaziale, con la sua promessa di unire il mondo fisico e quello virtuale in un continuum senza percezione di discontinuitร , insieme all’AI che offre capacitร  di comprensione, previsione e personalizzazione a livelli prima inimmaginabili, rappresenta un ulteriore cambio di paradigma nellโ€™interazione uomo-macchina.

Stiamo percorrendo la strada che ci porterร  a un futuro in cui lโ€™estensione della realtร  diventerร  la norma, i nostri ambienti di vita e di lavoro saranno arricchiti da informazioni e interazioni virtuali, rendendo la nostra quotidianitร  piรน connessa, intuitiva e piรน avanzata tecnologicamente e potenzialmente piรน umana. Lโ€™impatto che queste tecnologie potranno avere, in particolare lo Spatial Computing, sulla societร  moderna รจ enorme ed abbraccia non solo la sfera personale ed empatica, ma anche quella professionale e la sua efficacia ed efficienza. Se da una parte avremo accesso ad informazioni in una modalitร  nuova, dallโ€™altra avremo strumenti di interazione, nuove forme di apprendimento e di lavoro.

Se il pensiero, mentre si leggono queste prime righe di libro, รจ che il mondo stia andando verso un contesto distopico in cui avremo permanentemente un casco in testa o una maschera sul volto, come nelle visioni fantascientifiche di serie Tv e film iconici come Black mirror o Ready Player One, beh no, lo dico subito, non credo in questo tipo mondo. Ma soprattutto lo spero dal piรน profondo del cuore.

Il motivo per cui ho deciso di scrivere questo libro, e di cui ringrazio #Egea per la fiducia, “Spatial Shift, la convergenza tecnologica di Computing, Mixed Reality, Artificial Intelligence e Blockchain“, nasce da una convinzione profonda che il momento che stiamo vivendo รจ un punto di svolta per la nostra societร , paragonabile appunto all’uscita dell’iPhone e lo sviluppo degli smartphone nella direzione come la conosciamo oggi.

La recente introduzione di dispositivi come il Vision Pro, l’aggiornamento del Quest 3 e lโ€™evoluzione di altri dispositivi e smart glass, insieme agli sviluppi nell’intelligenza artificiale generativa, stanno alimentando un hype ed un entusiasmo che non vedevamo da anni nel settore tecnologico. Tuttavia, questo entusiasmo non รจ infondato; รจ il preludio a un cambiamento epocale nel modo in cui interagiamo con le informazioni, gli ambienti e tra di noi.

Il percorso che ho fatto in questi anni e che mi ha portato a scrivere questo libro รจ stato tanto personale quanto professionale. Negli ultimi anni, ho avuto il privilegio di lavorare a stretto contatto con persone brillanti nellโ€™ambito del design, della user Experience e dello sviluppo di nuove tecnologie, collaborando con aziende, progetti ed eventi che spingevano i confini del possibile, nel loro ambito, sempre al limite. Ho visto da vicino cosa significa progettare progetti di mixed reality in contesti ed industrie differenti, tra successi incredibili e le sfide impreviste che hanno portato anche al fallimento di progetti che apparentemente sembrano eterni. Ho inoltre avuto modo di sperimentar l’entusiasmo di vedere un progetto passare da un’idea su carta a un’applicazione reale e poi vedere lโ€™impatto che questo ha avuto sulle persone, sul come interagiscono con il mondo intorno a loro e come sono cambiate alcune abitudini.

Quando recentemente poi ho avuto modo di provare due nuovi strumenti Quest3, VisionPro e trovarmi a sperimentare con sistemi di Intelligenza Artificiale Generativa in modo diretto, mi sono reso conto che esisteva un vuoto. Mancava un testo che da una parte esplorasse le potenzialitร  tecniche e le applicazioni del computing spaziale e dell’AI, ma che considerasse anche le implicazioni piรน ampie di queste tecnologie, tra modalitร  di progettazione e riflessioni piรน etiche.

Come questo Spatial Shift influenzerร  il nostro modo di vivere, di pensare, di relazionarci? Quali sfide progettuali, tecniche, etiche e sociali dobbiamo anticipare e affrontare? E, forse piรน pressante di tutto, come possiamo assicurarci che queste tecnologie siano utilizzate in modo corretto nel suo complesso, piuttosto che trasformarci in esseri completamente isolati e assuefatti da stimoli digitali e virtuali?

Queste domande mi hanno stimolato nella ricerca e la stesura di questo libro. Ho voluto creare una testo che fosse una prima guida ed un punto di partenza per coloro che sono nuovi a questi concetti, e anche una punto di unione di diversi concetti per coloro che, come me, sono immersi in questi temi da anni.

Spatial Shift, la convergenza tecnologica di Computing, Mixed Reality, Artificial Intelligence e Blockchain” non รจ quindi solo un titolo; รจ una dichiarazione d’intenti. In queste pagine, esploreremo insieme un poโ€™ di storia della realtร  aumentata, la convergenza tecnologica che ci ha portato fino ad oggi, termini, contesti e ambiti in cui lo spatial computing e lโ€™intelligenza non sono (e non saranno) solo strumenti nelle nostre mani, ma fondamenti di una nuova realtร . In modo non del tutto esteso, anche perchรฉ siamo allโ€™inizio di questo viaggio, vedremo come queste tecnologie potranno avere un impatto trasformativo in diverse industrie, dalla sanitร  all’educazione, dal retail all’intrattenimento, e di come stiano riscrivendo le regole del gioco in termini di interazione umana, produttivitร  e creativitร .

Attraverso questo libro, mi auguro di trasmettere non solo la conoscenza e la comprensione di queste potenti tecnologie, ma anche di ispirare una riflessione su come possiamo utilizzarle per creare un futuro in cui la tecnologia arricchisce le nostre vite senza sopraffarle. Un futuro in cui la convergenza tra il mondo fisico e quello digitale ci porta a nuove altezze di innovazione e intimitร  umana, senza perdere di vista i valori che ci rendono veramente umani.

Benvenuti in un viaggio verso il futuro.

Per acquistarlo

Progettare per Apple Vision Pro. Primi passi nello Spatial Computing e le prime lezioni imparate

Come scrivo da giorni, son circa 3 mesi che studio e sperimento in ambiente di sviluppo e test per Apple Vision Pro (nelle prossime ore mi arriverร  il mio primo visore, di due, che ne ho acquistato). Non c’รจ dubbio che fin dall’ambiente di sviluppo, e senza ancora aver avuto modo di fare lunga sperimentazione con l’oggetto fisico – a parte un test di 15 min a Dicembre – il nuovo dispositivo presenta una serie di nuove sfide progettuali, rispetto ad altri visori e rispetto al mondo IOS, da considerare, e che non sono del tutto scontate.

Partiamo da un punto a mio avviso fondamentale:

La forza di Vision Pro non รจ l’hardware ( o meglio non solo e non soprattutto ), ma bensรฌ la visione e la concezione che porta con se a livello di sistema e approccio.

Proprio come ho scritto qui . Detto questo qui di seguito riporto alcuni appunti che in questi mesi ho preso durante la progettazione from scratch per Apple Vision Pro.

Vision Pro non รจ un comune visore AR/VR

L’arrivo di Apple nel mercato dell’AR รจ un tema di discussione, e attesa, di lungo termine e fino a poco tempo fa non c’erano informazioni specifiche per poter iniziare a ragionare su cosa volesse dire progettare per questo device. Per esperienza il processo di migrazione di un applicativo tra diversi visori, cosi come succede tra diversi device smartphone con OS differenti, implica l’adattamento di piรน parti del progetto, dalla UX alle scelte tecniche di sviluppo, nonchรฉ in alcuni casi anche servizi per gestire correttamente le dinamiche dell’OS / ambiente di riferimento. Sono pochi i casi che permettono di lasciare il design pressochรฉ inalterato, ma nel caso del VR invece รจ prassi.

Nel caso di Apple, rientriamo assolutamente nel secondo caso, ossia รจ un nuovo approccio, ergo รจ un contesto del tutto nuovo in cui sviluppare applicativi immersivi “per Vision pro“, e non “anche per Vision Pro“.

Da documentazione Apple รจ palese fin da subito che non si parla di AR / VR, ma di Spatial Computing. Di questo in questi giorni ne ho giร  ampiamente parlato e scritto,ย  e anche se per molti puรฒ sembrare solo marketing, a mio avviso ci sono alcune differenze reali nel modo in cui questo visore รจ progettato rispetto a Quest 3 e altri visori provati negli ultimi due anni.

Un ambiente di sviluppo, per diverse modalitร 

Per prima cosa in questo contesto รจ importante definire le tipologie di applicazioni sviluppabili. In particolare in Vision Pro ci sono tre tipi di app che si possono sviluppare: windowed, bounded e unbounded (sono termini ereditati da Unity). Nel contesto dell’Apple Vision Pro, i tre approcci alla progettazione di applicazioni rappresentano modi differenti di sfruttare le capacitร  di spatial computing del dispositivo. Questi approcci definiscono come l’applicazione interagisce con lo spazio dell’utente e il grado di immersivitร .ย 

  • Windowed: le applicazioni “windowed” sono quelle che appaiono agli utenti come finestre fluttuanti nello spazio davanti a loro, in modalitร  Passthrough, simili a come le finestre appaiono su un computer desktop tradizionale. Questo approccio consente agli utenti di interagire con l’applicazione in un formato rettangolare 2D, mantenendo contemporaneamente la consapevolezza dell’ambiente fisico. รˆ l’opzione meno immersiva tra le tre, ma offre grande flessibilitร  e puรฒ essere particolarmente utile per applicazioni che non richiedono un’esperienza completamente immersiva o per quelle che devono essere eseguite in parallelo ad altre attivitร , in multi tasking praticamente.
  • Bounded: le applicazioni “bounded” sono progettate per operare all’interno di un volume definito, o “bounded space”, nello spazio fisico dell’utente. Questo significa che l’app crea un’esperienza 3D immersiva che gli utenti possono esplorare o interagire entro i limiti di uno spazio virtuale delimitato. Il volume puรฒ essere visualizzato come una porzione di spazio virtuale che coesiste con il mondo reale, permettendo agli utenti di muoversi e guardarsi intorno all’interno dei confini definiti. Questo approccio รจ piรน immersivo rispetto alle applicazioni windowed, offrendo un’esperienza che sfrutta la percezione dello spazio 3D pur essendo ancorata a un’area specifica del mondo reale.
  • Unbounded: le applicazioni “unbounded” rappresentano il livello piรน elevato di immersione, in cui l’esperienza virtuale non รจ confinata da limiti spaziali definiti. In questo scenario, l’app puรฒ trasformare l’intero ambiente circostante dell’utente in uno spazio di gioco o di lavoro virtuale, permettendo interazioni e movimenti virtuali senza restrizioni spaziali. Questo approccio รจ ideale per esperienze di realtร  aumentata o virtuale che intendono sostituire o trasformare completamente la percezione dell’ambiente fisico dell’utente, offrendo la massima libertร  nell’esplorazione di mondi virtuali.

Ogni approccio ha i suoi vantaggi specifici e la scelta tra windowed, bounded e unbounded dipende dagli obiettivi dell’applicazione, dalle esigenze degli utenti e dal tipo di esperienza che si desidera creare. L’Apple Vision Pro, in questo modo offre agli sviluppatori la flessibilitร  di esplorare questi diversi approcci per progettare esperienze utente innovative e coinvolgenti.

Un approccio flessibile e unico (per adesso)

Tecnicamente non c’รจ una netta divisione in questo contesto di sviluppo. Da parte di Apple, ci sono finestre o volumi (oggetti ed entitร ) che possono apparire in modalitร  Shared Space o Full Space, in Passthrough o in un ambiente VR completamente immersivo. Un’app nel caso di Vision pro puรฒ combinarli tutti insieme, in vari modi.

Faccio degli esempi per rendere meglio l’idea.ย Nel caso di Apple รจ possibile per esempio sviluppare un gruppo di finestre, che si combinano con un gruppo di volumi, in uno spazio Full o Shared. In questo caso si puรฒ passare da uno all’altro, a seconda delle esigenze dell’utente, e si possono creare dinamiche di interazione e spostamento particolari: la vera distinzione da รจ tra il come il contenuto รจ rappresentato ( finestra 2D o volume 3D) e in quale spazio si trova (condiviso con altre app o non condiviso), e soprattutto se รจ in Passthrough o in VR completo. Molte applicazioni per necessitร  o precedenti sviluppi in altri ambienti e device nascono con modelli vincolati, mentre nel caso di Apple, se si vuole mantenere una completa flessibilitร  la soluzione piรน semplice (e probabilmente corretta) รจ utilizzare in modalitร  Full Space. L’unico caso che diventa veramente vincolate e inibisce alle applicazioni di poter esser gestite contemporaneamente ad altre รจ lo sviluppo Unbounded/Full Space, che ha di per se molti vantaggi, ma ha lo svantaggio principale che l’utente appunto non puรฒ aprire applicazioni una a fianco all’altra.

In pratica se vogliamo realizzare applicazioni che permettano all’utente in contemporanea di leggere la posta, navigare in internet, ascoltare musica, guardare un video, giocare e fare qualsiasi altra cosa dobbiamo realizzare app bounded e in uno spazio condiviso. Questo tipo di soluzione di sviluppo, che dal possibilitร  di utilizzo senza soluzione di continuitร , da la sensazione di essere magica. E questa cosa per adesso la si puรฒ fare solo in Apple Vision Pro.

Quando Apple menziona lo Spatial Computing in pratica non parla di AR o VR, ma si riferisce esattamente a questo.

Apple Vision pro รจ “un computer indossabile”. E non lo dico solo per un tema di hardware o caratteristiche tecniche, ma per via dell’ecosistema che Apple vuole integrare e lo scopo che vuole raggiungere: un dispositivo, come un computer personale, indossato sulla testa, con cui puoi fare tutto, ovunque.

Scegliere quindi in quale spazio si trova l’app, a mio avviso รจ la prima fase della progettazione dell’esperienza dell’applicativo che si vuole sviluppare e che consentirร  al progetto di poter sfruttare a pieno le potenzialitร  del visore. Non c’รจ dubbio che allinearsi alla visione di Apple, come successo negli anni con le linee progettuali dettate da Apple stessa per IOS, possa accelerare lo sviluppo e trovarsi esattamente a progettare nel corretto paradigma – approvato da Apple appunto – e su cui il visore di fatto nasce.

La differenza dei controlli tra Apple Vision Pro e gli altri sistemi

Una delle cose che mi ha sorpreso negli ultimi anni รจ quanto i giochi VR possano essere accessibili ai non giocatori, per quanto il numero di visori e la diffusione dei giochi VR non sia ancora cosรฌ estesa. Uno dei motivi della semplicitร  d’uso a primo impatto รจ senza dubbio il controllo all’interno del gioco, ossia per la VR รจ viene chiamato controllo diretto. Questo รจ un modo elegante per dire che giochi attraverso l’incarnazione diretta e questa forma di controllo รจ estremamente intuitiva, perchรฉ tutti sanno come usare il proprio corpo.

All’interno del Vision Pro, il paradigma di controllo รจ differente. In Vision pro le cose con cui puoi interagire le guardi e poi le pizzichi. In pratica รจ come se gli occhi fossero il puntatore del mouse e al tuo pizzico delle dita il clic sul tasto sinistro. Questo รจ quello che Apple chiama il controllo indiretto. Se il controllo diretto รจ intuitivo, il controllo indiretto all’inizio lo รจ un po’ meno.

I concetti di controllo diretto e controllo indiretto si riferiscono quindi a due diversi modi in cui gli utenti possono interagire con le interfacce digitali, in particolare nel contesto di dispositivi come l’Apple Vision Pro e altri sistemi di realtร  aumentata o virtuale.

  • Controllo Diretto: il controllo diretto si basa sull’interazione fisica e intuitiva con l’ambiente virtuale. In pratica, significa che le azioni dell’utente nel mondo reale vengono mappate direttamente nel mondo virtuale in modo uno a uno. Ad esempio, se in un gioco VR l’utente vuole afferrare un oggetto, estenderร  la mano e lo prenderร  proprio come farebbe nella vita reale. Questo approccio รจ definito “diretto” perchรฉ l’azione compiuta ha un corrispettivo immediato e intuitivo nell’ambiente virtuale, rendendo l’esperienza di gioco o l’interazione estremamente naturale e accessibile anche per chi non รจ abituato ai videogiochi. La tecnologia di tracking di movimento, come il tracciamento delle mani e dei movimenti del corpo, รจ cruciale per questo tipo di controllo.
  • Controllo Indiretto: il controllo indiretto richiede invece un’azione che non corrisponde fisicamente all’azione che si verifica nel mondo virtuale. Utilizzando l’esempio dell’Apple Vision Pro, gli utenti interagiscono con l’ambiente virtuale guardando gli oggetti e compiendo un gesto specifico, come un pizzicotto, per selezionarli o interagire con essi. In questo caso, lo sguardo dell’utente funziona, come detto, come un cursore del mouse, e il “clic” delle dita sostituisce il mouse. Questo metodo รจ considerato “indiretto” perchรฉ c’รจ una disconnessione tra l’azione fisica e il risultato nell’ambiente virtuale; l’utente non tocca o afferra fisicamente l’oggetto, ma usa un’interazione basata su gesti per controllarlo.

Scegliere tra un controllo diretto o indiretto

Non c’รจ dubbio che la modalitร  in controllo indiretto debba esser appreso dall’utente poichรฉ, almeno nella fase iniziale, non risulta naturale, soprattutto se paragonata ad altre esperienze di altri visori per gli utenti che hanno giร  avuto altre esperienze.

Ma questa fase di apprendimento, l’abbiamo giร  vissuta piรน volte e non รจ stato un disastro, anzi:

  • le levette analogiche introdotte per la prima volta nei videogiochi
  • il cursore del mouse e la sua interazione con il sistema operativo
  • lo swipe di apple per lo sblocco del cellulare per per le diverse interazioni

Ogni nuova interazione porta con se una nuova fase ed una nuova curva di apprendimento. E non necessariamente รจ un male.

Ora, rispetto il punto รจ “scegliere tra un controllo diretto o indiretto”. Ovviamente la prima riflessione รจ che aย seconda del tipo di sviluppo che si affronta รจ corretto pensare di sviluppare differenti tipologie di interazione, o eventualmente supportare sia il controllo diretto che quello indiretto.

I sistemi di interazione indiretta a mio avviso prenderanno popolaritร  per la loro versatilitร  e capacitร  di adattarsi soprattutto alla pigrizia umana, offrendo un’interfaccia concettualmente trasparente che permette di compiere molteplici azioni con minimi spostamenti nel mondo reale. Questo tipo di controllo diventa essenziale in ambienti con spazi limitati, dove l’interazione diretta fisica รจ impraticabile, e aggiungo in contesti in cui l’utilizzo del visore รจ in condizioni di lavoro “stabili” ed il visore รจ il sostituto di un equipaggiamento fatto di pc, device mobile e monitor. In tali contesti, gli utenti interagiscono con il sistema da una certa distanza, rendendo le azioni simili all’uso di un mouse in un ambiente 2D, ma con la tecnologia che interpreta automaticamente la profonditร  e l’orientamento desiderato. Questo approccio consente una partecipazione efficace e comoda in progetti complessi senza la necessitร  di movimenti ampi o fisici, adattandosi perfettamente a situazioni dove lo spazio รจ un vincolo.

In pratica progettare per il controllo indiretto significa tornare a progettare nel modo in cui si farebbe per un mouse o un controller. Invece di mappare il movimento fisico del giocatore uno a uno nel mondo virtuale, va ripensato in modo che una piccola quantitร  di movimento abiliti un ampio spazio di possibilitร  nello spazio di interazione.ย Questo schema di controllo si basa molto sul tracciamento degli occhi.

Tracciamento Oculare, tra punti di forza e debolezze

Il tracciamento oculare del Vision Pro รจ sicuramente molto efficace e preciso, seppur tecnicamente non sbagli mai su punto in cui gli occhi sono puntati, il modo in cui deve esser implementato e utilizzato ha ancora delle debolezze (che non ho dubbi verranno migliorate).

Prima di tutto il tracciamento oculare come metodo di input presenta un potenziale limite legato alla necessitร  di eseguire azioni in modo sequenziale, a causa della limitazione naturale di poter focalizzare visivamente un solo elemento alla volta. Questo implica che, nonostante la potenziale rapiditร  e intuitivitร  dell’interazione visiva, gli utenti sono vincolati a comunicare le loro intenzioni al sistema in una sequenza temporale definita. Questo vincolo puรฒ limitare la capacitร  di multitasking, in particolare in contesti dove l’efficienza e la simultaneitร  delle azioni sono cruciali. รˆ possibile organizzare le interazioni in modo che consentano una forma di multitasking sequenziale, ad esempio attraverso l’uso combinato di input visivi e gestuali che permettono di gestire diversi elementi quasi contemporaneamente.

Secondo tema รจ relativo alla percezione visiva umana, caratterizzata da rapidi e brevi movimenti degli occhi che spostano il punto di focalizzazione, introduce ulteriori complicazioni nel tracciamento oculare. Questi aspetti biologici possono distorcere la corrispondenza tra l’intenzione dell’utente e il punto effettivo di focalizzazione, portando a discrepanze tra dove l’utente crede di aver guardato e dove i suoi occhi si sono effettivamente mossi. Questo fenomeno puรฒ causare interazioni imprecise o non intenzionali, sottolineando l’importanza di considerare le peculiaritร  della visione umana nella progettazione di interfacce basate sul tracciamento oculare. La sfida che vedo รจ quella di progettare sistemi che tengano conto di queste limitazioni, minimizzando gli errori e migliorando l’esperienza utente attraverso un’interpretazione accurata delle intenzioni visive.

Da considerare infine รจ l’ottimizzazione delle interfacce di tracciamento oculare ed in particolare va fatta molta attenzione al tempo di reazione richiesto nell’interazione, alla disposizione spaziale degli elementi interattivi e ai falsi positivi. Minimizzare la possibilitร  di azioni non intenzionali e ridurre l’impatto degli errori diventa fondamentale per mantenere un’esperienza utente positiva, fluida e che non generi frustrazione. Strategie come la distanza minima tra gli elementi interattivi e la conferma delle azioni critiche possono mitigare le conseguenze degli errori e migliorare significativamente l’usabilitร . La progettazione di interfacce , soprattutto in un contesto immersivo / sensoriale deve quindi bilanciare l’introduzione di esigenze tecnologica e comportamento umano, al fine di creare sistemi di interazione che siano sia avanzati che intuitivi.

Personalizzazione dell’esperienza utente su Apple Vision Pro

Un aspetto fondamentale nella progettazione di applicazioni per Vision Pro รจ l’importanza di offrire esperienze altamente personalizzabili. Nell’era del computing spaziale e dell’iperpersonalizzazione, la UX si trasforma richiedendo un approccio che vada oltre la “semplice” navigazione tradizionale. Lo sviluppo deve pertanto considerare che il design possano adattarsi non solo alle diverse modalitร  di interazione (diretta e indiretta), ma anche alle preferenze individuali degli utenti. La capacitร  di modificare impostazioni quali la scala di visualizzazione, la sensibilitร  dei controlli o gli schemi di colore diventa cruciale per accogliere un pubblico ampio e diversificato. Questo livello di personalizzazione non solo migliora il comfort e l’usabilitร , ma incoraggia anche un maggior grado di immersione e soddisfazione dell’utente, ed accessibilitร .

Game Design per l’Immersivitร  Spaziale

Nel contesto di Vision Pro, il game design assume nuove dimensioni, spingendo lo sviluppo a forme di esplorazione innovative e meccaniche di gioco che sfruttino appieno le capacitร  dello spatial computing. La progettazione di giochi in ambienti windowed, bounded e unbounded offre opportunitร  senza precedenti per creare esperienze ludiche che si intrecciano con l’ambiente fisico dell’utente. Questo richiede una riflessione approfondita su come gli elementi di stimolo possano esser applicati per far emergere ed attivare comportamenti ed interazioni all’interno di spazi reali e virtuali, in un continuo di esperienza. Elementi come la realtร  aumentata dinamica, gli oggetti interattivi che reagiscono alla presenza fisica e ai movimenti dell’utente, l’interazione con oggetti fisici, sensori e la narrazione che si adatta all’ambiente circostante, pongono le basi per una nuova era del game design, dove l’ambiente stesso diventa un componente chiave del gameplay.

Lo spazio condiviso: ottimizzazione e integrazione

Nella progettazione di applicazioni che utilizzano lo “spazio condiviso” diventa importante e fondamentale considerare l’impatto sulla potenza di calcolo del dispositivo e sul carico cognitivo degli utenti. Le applicazioni in questi contesti non operano in isolamento (ossia in modalitร  unica) ma coesistono con altre applicazioni, condividendo di conseguenza le risorse limitate come la potenza di elaborazione. Questo implica la necessitร  di ottimizzare le prestazioni senza presupporre l’accesso esclusivo alle risorse del sistema. Allo stesso tempo, รจ essenziale progettare esperienze che non sovraccarichino l’utente, lasciando spazio cognitivo (in modo fagocitante) per altre attivitร  parallele, sottolineando l’importanza di un design che sia efficiente e non invadente.

Il concetto di spazio condiviso estende la sua rilevanza ed importanza progettuale anche al tema sonoro delle applicazioni. Nello sviluppo di un applicativo devono esser bilanciate la creazione di un contesto ambientale sonoro coinvolgente e la consapevolezza che esisteranno altri suoni nell’ambiente dell’utente fisico circostante. Questo richiede un attento lavoro di design del suono che consideri la coesistenza di fonti sonore multiple, garantendo che l’audio dell’applicazione non sia invasivo ma piuttosto si integri armoniosamente con il contesto di utilizzo. Son parecchi i giochi e applicazioni giร  presenti in altri store VR che non hanno una corretta attenzione progettuale a queste dinamiche.

Sfide e Strategie nello Sviluppo per Piattaforme Avanzate

Ultimo tema da affrontare รจ relativo alla scelta della piattaforma di sviluppo per un progetto, e qui le opzioni spaziano da ambienti nativi, come Swift per dispositivi Apple, a motori di terze parti come Unity. La decisione dipende spesso dalla familiaritร  con l’ecosistema e dalla valutazione dei rischi e delle tempistiche di sviluppo del singolo progetto.

Sviluppare nativamente puรฒ offrire un accesso diretto alle ultime funzionalitร  e ottimizzazioni e caratteristiche tecniche del dispostivo stesso e dell’OS (come succede dopo tutto con swift su IOS), ma richiede una conoscenza approfondita della piattaforma. Al contrario, l’uso di motori di terze parti puรฒ accelerare lo sviluppo grazie alla loro flessibilitร  e alla vasta gamma di funzionalitร , anche se potrebbe comportare limitazioni in termini di accesso alle funzionalitร  piรน recenti e specifiche del dispositivo ed una maggiore dipendenza da aggiornamenti di terze parti.

Le differenze architetturali tra le piattaforme di sviluppo possono presentare complessitร  differenti: un esempio, in particolare, riguarda lo sviluppo in Unity (e prossimamente anche Unreal) nell’interazione con l’hardware di ogni specifica piattaforma (VisionPro, Quest3, altri) e creare delle discrepanze nella gestione del rendering, conversioni di materiali e shader, e differenze nel modo in cui di conseguenza la logica dell’applicativo interagisce con le API native.

Nello specifico questa fase di approccio alla scelta necessitร  di una comprensione dettagliata degli ambienti e delle loro peculiaritร  al fine di ottimizzare le prestazioni e garantire che il progetto funzioni come previsto. Se ci pensate non รจ diverso da quanto accade quando scegliamo di sviluppare app mobile in nativo o con framework come Flutter o altro.

Le questioni di rendering, in particolare, possono essere complesse, con considerazioni da valutare sull’efficacia in termini di risoluzione, framerate, latenza e come queste influenzano di conseguenza l’esperienza utente.

Last, but not Least… i dati e la privacy

La progettazione di applicazioni piรน complesse ci mette davanti anche temi da trattare come privacy e l’accesso ai dati, soprattutto in contesti di spazio condiviso. L’accesso a dati ed informazioni sensibili come la posizione dell’utente o il movimento degli occhi puรฒ essere limitata per motivi di sicurezza.

Nella fase di analisi di un progetto รจ importante comprendere fin da subito quali restrizioni dover affrontare bilanciando le necessitร  funzionali dell’applicativo con il rispetto della privacy dell’utente, cercando soluzioni creative per migliorare l’interazione senza compromettere la sicurezza e quindi danneggiare l’adozione.

Insomma, in questo viaggio appena iniziato vedo una potenzialitร  enorme, ma soprattutto uno spazio tutto nuovo di possibili progettualitร  che, ad oggi, nemmeno immaginiamo. Esattamente come quando per la prima volta iniziammo a pensare alla prossima app per iPhone.

Ilย VisionProย รจ il secondo device dopo l’Iphone ad avermi stupito

La penso cosรฌ, come Altman. Lo dico da Dicembre quando ho avuto modo di provarlo la prima volta: ilย #VisionProย รจ il secondo device dopo l’Iphone ad avermi stupito per l’impatto potenziale che avrร . Non c’รจ dubbio secondo me che questo dispositivo segnerร  una evoluzione in tutta l’industria e aggiungo in tutte le industrie che lo adotteranno mettendo in discussione nuovi modelli di servizio.

Ci sono diverse cose sottovalutate rispetto a questo device:

  • fa parte di un ecosistema di dispositivi e servizi integrati
  • ha una esperienza d’uso lato ux giร  nota agli utenti
  • ha una community di sviluppatori enorme e consolidata
  • รจ di proprietร  di un brand in grado di influenzare cambiamenti

Il prezzo e la vendita solo usa non sono un problema come ho giร  scritto. Anzi sono parte integrante della strategia di barriera all’ingresso, messa appositamente per:

  • avere il tempo di popolare lo store di applicazioni e servizi per non far sembrare il device noiso (come altri e come giร  successo ad alcuni ecosistemi smartphone)
  • amplificare l’effetto mediatico e creare senso di esclusivitร 
  • trasformare una aspettativa nerd in un desiderio di life style

รˆ il prodotto definitivo? Ovviamente no. Questo non รจ non sarร  l’unico dispositivo, รจ il primo di un viaggio in una industria dove Apple ha atteso di entrare, pur studiando da anni.

Sarร  un prodotto di massa nell’immediato? Sicuramente no. Per adesso. Ci vorrร  tempo e maggiore maturitร , tecnologica, e di mercato.

Vedremo app e servizi stupidi e futuli? Ovviamente si, come successo anche alle app dell’Iphone e servizi inutili dei primi anni, fallimenti e progetti morti, che perรฒ hanno permesso di capire, migliorare e raggiungere il modo in cui utilizziamo oggi il device, come hub.

Avrร  altre potenzialitร  oltre quello che vediamo adesso? Ne sono certo, perchรฉ gradualmente capiremo in che modo potremo accedere una realtร  sempre piรน estesa.

Da Lunedรฌ, con l’arrivo del primo dei 2 device che ho preso (si lo so, sembra una follia ma ha un senso, ve lo racconterรฒ) sarรฒ al lavoro proprio su progetti che mettono insieme #SpatialComputingย #AIย eย #Gamification.

Sono elettrizzato come quando mi stava arrivando il primo iphone.