Foundation Models: immagini come input nei modelli AI per gli sviluppatori

Con iOS 27 e macOS Golden Gate, il framework Foundation Models consente agli sviluppatori di passare immagini come input diretto ai modelli on-device, aprendo nuovi scenari per app di analisi visiva senza dipendere dal cloud.

Multimodalità nelle mani degli sviluppatori

Fino a WWDC 2026, il framework Foundation Models che Apple mette a disposizione degli sviluppatori gestiva principalmente input testuali. Il Platforms State of the Union e la successiva sessione sul framework hanno confermato che ora gli sviluppatori possono usare immagini come input nei modelli on-device. Lo ha riportato anche il live blog di Engadget: "Developers can use images as input in the foundation models framework now."

Custom skills e server models

Insieme al supporto multimodale per le immagini, Apple ha annunciato che sviluppatori possono definire "custom skills" — capacità personalizzate che estendono il comportamento del modello — e accedere a server models oltre ai modelli locali. Questo amplia significativamente il perimetro applicativo: non piú solo assistenti testuali, ma app che analizzano fotografie, documenti scansionati o screenshot direttamente sul dispositivo.

Perché conta per la privacy

Il punto qualificante rimane l'esecuzione on-device: un'app che analizza immagini attraverso Foundation Models non invia dati fotografici verso server esterni. Per categorie sensibili — immagini mediche, documenti d'identità, fotografie personali — si tratta di una distinzione concreta rispetto a soluzioni cloud. Resta da verificare, nel corso delle sessioni tecniche dei giorni successivi al keynote, quali siano i limiti dimensionali e prestazionali sui dispositivi piú datati compatibili con iOS 27.

← Torna alla home