Articoli
6 minuti
Tech & Innovazione
Tech & Innovazione

Gli algoritmi riconoscono sempre meglio forme, immagini e oggetti: ecco come e che cosa significa per il futuro

19 giugno 2020
autore:

Gli algoritmi di deep learning fanno ormai parte della nostra vita quotidiana e la loro capacità di identificare e classificare gli oggetti negli ultimi anni ha subito un’accelerazione enorme, portando a un’evoluzione nel campo dell’intelligenza artificiale che apre a sviluppi e applicazioni sempre più rapide e sofisticate. Marco Fosci, esperto di algoritmi di deep learning che per Eastwest segue in particolare il rapporto tra geopolitica e intelligenza artificiale, spiega le prospettive che ci attendono in un futuro così prossimo da essere già in corso.

Lo fa innanzitutto raccontando le origini degli studi sull’intelligenza artificiale che “Come ambito di ricerca esiste dagli anni Cinquanta e oggi usa un ampio ventaglio di tecniche e algoritmi, tra i quali quelli di machine learning, con cui si insegna alle macchine ad apprendere. Il deep learning è appunto una di queste tecniche, che si è sviluppata enormemente negli ultimi dieci anni”, racconta Fosci. Gli algoritmi di questo tipo esistono dagli anni Ottanta, ma solo di recente l’accelerata nell’evoluzione del deep learning, con il tentativo di creare una macchina ispirata alla nostra architettura cerebrale, ha portato alla riproduzione delle reti neurali, meccanismi che permettono al cervello umano di elaborare le informazioni.

Le reti neurali sono strati (layers) di neuroni che possono riunirne un numero molto vario – uno, dieci, 100, anche 1000. Più strati si sovrappongono e più la rete diventa complessa. Come i neuroni umani assorbono vari impulsi, per rilasciare una scarica elettrica al raggiungimento di una determinata soglia, così le reti neurali artificiali sono algoritmi in cui ogni “neurone” viene attivato al raggiungimento di una certa soglia, trasmettendo l’informazione allo strato successivo. Proprio come un cervello umano, anche una macchina, attraverso le sue reti neurali, può apprendere informazioni e distinguere oggetti.

La prima vera tappa di questa evoluzione è il 1998, con la creazione di un algoritmo in grado di distinguere le cifre da 1 a 9 scritte a mano. Ma la svolta arriva nel 2010, quando la capacità computazionale dei processori è ormai così elevata da permettere l’uso delle reti neurali, che fanno calcoli ancora semplici, ma in grandi quantità. “Nel 2012 la rete neurale profonda (cioè con più di due strati) AlexNet partecipa con risultati incredibili a ImageNet, una gara indetta tra gli sviluppatori per il riconoscimento di un dataset di immagini, organizzate e classificate,” racconta Fosci. “Tra circa 20mila oggetti classificati, l’algoritmo deve capire a quali etichette corrisponde una certa immagine: prima di AlexNet gli algoritmi individuavano circa il 70% delle immagini che processavano , con un margine di errore del 28%, che ora crolla al 15%”. Dopo AlexNet, lo sviluppo delle reti neurali profonde è ancora più veloce: a cavallo tra il 2015 e il 2016 si raggiunge il 3% di errore, che cala ancora gli anni successivi. “Gli algoritmi sono diventati più efficienti nel riconoscimento di immagini dello stesso cervello umano, che ha un margine di errore del 5%”, sottolinea l’esperto.

Già oggi, gli ambiti di applicazione di questa tecnologia sono infiniti: dalla funzionalità di riconoscimento facciale per sbloccare lo schermo dello smartphone, ai veicoli senza guidatore che, per esempio, individuano i pedoni che stanno attraversando la strada e si fermano per farli passare. Al momento gli algoritmi non individuano solo gli oggetti presenti in un’immagine, ma anche la loro posizione e altri dettagli, al punto che non si limitano più a dire se una certa immagine rappresenta un gatto, ma persino se l’animale in questione sta giocando o dormendo. “Uno sviluppo interessante e sempre più presente,” spiega Marco Fosci, “sarà quello relativo ai deep fake, video falsi che sono sia creati che riconosciuti come fasulli da algoritmi di computer vision”. Anche l’advertising sfrutta gli algoritmi che riconoscono gli oggetti, a partire dai social: “Facebook non solo riconosce che nelle foto che postiamo ci sono delle persone, suggerendoci di taggarle, ma individua gli oggetti presenti per poi mostrarci la pubblicità di merci simili, dalla crema solare agli occhiali da sole che usiamo in una foto postata da una spiaggia”.

Quella che potrebbe sembrare fantascienza è già realtà: negli Stati Uniti alcune aziende producono telecamere intelligenti per i negozi che, oltre a fare videosorveglianza – pur garantendo di tutelare la privacy dei clienti – registrano in quale parte dello store i consumatori si soffermano e magari anche la loro espressione facciale: “Per esempio, gli algoritmi rilevano quante persone, sul totale di quelle che entrano nel negozio, si fermano davanti a un manichino vestito in un certo modo e quante davanti a un altro e riconoscono l’espressione del loro volto, disgustata, incuriosita o sorridente; per il negozio sono informazioni preziosissime che, combinate con i dati d’acquisto, permettono di sapere se la sua strategia funziona o no”. Questo non accade solo nei centri commerciali, ma anche per la cartellonistica pubblicitaria stradale, attraverso piccole telecamere o schermi: anche qui può essere utile sapere che espressione hanno i passanti che osservano determinate pubblicità, o quanto tempo vi si soffermano.

Queste immense potenzialità, specialmente se applicate alla pubblicità, pongono interrogativi etici in grado di avere ripercussioni profonde sulla nostra società e di cui anche la normativa dovrà tenere conto. “Nei primi anni 2000 Google ha cominciato a usare a fini commerciali i dati che raccoglieva sulle ricerche fatte dagli utenti: nessuno – e nemmeno gli sviluppatori di Google – capiva ancora che portata avrebbe avuto quella possibilità”, conclude Marco Fosci. Allo stesso modo, non possiamo prevedere tutte le implicazioni della computer vision nell’advertising. L’unica certezza su cui nessuno ha più dubbi è che questa tecnologia sarà il punto di svolta nel cambiare in modo radicale la nostra società nell’arco dei prossimi 50 anni.

Vuoi informazioni sulla nostra consulenza e sui nostri servizi?

Naviga il sito e vedi tutti i contenuti di tuo interesse