IL DEEP LEARNING AGGIUNGE VALORE ALLE SOLUZIONI VIDEO

In questo articolo Uri Guterman , Product & Marketing Manager di Hanwha Techwin Europe e Alessia Saggese, PhD, socio di A.I. Tech e professore universitario presso l’Università di Salerno, forniscono una panoramica sul deep learning e spiegano in che modo le due aziende stanno lavorando insieme per introdurre soluzioni che aggiungeranno valore ai sistemi di videosorveglianza tramite vantaggi tangibili e apprezzabili nella vita di tutti i giorni.

I progressi nello sviluppo dell’intelligenza artificiale e della visione artificiale sono avvenuti in maniera così rapida che alcuni tra i maggiori esperti di tecnologie, come lo scienziato Yann LeCun, hanno scherzosamente definito il lavoro svolto su questi temi prima del 2012 come ‘preistoria’. In termini di riconoscimento degli oggetti, gli algoritmi disponibili in quel momento avevano una precisione che si aggirava intorno al 75%. Oggigiorno, grazie all’introduzione di approcci basati sul deep learning, possiamo aspettarci un’accuratezza molto più alta. I progressi compiuti negli ultimi 12 mesi ci fanno pensare che siamo in grado di considerare seriamente l’integrazione di queste tecnologie nella maggior parte dei sistemi di videosorveglianza.

Sarebbe sbagliato considerare il Deep Learning come una sorta di piattaforma di analisi video avanzata; infatti, all’interno del settore della sicurezza rappresenta un totale cambiamento di paradigma rispetto alle modalità di rilevamento di eventi e relativa risposta agli incidenti.

 

Cos’è il Deep Learning?

A differenza della maggior parte dei software di analisi video, il programmatore di applicazioni basate su Deep Learning non deve scrivere complicati algoritmi per consentire il riconoscimento degli oggetti. Una soluzione basata su Deep Learning, infatti, è in grado di “imparare dagli esempi”. Nel senso che durante la fase di addestramento iniziale, all’applicazione viene fornita una gran mole di dati rappresentante esempi correttamente risolti, come ad esempio la classificazione di una persona per età o genere.

Una rete neurale profonda (una “deep network”) analizza la relazione tra i dati di input e l’output atteso (come il genere di una persona) e impara come risolvere il problema tramite analogie. Ad esempio, affinché una rete neurale profonda sia in grado di stabilire correttamente il genere di una persona, un esperto di AI deve progettarla, addestrarla sottoponendole un database di milioni di volti opportunamente selezionati, ognuno dei quali è etichettato con il suo vero genere, e infine confermare la correttezza dei risultati. Dopo diversi giorni di apprendimento, la rete neurale è pronta per essere messa al lavoro ed è probabile che abbia una precisione di circa il 98%, che equivale all’incirca alla capacità degli esseri umani di fare la stessa cosa.

 

La sfida

Il deep learning richiede l’esperienza di esperti del settore, insieme ad enormi risorse di calcolo, poiché l’applicazione deve essere in grado di far fronte alle sfide del mondo reale, come il cambio delle condizioni di illuminazione, le ombre, la posizione di un volto, ecc.

Di conseguenza qualsiasi soluzione Deep Learning, anche la più basilare, dovrà essere processata su server avente una quantità adeguata di potenza di calcolo e memoria. Una condizione necessaria comunemente riconosciuta all’integrazione funzionale del deep learning nella maggior parte dei sistemi di videosorveglianza è la presenza di un’architettura software ottimizzata che ne permetta l’esecuzione a bordo camera. Eseguire una applicazione di analisi video a bordo camera significa far funzionare l’applicazione direttamente sull’hardware del dispositivo su cui è installata (la camera appunto), proprio come accade con le app nel caso di smartphone e tablet.

 

La partnership A.I. Tech e Hanwha Techwin

Ridurre i requisiti di elaborazione del Deep Learning in modo che possa essere eseguito a bordo camera non è un’impresa da poco, ecco perché Hanwha Techwin sta sostenendo la sfida di produttori di soluzioni di videosorveglianza, lavorando a stretto contatto con esperti specializzati in questo settore, al fine di avere accesso alle ultime innovazioni e ricerche.

Per Hanwha Techwin, questo significa lavorare in collaborazione con A.I. Tech – uno spinoff del Dipartimento di Ingegneria dell’Informazione ed Elettrica e Matematica Applicata – DIEM dell’Università degli Studi di Salerno (UNISA), che ha un gruppo di ricerca dedicato allo sviluppo di ‘Macchine Intelligenti per il Riconoscimento di Video’ (MIVIA Lab). Il Chairman di AI Tech, Mario Vento, è considerato tra i migliori scienziati italiani in ambito ingegneristico ed è anche tra gli autori italiani più citati nel campo della Visione e dell’Intelligenza Artificiale.

 

Telecamere con intelligenza artificiale

Hanwha Tecwhin sta anche lavorando all’introduzione, entro fine 2019, di nuove telecamere Wisenet dotate di un chipset di visione artificiale che consentirà di eseguire a bordo le applicazioni di Deep Learning. Queste nuove telecamere 4K e 5 MP, che saranno aggiunte alla nostra serie premium Wisenet P, andranno inizialmente a fornire versioni più precise degli attuali tipi di analisi video. Tuttavia, per i nostri partner rappresenteranno anche una piattaforma utile per introdurre applicazioni di Deep Learning all’avanguardia in grado di integrarsi perfettamente con le nuove telecamere.

 deep2

Hai domande sul Deep Learning? Invia un’email a Uri Guterman [email protected] o ad Alessia Saggese [email protected]