Tecnologie all’avanguardia per soluzioni pratiche

IA • NLP • ML • SES

La nostra tecnologia integra metodi all’avanguardia e la nostra professionalità si è dimostrata vincente in una ampia gamma di problematiche e obiettivi. Reveal punta su nuove modalità di utilizzo delle tecnologie per superare le consuete limitazioni lessicali. L’impegno della nostra ricerca è focalizzato a produrre soluzioni pratiche e funzionali, realmente rispondenti alle necessità delle organizzazioni.

Reti Neurali per Previsioni Complesse

Modelli induttivi come le Reti Neurali e la loro capacità di gestire evidenze eterogenee, rumorose, multimodali e non strutturate sono una tecnologia cruciale per i moderni modelli di business.

La complessità della moderna gestione aziendale è fortemente determinata dai grandi volumi di dati che i manager sono oggi chiamati ad analizzare prima che il processo decisionale possa avere luogo. L’apprendimento approfondito si riferisce tipicamente ad un insieme di approcci neurali che deducono modelli gerarchici complessi per catturare relazioni altamente non lineari nei dati di input di basso livello e indurre regole di riconoscimento concettuale di alto livello. Essi consentono l’analisi di dati molto grandi e molto complessi, come immagini o video, dati di testo o altre informazioni non strutturate. Questi metodi sono diventati molto popolari in molte aree di ricerca sull’IA, dalla Computer Vision alla Elaborazione del Linguaggio Naturale (NLP) e alla Pianificazione, così come per le loro eccellenti prestazioni ottenute su rappresentazioni di input molto semplici, ad esempio pixel di immagini di base.

La tecnologia Reveal, basata su paradigmi neurali, è stata applicata con successo in diversi task predittivi eterogenei, che vanno dall’analisi automatica dei dati strutturali ottenuti dai sensori negli impianti di trattamento delle acque, alla rilevazione di emozioni e sentimenti dai messaggi nei Social Network, all’induzione automatica di modelli di Processi di Business dall’analisi di documenti nel settore bancario. In tutti questi casi, i paradigmi neurali consentono efficaci integrazioni di dati tra fonti strutturate e non strutturate, provenienti da fonti endogene ed esogene

RICERCA

Le attuali tecnologie in fase di studio e di sviluppo industriale presso Reveal coinvolgono:

Reti Neurali spiegabili per il processo decisionale basato su documenti.
Apprendimento etico della macchina.
Apprendimento semi-supervisionato in Architetture basate su Trasformatori.
Linguaggio integrato e inferenza visiva basata su reti neurali avanzate, come le reti neurali Convoluzionali, Ricorrenti e basate sui Trasformatori NNs.

Reti Neurali spiegabili per il processo decisionale basato su documenti

L’obiettivo è quello di consentire all’utente o allo sviluppatore di una soluzione neurale di dare un’occhiata a una simile “scatola nera” per capire perché viene fornita una specifica inferenza.

Nella figura seguente è riportato un esempio relativo a un Classificatore di Domande modellato come un percettore multistrato (MLP): dopo la decisione MLP (cioè la categorizzazione della domanda di input nella propria classe) la nostra tecnologia consente di effettuare atti di auditing come la domanda “Perché avete selezionato questa categoria?” La risposta alla domanda di auditing viene generata in base ad alcuni esempi realistici (selezionati nel materiale di formazione) in grado di spiegare per analogia le ragioni alla base della decisione. Di conseguenza, una macchina è in grado di rispondere “Chi ha inventato il telefono? si sta chiedendo un essere umano, perché ricorda Chi ha creato il mouse del computer? che si riferisce anche questo ad un essere umano”.

Articolo Scientifico disponibile all’indirizzo: https://www.aclweb.org/anthology/D19-1415

Apprendimento etico della macchina

Questo approccio permetterebbe alle Organizzazioni di affidarsi a macchine la cui etica è garantita dal Design

Una macchina per l’apprendimento in profondità generalmente riduce al minimo la probabilità di fornire decisioni errate su esempi nuovi. Questo ovviamente dipende fortemente dalla qualità del set di dati adottato per la formazione. Si noti che quest’ultimo può essere influenzato da errori di valutazione (campione non rappresentativo dell’intera popolazione) o da altre limitazioni intrinseche (decisioni non etiche memorizzate da un’organizzazione ma non utilizzabili per la generalizzazione). Che dire di una Macchina per il Prestito Digitale guidata dall’Intelligenza Artificiale (AI DL) e delle implicazioni etiche delle sue decisioni individuali? I rischi sono legati al prestito distribuito in modo disomogeneo tra una popolazione di richiedenti, a causa di sottogruppi scarsamente rappresentati nei dati di addestramento, e dovrebbero essere ridotti al minimo nei comportamenti futuri di una nostra AI DL.

Di conseguenza, le decisioni aziendali sono mediate da una rete attenta all’etica

Il nostro obiettivo è quello di definire i processi formativi in modo che risultino conformi non solo ai vincoli del dataset di input, ma anche ad alcuni principi etici definiti a priori. Un approccio di questo tipo consentirebbe alle organizzazioni di affidarsi a macchine la cui etica è garantita dalla progettazione e resiliente a set formativi eventualmente di parte. I dettagli sono in (Rossini et al., 2020, Actionable ethics through neural learning).

Nella figura che segue, un’architettura standard che ottimizza il proprio comportamento dal punto di vista del “Business” (l’Esperto di Business) è estesa per operare su dati che sono integrati con vincoli Etici (dal codificatore Etica). Allo stesso tempo, una rete aggiuntiva capitalizza invece tali principi etici (l’Esperto Etico). Di conseguenza, le loro decisioni sono mediate da una rete consapevole dell’etica che ottimizza gli obiettivi di business, soddisfacendo al tempo stesso i principi etici.

Apprendimento semi-supervisionato in Architetture basate su Transformer

Sebbene i metodi profondi ottengano risultati allo stato dell’arte in molti task, essi richiedono un enorme set di dati di formazione etichettati al fine di ottenere soluzioni affidabili. Un’organizzazione con raccolte di dati non etichettati su larga scala, può permettersi di sviluppare modelli in grado di gestire centinaia di migliaia di esempi non ancora visibili? La tecnologia Reveal si basa sulla ricerca dell’Università di Roma, Tor Vergata, che estende tecnologie all’avanguardia (come il BERT) con metodi di formazione di tipo Generative Adversarial. Questo ci permette di minimizzare significativamente i costi di formazione, di capitalizzare i dati non etichettati già disponibili per un’organizzazione e di ridurre i costi e i tempi necessari per l’implementazione di modelli efficaci.

Linguaggio integrato e inferenza visiva

La tecnologia neurale adottata elabora un’immagine in ingresso e genera la sua descrizione una parola alla volta.

Come possiamo recuperare immagini o video utilizzando il linguaggio naturale? Come possiamo trasmettere le informazioni rappresentate in un’immagine? In Reveal estraiamo e combiniamo informazioni multimodali rappresentate in elementi multimediali, utilizzando architetture neurali complesse, ad esempio derivando automaticamente la descrizione di un’immagine o di un video in italiano.

Le reti neurali coinvolte sono le NN Convoluzionali, Ricorrenti e Trasformate.

La tecnologia neurale adottata elabora un’immagine di input come la seguente, e genera la sua descrizione una parola alla volta, qui “Un uomo in sella ad una moto su una strada sterrata”. Vale la pena di notare come la rete si focalizzi su specifiche aree dell’immagine di input, mentre genera ogni token (le aree bianche si posizionano sopra le miniature dell’input).

I dettagli sulla tecnologia si possono trovare in: Scaiella et al., 2020, “Large scale datasets for image and video captioning in Italian” URL of the Paper to be published