L’importanza dello studio inerente alle reti neurali è quello di comprendere la mente umana attraverso l’elaborazione neurale del nostro cervello. Un secondo motivo di interesse è dedicato allo sviluppo del machine learning e sopratutto all’interazione di quest’ultimo con le tecniche di deep learning.
Le reti neurali: i concetti preliminari
Per comprendere meglio l’insieme dei concetti che fanno capo al settore delle reti neurali è meglio cominciare discutendo le singole unità di riferimento. Una singola rete neurale indica sostanzialmente due tipologie di reti: una rete neurale reale biologica come quella posseduta dal genere umano e una seconda rete neurale artificiale o simulata attraverso un computer. Nello studio delle reti neurali bisogna avere ben chiara la descrizione di alcuni termini chiave utili ad una comprensione più esaustiva.
In primo luogo occorre sapere cosa sia il deep learning. Questo termine è riferito, infatti, a determinate tecniche di machine learning. In una singola unità di machine learning si scoprono vari strati di unità, per l’elaborazione di dati, collegati in un’unica rete. Attraverso questo schema un input generato all’interno dello schema attraversa ogni singolo strato. Quest’architettura è ispirata in modo preponderante al meccanismo di elaborazione dati del cervello umano. Si è voluto quindi prendere spunto dal modo in cui il cervello interpreta le informazioni visive che provengono dagli occhi attraverso il funzionamento di cattura immagine prodotto dalla retina. In questo modo, si possono apprendere anche strutture più complesse senza il bisogno di generare quantità di dati esagerate.
Il secondo termine riguarda i neuroni. Una rete neurale, che sia biologica o artificiale, è formata da un numero immenso di unità definite semplici. Sono appunto i neuroni, responsabili della ricezione e trasmissione di segnali tra gli uni e gli altri. I neuroni possono essere riconosciuti, in un sistema artificiale, come dei processori molto semplici che presentano un corpo cellulare con dei ponti di collegamento chiamati ramificazioni.
Il terzo termine si riferisce al meccanismo che coinvolge i dendriti, gli assoni e le sinapsi. Le ramificazioni già citate in precedenza rappresentano i collegamenti denominati dendriti. La ramificazione utilizzata per emettere il segnale in uscita è detta assone, le intersezioni che si creano nella trasmissione sono chiamate sinapsi.
Il principale motivo per cui la conoscenza dei concetti base delle reti neurali è importante riguarda lo sviluppo delle tecniche di intelligenza artificiale e di machine learning. La descrizione dei tre concetti fatta in precedenza ha un senso in quanto l’idea di base delle reti neurali è quella di emulare il cervello. Il nostro sistema di elaborazione dati, il cervello, presenta un meccanismo meravigliosamente complesso. Quest’organo è infatti capace di adottare una gamma molto ampia di risposte in merito a situazioni diverse. Per questi motivi è da sempre usato come modello e fonte di ispirazione per la creazione di sistemi intelligenti artificiali. Fin dagli anni Sessanta, le reti neurali rappresentano una vera e propria tendenza nel campo dell’IA. Ultimamente lo studio delle reti neurali ha acquisito maggiore importanza in merito alle implicazione offerte dal deep learning per il miglioramento del linguaggio e dell’elaborazione di immagini, da sempre punti deboli dell’intelligenza artificiale.
Le reti neurali: i concetti base
Il primo concetto base riguarda il confronto con un computer tradizionale. In questo strumento è presente una CPU che può eseguire un compito alla volta. La CPU infatti può recuperare i dati dalla memoria per elaborarli e salvarli. Sono quindi necessarie due unità: quella di memoria e quella di calcolo. Nelle reti neurali invece, coesiste un numero elevato di neuroni. Ognuno di essi può potenzialmente elaborare autonomamente le informazioni garantendo un risultato molto più veloce.
La seconda differenza che emerge dai meccanismi di calcolo con cui le reti neurali si confrontano riguarda l’archiviazione e l’elaborazione dei dati. Queste due operazioni non presentano più una separazione nelle reti neurali. Ogni neurone svolge contemporaneamente l’elaborazione e il salvataggio delle informazioni. In questo, si annulla la necessità di recuperare i vari dati salvati.
Per questi motivi i computer tradizionali e le reti neurali si prestano allo svolgimento di compiti differenti. Simulare quest’ultime attraverso i computer è possibile ma solo attraverso l’utilizzo di hardware speciali.
L’elaborazione parallela (parallel processing) è stata poi implementata attraverso le più moderne unità di elaborazione grafica (GPU). Queste unità sono dotate della capacità di un’elaborazione parallela utile per l’applicazione dei vari metodi di deep learning su più livelli.
Queste e altre informazioni sono disponibili sul sito https://itmanager.space dedicato al mondo degli IT manager con informazioni utili e approfondimenti su argomenti di cyber security, analisi dei dati e data center.