#AgendaSetting: data Science, machine learning e AI for dummies

Eccoci al primo appuntamento del 2018 con #AgendaSetting, la rubrica che, con qualche giorno di ritardo, vi fa gli auguri di buon anno nuovo.

Visto che il nuovo fa sempre pensare al futuro, cominceremo proprio col parlare di nuove professioni, talmente nuove da non aver trovato ancora una definizione completa, definitiva, comprensibile ai più. In particolare parliamo del data scientist, una figura al momento molto appetita dal mercato, eppure nebulosa nella sua definizione. Su YouTube Piero Savastano ha provato a fare un po’ di chiarezza.

Volendo sintetizzare all’osso quanto spiegato nel video, quella del data scientist è una sorta di professione ombrello sotto la quale trovano posto il data engineer (colui che riesce a raccogliere e archiviare efficacemente i famosi big data), il data analyst (che analizza e comprende l’utilizzo pratico di questi dati), il researcher (profili proveniente dal mondo scientifico prestati all’industria), e i data viz expert (esperti nella resa grafica del dato). In buona sostanza si tratta di skills complesse e difficilmente riscontrabili in un solo profilo, che andrebbe lautamente pagato, ergo il consiglio che dà Savastano è essere molto specifici nella ricerca della professionalità di cui necessità la propria azienda, di contro essere molto specifici anche nel candidarsi per eventuali offerte di lavoro.

A proposito di data science, piuttosto chiaro il post di David Robinson sulla distinzione tra questa attività, il machine learning e l’AI (intelligenza artificiale). La prima è un’attività prettamente umana basata, come sopra spiegato, sulla raccolta, la connessione e l’interpretazione dei dati; nel caso del machine learning entriamo nell’ambito delle previsioni formulate da una macchina relative al cluster di dati cui si riferisce; l’AI è invece un sistema autonomo che riesce ad eseguire o raccomandare azioni evolvendo (migliorando) le proprie indicazioni con l’aumentare dell’esperienza, ovvero con una base dati sempre più ampia.

L’autore prova a farla ancora più semplice con l’esempio dello sviluppo di un auto senza conducente.

    • Con il machine learning: l’auto è dotata di telecamere, riconosce i segnali di stop e si arresta. Tramite l’incrocio di milioni di foto generate dalle telecamere si può ottimizzare la posizione della segnaletica stradale.
    • Con l’AI: l’auto deve decidere quando frenare ai segnali di stop, ma deve “imparare” a farlo ripetendo l’azione con diverse condizioni atmosferiche, stato dell’asfalto, traffico ecc.
    • Con la data science: si considerano tutti i dati raccolti coi test drive e si realizzano dei data set più performanti, ad esempio si scindono i test realizzati al tramonto o all’alba poiché gli uni invalidano gli altri e viceversa, generando così un miglioramento nei futuri test.

Prototipo di self-driving car – fonte: Google

Chiudiamo questo primo appuntamento con l’invito a votare il miglior lavoro di data journalism nostrano dell’anno appena trascorso. Potrete spulciarli e votare sul sito della community Dataninja, avete tempo fino al 15 gennaio!

 

Sull’Autore

Napoletano, emigrato a Roma. Scrittore per passione, giornalista per devozione. Nella valigia di cartone gli opendata, i tweet di Gasparri e altre cose più o meno serie. Articolista per Mangiatori di Cervello, vincitore dell'Amazon Scholarship 2016, autore del blog CrocifissoInvano.

Articoli Collegati