Tra i numerosi progetti di machine learning avviati, pochissimi vengono poi effettivamente realizzati negli ambienti di produzione: questa tendenza, emersa da un’indagine del magazine specializzato KDnuggets, evidenzia le difficoltà riscontrate dalle aziende che non adottano un approccio corretto, quando cercano di creare applicazioni basate sull’intelligenza artificiale o sulle advanced analytics. Commentando il sondaggio, Eric Siegel (fondatore della Machine Learning Week) parla di “industry-wide failure”, da lui attribuito all’assenza di una leadership matura.
Perché falliscono i progetti ML
Secondo l’esperto, il forte interesse (“excitement”) per i progetti di ML è pienamente giustificato, ma i problemi risiedono quasi del tutto nell’approccio aziendale, spesso più focalizzato sulla tecnologia stessa che sulla sua messa in produzione. Alla survey hanno risposto 114 data scientist, per metà appartenenti ad aziende che consumano analytics; l’altra metà era divisa tra vendor, aziende pubbliche, accademia e altri stakeholder.
La prima domanda chiedeva quanti modelli di machine learning fossero arrivati alla fase di deployment: 4 intervistati su 5 hanno indicato una percentuale inferiore al 40% (oltre la metà – 58% delle risposte – addirittura sotto il 20% di modelli realizzati).
Questi risultati, spiega Siegel, sono in linea con ricerche precedenti. La seconda domanda indagava le cause della mancata “messa a terra” dei progetti ML. In due casi su tre, le criticità riguardano il rapporto tra i nuovi modelli e le operations preesistenti, vuoi perché i decision maker non approvano il cambiamento (32%) o perché si resta impantanati in difficoltà tecniche (35%) nelle fasi di implementazione o integrazione del nuovo modello nei processi già in essere.
Supportare il lavoro dei data scientist
Lo scienziato dei dati, di norma, non ha vita facile: spesso i dati che gli servono per creare qualsiasi modello (anche di machine learning) arrivano in ritardo, magari in un formato diverso da quello atteso, oppure contengono innumerevoli errori, tavolta difficili da individuare o – ancora – non si sa bene dove siano i dati.
Secondo Gartner, la cattiva qualità dei dati costa in media a un’azienda 12,9 milioni di dollari ogni anno.
Ecco perché un esperto di data management può evitare che un progetto parta zoppo, magari per una scarsa attenzione al presidio e governo dei dati. La fase preparatoria è fondamentale per il successo di ogni iniziativa: diventa essenziale il contributo di figure professionali come il data engineer.
Data Product e leadership
Secondo Harvard Business Review, i data product (definiti come “il tentativo di creare dataset riusabili, che nel tempo possono essere analizzati in modo diverso da utenti diversi, per risolvere un determinato problema di business”) rappresentano una risposta potente – soprattutto nelle “grandi aziende legacy” – a questo tipo di criticità, a prescindere dal fatto che integrino o meno funzionalità di AI e/o analytics, perché questo “orientamento al prodotto” crea comunque benefici in entrambi i casi.
L’idea dietro i data product, sottolinea HBR, non è del tutto nuova. Ma l’adozione di questo strumento può essere decisiva in quel tipo di aziende, perché molti dei loro data scientist “credono che il loro lavoro sia finito quando creano un modello che si adatta bene ai dati”. Per questo si pensa a un nuovo ruolo, il Data Product Manager, con competenze diverse non solo dagli “scienziati dei dati”, ma anche rispetto ai Chief Data Officer (CDO).
Questo figura professionale, pertanto, non solo dovrà saper gestire lo sviluppo trasversale (“cross-functional”) di un data product, la sua messa in produzione (“deployment”), un team multidisciplinare e i relativi task – come un classico product manager – ma anche avere la capacità di comunicare in modo efficace con i business leader, i cui processi saranno coinvolti in tutti questi cambiamenti.
La visione di Irion
L’espressione “data product” è ormai un concetto centrale del data management moderno (grazie anche all’interesse internazionale suscitato dal framework Data Mesh) e un pilastro per un’organizzazione data driven. Ma in concreto cosa ha di diverso da un semplice dataset? Quali sono i suoi tratti distintivi e i contesti in cui applicarlo? Come si realizza (e soprattutto, come si usa) un data product? Scoprite di più nel focus a cura di Mario Vellella e Mauro Tuvo.
Scopri la piattaforma Irion EDM!