Ottenere valore dai tuoi dati non dovrebbe essere così difficile

Posted on

Il potenziale impatto dell’esplosione di dati in tutto il mondo continua a stimolare l’immaginazione. Un rapporto del 2018 ha stimato che ogni secondo di ogni giorno, ogni persona produce 1,7 MB di dati in media e la creazione di dati annuale ha più che raddoppiato da allora e si prevede che raddoppierà di nuovo entro il 2025. Un rapporto del McKinsey Global Institute stima che un uso abile dei big data potrebbe generare un ulteriore $ 3 trilioni nell’attività economica, consentendo applicazioni diverse come le auto a guida autonoma, l’assistenza sanitaria personalizzata e le catene di approvvigionamento alimentare tracciabili.

Ma l’aggiunta di tutti questi dati al sistema crea anche confusione su come trovarli, utilizzarli, gestirli e condividerli in modo legale, sicuro ed efficiente. Da dove viene un determinato set di dati? Chi possiede cosa? Chi è autorizzato a vedere certe cose? Dove risiede? Può essere condiviso? Si può vendere? Le persone possono vedere come è stato utilizzato?

Man mano che le applicazioni dei dati crescono e diventano più onnipresenti, produttori, consumatori, proprietari e amministratori dei dati stanno scoprendo di non avere un playbook da seguire. I consumatori vogliono connettersi ai dati di cui si fidano in modo da poter prendere le migliori decisioni possibili. I produttori hanno bisogno di strumenti per condividere i propri dati in modo sicuro con chi ne ha bisogno. Ma le piattaforme tecnologiche sono insufficienti e non ci sono fonti di verità comuni reali per connettere entrambe le parti.

Come troviamo i dati? Quando dobbiamo spostarlo?

In un mondo perfetto, i dati fluirebbero liberamente come un’utilità accessibile a tutti. Potrebbe essere confezionato e venduto come materia prima. Poteva essere visionato facilmente, senza complicazioni, da chiunque fosse autorizzato a vederlo. Le sue origini e i suoi movimenti potrebbero essere rintracciati, rimuovendo qualsiasi preoccupazione per usi nefasti da qualche parte lungo la linea.

Il mondo di oggi, ovviamente, non funziona in questo modo. L’enorme esplosione di dati ha creato un lungo elenco di problemi e opportunità che rendono difficile condividere blocchi di informazioni.

Poiché i dati vengono creati quasi ovunque all’interno e all’esterno di un’organizzazione, la prima sfida consiste nell’identificare ciò che viene raccolto e come organizzarlo in modo che possa essere trovato.

La mancanza di trasparenza e sovranità sui dati e sulle infrastrutture archiviati ed elaborati apre problemi di fiducia. Oggi, spostare i dati in posizioni centralizzate da più stack tecnologici è costoso e inefficiente. L’assenza di standard di metadati aperti e interfacce di programmazione delle applicazioni ampiamente accessibili può rendere difficile l’accesso e il consumo dei dati. La presenza di ontologie di dati specifiche del settore può rendere difficile per le persone al di fuori del settore beneficiare di nuove fonti di dati. Molteplici parti interessate e difficoltà di accesso ai servizi di dati esistenti possono rendere difficile la condivisione senza un modello di governance.

L’Europa sta prendendo il sopravvento

Nonostante i problemi, i progetti di condivisione dei dati vengono intrapresi su larga scala. Uno che è sostenuto dall’Unione Europea e da un gruppo senza scopo di lucro sta creando uno scambio di dati interoperabile chiamato Gaia-X, dove le aziende possono condividere i dati sotto la protezione delle rigorose leggi europee sulla privacy dei dati. Lo scambio è concepito come una nave per condividere dati tra settori e un archivio di informazioni sui servizi dati relativi all’intelligenza artificiale (AI), all’analisi e all’Internet delle cose.

Hewlett Packard Enterprise ha recentemente annunciato un struttura della soluzione per supportare la partecipazione di aziende, fornitori di servizi e organizzazioni pubbliche a Gaia-X. La piattaforma dataspaces, attualmente in fase di sviluppo e basata su standard aperti e cloud native, democratizza l’accesso ai dati, all’analisi dei dati e all’intelligenza artificiale rendendoli più accessibili agli esperti di dominio e agli utenti comuni. Fornisce un luogo in cui gli esperti delle aree di dominio possono identificare più facilmente set di dati affidabili ed eseguire analisi in modo sicuro sui dati operativi, senza richiedere sempre il costoso spostamento dei dati in posizioni centralizzate.

Utilizzando questo framework per integrare fonti di dati complesse nei paesaggi IT, le aziende saranno in grado di fornire la trasparenza dei dati su larga scala, in modo che tutti, sia che siano un data scientist o meno, sappiano quali dati hanno, come accedervi e come utilizzarli in tempo reale.

Anche le iniziative di condivisione dei dati sono in cima all’agenda delle imprese. Un’importante priorità che le aziende devono affrontare è il controllo dei dati che vengono utilizzati per addestrare l’IA interna e i modelli di apprendimento automatico. L’intelligenza artificiale e l’apprendimento automatico sono già ampiamente utilizzati nelle imprese e nell’industria per promuovere miglioramenti continui in tutto, dallo sviluppo del prodotto al reclutamento alla produzione. E abbiamo appena iniziato. IDC prevede che il mercato globale dell’IA sarà passare da 328 miliardi di dollari nel 2021 a 554 miliardi di dollari nel 2025.

Per sbloccare il vero potenziale dell’IA, i governi e le imprese devono comprendere meglio l’eredità collettiva di tutti i dati che guidano questi modelli. In che modo i modelli di intelligenza artificiale prendono le loro decisioni? Hanno pregiudizi? Sono affidabili? Le persone inaffidabili sono state in grado di accedere o modificare i dati su cui un’azienda ha addestrato il suo modello? Collegare i produttori di dati ai consumatori di dati in modo più trasparente e con maggiore efficienza può aiutare a rispondere ad alcune di queste domande.

Costruire la maturità dei dati

Le aziende non risolveranno come sbloccare tutti i loro dati dall’oggi al domani. Ma possono prepararsi a sfruttare le tecnologie e i concetti di gestione che aiutano a creare una mentalità di condivisione dei dati. Possono garantire che stanno sviluppando la maturità per consumare o condividere i dati in modo strategico ed efficace piuttosto che farlo su una base ad hoc.

I produttori di dati possono prepararsi a una più ampia distribuzione dei dati adottando una serie di passaggi. Devono capire dove si trovano i loro dati e capire come li raccolgono. Quindi, devono assicurarsi che le persone che consumano i dati abbiano la possibilità di accedere ai giusti set di dati al momento giusto. Questo è il punto di partenza.

Poi arriva la parte più difficile. Se un produttore di dati ha dei consumatori, che possono essere interni o esterni all’organizzazione, devono connettersi ai dati. Questa è sia una sfida organizzativa che tecnologica. Molte organizzazioni desiderano una governance sulla condivisione dei dati con altre organizzazioni. La democratizzazione dei dati, almeno essere in grado di trovarli tra le organizzazioni, è un problema di maturità organizzativa. Come lo gestiscono?

Le aziende che contribuiscono all’industria automobilistica condividono attivamente i dati con fornitori, partner e subappaltatori. Ci vogliono molte parti e molta coordinazione per assemblare un’auto. I partner condividono prontamente informazioni su tutto, dai motori agli pneumatici, fino ai canali di riparazione abilitati al web. Gli spazi dati automobilistici possono servire fino a 10.000 fornitori. Ma in altri settori potrebbe essere più insulare. Alcune grandi aziende potrebbero non voler condividere informazioni sensibili anche all’interno della propria rete di unità aziendali.

Creare una mentalità dei dati

Le aziende su entrambi i lati del continuum consumatore-produttore possono far avanzare la loro mentalità di condivisione dei dati ponendosi queste domande strategiche:

  • Se le aziende stanno costruendo soluzioni di intelligenza artificiale e machine learning, dove ottengono i loro dati i team? Come si collegano a quei dati? E come tengono traccia di quella cronologia per garantire l’affidabilità e la provenienza dei dati?
  • Se i dati hanno valore per gli altri, qual è il percorso di monetizzazione che il team sta intraprendendo oggi per espandere quel valore e come sarà governato?
  • Se un’azienda sta già scambiando o monetizzando dati, può autorizzare un insieme più ampio di servizi su più piattaforme, on-premise e nel cloud?
  • Per le organizzazioni che devono condividere i dati con i fornitori, come viene svolto oggi il coordinamento di tali fornitori per gli stessi set di dati e aggiornamenti?
  • I produttori vogliono replicare i loro dati o obbligare le persone a portare loro dei modelli? I set di dati potrebbero essere così grandi da non poter essere replicati. Un’azienda dovrebbe ospitare gli sviluppatori di software sulla sua piattaforma in cui si trovano i suoi dati e spostare i modelli dentro e fuori?
  • In che modo i lavoratori di un reparto che consuma dati possono influenzare le pratiche dei produttori di dati a monte all’interno della loro organizzazione?

Prendere l’iniziativa

La rivoluzione dei dati sta creando opportunità di business, insieme a molta confusione su come cercare, raccogliere, gestire e ottenere informazioni strategiche da quei dati. I produttori di dati e i consumatori di dati stanno diventando sempre più disconnessi l’uno dall’altro. HPE sta costruendo una piattaforma che supporta sia il cloud pubblico che on-premise, utilizzando l’open source come base e soluzioni come la piattaforma software HPE Ezmeral per fornire il terreno comune di cui entrambe le parti hanno bisogno per far funzionare la rivoluzione dei dati.

Leggi l’articolo originale su Enterprise.nxt.

Questo contenuto è stato prodotto da Hewlett Packard Enterprise. Non è stato scritto dalla redazione del MIT Technology Review.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *