Het merkwaardige geval van het bouwen van een “Data Analytics”-strategie
Bibliophile, Movie buff & a Passionate Storyteller.
Monica Rogati schreef 45 maanden geleden over het artikel “The AI Hierarchy of Needs” op Medium en deelde deze inzichtelijke piramide met de vraag “hoe vertel je bedrijven dat ze niet klaar zijn voor AI zonder elitair te klinken (of te zijn) – een zelfbenoemde poortwachter?
De waarheid is dat veel bedrijven zich nog steeds niet realiseren dat ‘data’ de kern vormt van systemen als Data Sciences en Artificiële Intelligentie . Veel organisaties blijven falen wanneer ze een groot analyse-initiatief proberen. De reden is dat de focus meestal op de bovenste 3 lagen van de bovenstaande piramide ligt en niet op de rest, die de basis leggen voor het bouwen van een sterke “data-analyse”-strategie.
Hoewel veel organisaties aandacht besteden aan het bouwen van datamodellen, hebben ze de neiging om zaken als datakwaliteit en data-integriteit te negeren. “Gegevens zullen onze manier van denken over modellen herdefiniëren”, zegt Fei-Fei Li, Chief Scientist bij Google Cloud en professor aan Stanford.
Organisaties moeten zorgen voor goede datamanagementprocessen. “Het beste algoritme zou niet goed werken als de gegevens waaruit het leerde niet de echte wereld zouden weerspiegelen.” Een betere dataset is de eerste vereiste voordat je met volle kracht aan de slag gaat met datavisualisatie, datawetenschappen, machine learning of kunstmatige intelligentie.
Hoewel de meeste bedrijven een verlangen hebben naar datagedreven inzicht, realiseren velen die ambitie niet. Het resultaat is dat datamanagement vaak versnipperd is en gestuurd wordt door meerdere stakeholders. Dit zorgt ervoor dat organisaties te maken hebben met een hoge mate van onnauwkeurige en ongelijksoortige gegevens en er zijn verschillende uitdagingen bij het onderhouden ervan.
Waar moeten organisaties dus rekening mee houden bij het opstellen van een roadmap of strategie voor data-analyse?
Gegevensvolume
We weten allemaal dat “Data Analytics” “goede gegevens” vereist, maar zelfs daarvoor hebben we volume nodig. Veel organisaties lijken het volumeprobleem niet serieus te nemen. Ze denken of nemen op de een of andere manier aan dat het beschikbaar is. Zoals Zuci’s Chief Technology Architect Jana zegt: “Het bouwen van een databank is tegenwoordig een bedrijfsprobleem en ik denk dat maar weinig organisaties het serieus nemen, ook al wordt digitale transformatie absoluut serieus genomen.”
Organisaties hebben de juiste mensen nodig die aan het begin van projecten de tijd krijgen om robuuste en effectieve systemen te creëren voor het verzamelen, beheren en opslaan van gegevens. Dat is het belangrijkste bedrijfsdoel van het datateam, niet alleen een datawarehouse bouwen en daar alles dumpen.
Gegevenskwaliteit
Het vervolgprobleem op het datavolume is de datakwaliteit. Slechte datakwaliteit leidt tot het onvermogen om nauwkeurige inzichten/modellen te ontwikkelen. Het verlaagt ook de productiviteit van het datateam. Datawerkers besteden het grootste deel van hun tijd aan het samenvoegen van bestaande data om deze op te schonen en een betere kwaliteit te creëren. Datawetenschappers melden dat ze meer dan 82% van hun werk besteden aan het opschonen en voorbereiden van gegevens voor AI/ML-toepassingen.
Organisaties moeten zich concentreren op het creëren van goede datapijplijnen en betrouwbare data stroominfrastructuur om goede gegevens op te bouwen, wat leidt tot een grotere nauwkeurigheid bij het afleiden van inzichten.
Gegevensbeheer, beveiliging en naleving
Rekening houdend met het datavolume en met aspecten van datakwaliteit die meer technologiegericht zijn, moeten organisaties zich richten op andere kritieke aspecten zoals datagovernance, beveiliging en compliance, die deel uitmaken van het bouwen van een goede datastrategie.
Het bouwen van een roadmap voor data-analyse vereist de juiste mix van mensen, data, producten, technologie, processen en governance om succesvol en productief te zijn. Daarnaast moet een roadmap voor analyse beginnen met een uitgebreide beoordeling van de bedrijfsdoelen van de organisatie en de belangrijkste meetwaarden die ze voor hun bedrijf willen afleiden.