04 Mai L’importance stratégique de la qualité des données et de leur traitement
12% des entreprises seulement parviennent à industrialiser l’analyse de leurs données alors que leur exploitation est un facteur décisif de leur performance. Qualité insuffisante, mauvaises pratiques et lourdeur des systèmes en place sont autant de freins à une nécessaire efficacité.
La capacité des entreprises à extraire des informations utiles à partir des données, souvent en temps réel, est devenue un impératif de la plus haute importance stratégique. Pour leur permettre cette orientation vers les données, les organisations adoptent des technologies de plus en plus sophistiquées basées sur le Cloud, entre autres des solutions analytiques dotées de capacités de machine learning. Cependant, l’efficacité de ces solutions sera limitée si les données ne sont pas en quantité et en qualité suffisantes, et facilement accessibles.
En plus d’un déficit de qualité des données, ces obstacles se combinent pour brider la vitesse des plateformes de données des entreprises et des modèles de machine learning et d’analytique qu’elles prennent en charge
Dans ce contexte, une gestion efficace des données est l’un des fondements d’une entreprise orientée vers les données. Mais l’un des principaux challenges pour les organisations est d’adopter les bonnes pratiques pour créer de la valeur commerciale à partir de l’analyse et du traitement des données. Au fur et à mesure que de nouvelles solutions technologiques de traitement des données apparaissent, la lourdeur des systèmes en place et des silos de données, leur architecture fragmentée, sont des obstacles pour de nombreux directeurs des données (CDO).
En plus d’un déficit de qualité des données, ces obstacles se combinent pour brider la vitesse des plateformes de données des entreprises et des modèles de machine learning et d’analytique qu’elles prennent en charge, minimisant ainsi fortement les chances d’atteindre les objectifs commerciaux souhaités. Selon une enquête, « Construire une organisation de données et d’Intelligence Artificielle performante » , réalisée par MIT Technology Review Insights, seulement 12 % des organisations sont parvenues à mettre en œuvre leur stratégie basée sur l’analyse données et le machine learning.
« Cette petite minorité d’entreprises obtient des résultats probants et mesurés. Leur succès est essentiellement dû à l’attention portée aux fondations d’une gestion et d’une architecture de données solides, permettant une démocratisation des données et une extraction de valeur de l’apprentissage machine», affirme l’étude.
L’amélioration de la gestion des données, le renforcement de l’analytique et du machine learning, et l’extension de l’utilisation de tous les types de données, y compris des données en continu et non structurées.
Les 3 priorités des organisations pour la donnée
D’après les conclusions de l’enquête, les priorités des entreprises en matière de données pour les deux ans à venir concernent trois domaines, tous dépendants d’une adoption plus étendue des plateformes Cloud : l’amélioration de la gestion des données, le renforcement de l’analytique et du machine learning, et l’extension de l’utilisation de tous les types de données, y compris des données en continu et non structurées. Le Cloud, jadis considéré comme une solution technologique optionnelle, est aujourd’hui pratiquement devenu incontournable en matière de gestion des données : 65 % des professionnels interrogés ont largement adopté ses services.
« Néanmoins, la mise à l’échelle et en œuvre de l’apprentissage machine est extrêmement complexe pour de nombreuses entreprises », expliquent les auteurs de l’enquête. Le challenge le plus difficile à relever, selon 55 % des professionnels questionnés, est l’absence d’un lieu central pour stocker et découvrir les modèles de machine learning. Cette absence, conjuguée avec un déficit de transfert entre la data science et la production, et de compétences en Machine learning, explique qu’il reste difficile de faire collaborer efficacement les équipes de machine learning, données et utilisateurs.