La Data Fabric pour concrétiser vos projets Big Data et IA !

Big Data, Data Science, intelligence artificielle... Si ces termes gagnent chaque jour en popularité, peu d'initiatives voient en réalité le jour. De nombreuses entreprises ont des projets et cas d'usage à adresser, mais encore faut-il pouvoir les mettre en production. Concept américain avec plusieurs définitions (Forbes, NetworkWorld…), la Data Fabric apparaît alors comme une solution prometteuse. Nous allons dans cet article vous expliquer pourquoi elle peut vous aider à concrétiser vos projets Big Data et IA.

 

 

Qu'est-ce qu'une Data Fabric ?

 

Par manque d'expertise, de temps, de technologie ou de moyens, rares sont aujourd'hui les entreprises qui peuvent gérer leurs données seules. C'est là qu'intervient la Data Fabric. Elle permet de gouverner, d'exploiter et de sécuriser vos données en temps réel, mais surtout de développer des applications métiers afin de répondre à vos problématiques.

 

Une Data Fabric est une solution logicielle de gestion de données. Disponible dans le cloud et sur site, elle permet d'accélérer la transformation digitale de votre entreprise et la mise en production de vos projets. A l’intersection entre la plateforme de Data Management, celle de Data Science et le Datalake, elle représente un ensemble cohérent de solutions logicielles et applicatives, indifférentes aux choix architecturaux. Elle permet la gestion de bout en bout du cycle de vie de vos données : collecte, stockage, traitement, modélisation, déploiement, supervision, gouvernance.

 

C'est là aussi que se différencie la Data Fabric, puisqu'elle offre une vision différente de vos données, une vision qui peut être partagée par l'ensemble de vos équipes. Grâce à ses multiples applications, elle permet à des profils moins experts d'y avoir accès, et ainsi d'apporter une valeur métier.

 

N'est pas Data Fabric qui veut

 

Selon Dan Kusnetzky, l’auteur de l’article de Networkworld, une Data Fabric doit répondre à ces différents critères :

  • Combiner des données de divers systèmes peu importe leur taille et les rendre disponibles aux applications en garantissant vitesse et fiabilité.
  • Offrir un accès aux données aussi bien de systèmes à l'autre bout du réseau qu'à celui du Data Center de l'entreprise, ou des environnements cloud.
  • Offrir un environnement unifié : les documents doivent y être facilement accessibles, la sécurité doit y être garantie et la capacité de stockage doit être suffisante.

 

 

La Data Fabric n'est pas une plateforme Data Science

 

On pourrait s'y méprendre, mais Data Fabric et Plateforme Data Science sont bien deux outils distincts. Dans une vision simpliste, une plateforme Data Science sert à développer des algorithmes, plus particulièrement de Machine Learning ou de Deep Learning. Elle n'est pas toujours adaptée aux profils métiers pour qui les algorithmes doivent au préalable être intégrés dans une application afin d'être lus.

 

En revanche, la Data Fabric est un véritable écosystème qui permet la gestion des données, de leur extraction jusqu'à leur consommation, en passant par leur traitement. Toutes les technologies y sont assemblées, les profils métiers peuvent y accéder facilement, les plus techniques profitent de sa compatibilité qui leur permet de travailler sur n'importe quel langage (R, Python...). Pour faire simple, la Data Fabric, plus complète, pourrait englober une plateforme Data Science.

 

Pourquoi choisir la Data Fabric ?

 

Pour sa compatibilité. A titre d’exemple, la Data Fabric de Saagie supporte HDFS, Impala, Hive, Drill, Spark, Sqoop, Elasticsearch, PostgreSQL, Talend, Java, Scala, R, Python, Jupyter, Docker, Zeppelin, Mongo DB et MySQL. Elle permet une adaptabilité complète en supportant les dernières versions, mais aussi les moins récentes et assure ensuite une certaine cohésion entre les différents outils utilisés.

 

 

La Data Fabric apparaît donc comme une alternative viable face aux limites affichées par les plateformes de gestion de données. Il s'agit d'un outil adaptable à de multiples cas d'usage puisque les données peuvent être hébergées dans le cloud, chez le customer, sur Azure ou encore sur AWS.

 

Pour la gouvernance. Il est possible de créer des équipes par projet, de partager ou non des entités diverses telles que du code ou des bases de données et d’optimiser le traitement pour que les résultats des analyses puissent être utilisés par les bons métiers, et donc engendrer de la valeur. Si une organisation de technologies et personnes s'établit autour de cet outil, on pourra alors parler de gouvernance des données. On associe de plus en plus gouvernance à RGPD, mais si elle permet d'assurer la sécurité de la donnée en contrôlant les traitements et en restreignant certains accès, elle comprend aussi une valeur économique en garantissant la qualité et la valeur des informations de l'entreprise.

 

Enfin, la Data Fabric fédère vos équipes. Elle facilite la collaboration entre les membres de l'équipe data (data engineers, data scientists, business analysts, data stewards, IT/Ops) et leur fournit les outils leur permettant de mener à bien leurs projets :

 

  • Data engineer : la possibilité de créer des pipelines permettant de collecter, de nettoyer, de traiter la donnée ainsi que d’alimenter les différents modèles préparés par les data scientists.
  • Data scientists : l’accès aux dernières versions des langages de programmation et des fonctionnalités pour passer à l’échelle leur développement ; l’accès à une large quantité de données.
  • Data analysts : le libre accès aux données afin de pourvoir travailler des vues business.
  • Data stewards : des outils pour documenter la donnée.
  • IT/Ops : un environnement sécurisé pour amener en production les travaux et gérer les accès à la donnée.

 

Interface de Saagie

 

Et pour quoi faire ?

 

Les cas d'usage sont multiples, chez Saagie nous sommes ainsi en capacité de :

  • Faire de la segmentation client,
  • Optimiser la supply chain
  • Améliorer la chaîne de production, entre autres...

 

Transformation digitale, passage à l'ère numérique... quelle que soit l'expression utilisée, les entreprises sont en train de changer, et le temps presse. Afin d'exploiter leurs données, elles ont besoin d'une solution simple mais complète. En mettant du Devops dans la Data Science, la Data Fabric permet de tirer profit de ses données et rend possible la prise rapide de décisions ciblées par l’exploitation, le tri et l’analyse des données en fonction des métiers.

retour au menu

inscrivez-vous en ligne pour participer à ai paris 2018

réservez votre badge

contact

 

Vianney LALAIN • Responsable Commercial

+33 (0)1 58 12 06 88

vlalain@corp-agency.com

 

Simon Nicolas

Responsable Inscriptions

+33 (0)1 84 83 02 86

snicolas@corp-agency.com

 

AI Paris est un congrès réalisé par Corp Agency, organisateur d’expositions et de conférences de haut niveau dans le domaine des nouvelles technologies.

Nos autres événements

11-12 juin 2018 • Cité de la Mode et du Design • PARIS

contact

Vianney LALAIN

Responsable Commercial

+33 (0)1 58 12 06 88

vlalain@corp-agency.com

Antoine Hernoux • Inscription Conférence

+33 (0)1 84 83 02 97

ahernoux@corp-agency.com

Nos autres événements

11-12 juin 2018 • Cité de la Mode et du Design • PARIS