Quelques perles trouvées au Salon BigData Paris qui s’est tenu les 10 et 11 mars 2015 au CNIT, à La Défense. Vous y trouverez notamment du Machine learning et de la dataviz au service du #Retail et du #Recrutement!
Machine Learning
Voici un post un peu plus léger. Mais qui part d’une véritable interrogation!
En effet, depuis que je m’intéresse au sujet du métier de Data Scientist et du monde des Big Data, je rencontre pas mal de monde, et souvent, souvent je me rends compte que ces personnes sont amateurs de photographie.
Mais pourquoi donc?
D’où vient le métier du Data Scientist? Il fait partie des métiers à avoir vu le jour récemment, et le nombre de profils LinkedIn contenant le mot-clé DataScientist a été multiplié par 30 sur ce laps de temps (cf. infographie)!
Voici les principaux éléments de vocabulaire et acronymes à connaître autour de la Data Science et du Big data (cf. sourcing des définitions à la fin du post).
Avec quelques explications vulgarisées selon ma compréhension et des schémas qui me semblent parlants.
N’hésitez pas à ajouter des commentaires, ce post est évolutif!
Une certification d’administrateur système permet de démontrer une expertise en gestion de systèmes et d’infrastructures informatiques. Découvrez tout ce que vous devez savoir sur cette accréditation très recherchée par les employeurs, notamment à l’ère du Cloud Computing !
La transformation digitale des entreprises est en marche ! Ce terme qui englobe tous les changements liés à l’intégration de nouvelles technologies dans la société contient le Big Data comme l’un de ses piliers les plus solides. Pour les entreprises, l’explosion des « grosses données » est au cœur des problématiques actuelles qu’elles doivent affronter. Cela nécessite la création de moyens efficaces pour les recevoir et les utiliser au mieux, permise par des professionnels aguerris des Data Sciences.
Les cabinets de conseil en stratégie sont des acteurs majeurs dans cette digitalisation de l’entreprise. Ils accompagnent les autres entreprises dans leur stratégie de transformation digitale, soit en tant que cabinets spécialisés, soit pour les cabinets généralistes en intégrant un segment dédié à leur offre d’expertise. Mais ils sont eux-mêmes sujets de cette transformation digitale et doivent intégrer de nouvelles compétences à leur cœur de métiers pour des propositions à plus forte valeur ajoutée.
Pourquoi intégrer les Data Sciences au conseil en stratégie ?
Aujourd’hui, la Data Science, ou science des données est utilisée par les entreprises comme outil d’analyse pour aider à la décision. Et plus il y a de données, plus le recours aux spécialistes de la data science est indispensable.
Le cas des cabinets de conseils en stratégie en est le parfait exemple. Ces derniers ont comme mission de répondre à une problématique précise pour le compte de leurs clients. L’expertise attendue d’eux repose sur la conduite de recherches et d’analyses stratégiques à partir de données fournies directement par les clients ou de données externes. Opérant sur une grande variété de secteurs, ils stockent donc un nombre de données très important.
Mais si les data sont historiquement au cœur du métier de consultant, les temps changent et les technologies avec. Pour fournir la meilleure analyse possible et garder un avantage concurrentiel, les cabinets se doivent d’évoluer au rythme de ces avancées. L’amélioration du CRM grâce à la personnalisation de la relation client, l’optimisation et la prédiction des coûts, la sécurisation et la détection de fraude, la vérification de l’authenticité de produits… sont tant d’exemples permis aujourd’hui par des méthodes et algorithmes très poussés au centre des outils utilisés dans les Data Sciences.
L’utilisation des Data Sciences intervient à chaque niveau de la chaine de valeur ; du début de la réflexion à la solution fournie au client en passant par le suivi. La conjoncture des 3 V qui définissent les Big Data – Volume, Vélocité, Variété – permet de mieux répondre aux due diligences et en un temps plus restreint.
C’est dans cette optique que le BCG a vu naître sa nouvelle entité dédiée à la Data Science : BCG Gamma. Avec Cedric Villani (médaille Fields 2010) comme conseiller scientifique, et l’INRIA (l’institut national de recherche en sciences du numérique) comme partenaire, le message porté par cette initiative est clair : mêler la recherche au monde de l’entreprise pour améliorer les performances. L’équipe est composée de 250 personnes : des experts scientifiques maitrisant les techniques mathématiques et statistiques liées à l’intelligence artificielle, au machine et deep learning, mais également des consultants experts dans les secteurs conseillés par le cabinet, concentrés sur l’aspect analytique des données.
Les profils des data-consultants
S’ils étaient absents du monde du conseil il y a encore 5 ans, les Data Sciences y sont aujourd’hui indispensables. Le recours à cette nouvelle science ne se fait plus seulement à travers l’utilisation ponctuelle de l’expertise d’acteurs de la tech dans le cadre de partenariats. Aujourd’hui, les Data Scientists arrivent au sein même des cabinets de conseils. Et demain, ils se mêleront à part entière aux consultants.
Chez ces férus d’informatique et de nouvelles technologies, les nouvelles façons de s’intégrer aux grands cabinets de conseil sont multiples. Toutefois, deux grandes tendances dominent : (1) être une fonction support (2) être un consultant à part entière.
L’équipe BCG Gamma réunit des doubles profils « consultants-data scientists » autour des problématiques classiques du grand groupe de conseil dans les différents secteurs où il opère. Ils sont pleinement intégrés au groupe et ont le même objectif final que tout consultant : conseiller le client en lui apportant une expertise poussée. Mais le moyen pour y parvenir diffère : « Là où un consultant utilisera Excel pour créer un modèle d’analyse, nous avons recours à des algorithmes pour modéliser des volumes de données plus complexes » (Thomas Lewiner, BCG Gamma). Aussi, à la différence du consultant type, les consultants « geeks » n’ont pas suivi un parcours en école de commerce ou d’ingénieur, mais des formations dédiées aux data sciences, en informatique, allant parfois jusqu’au doctorat (46%). Ces consultants s’inscrivent pleinement dans la transformation digitale des entreprises par leur utilisation des Data Sciences qui accélèrent et optimisent l’arrivée vers le résultat voulu.
Dans d’autres cabinets, les data scientists ne sont pas consultants mais forment une équipe bien distincte dont la vocation unique est de gérer les données.
C’est par exemple le cas de PMP ou d’EY qui se sont dotés en 2016 de leurs « Data Lab » ou « EY Digital Lab », choisissant de s’inscrire pleinement dans l’ère de la transformation digitale sans dénaturer la fonction de consultant. Ces deux laboratoires de la donnée ont comme rôle d’assurer une fonction support pour les différentes entités des groupes. Les talents de ces laboratoires s’occupent de traiter et gérer les données avant que les consultants ne les analysent pour en fournir une interprétation.
L’enjeu est de taille pour ces data scientists, car s’ils exercent leur métier sans se confondre aux consultants, ils doivent bien s’adapter à ces derniers. Pour générer un gain de temps grâce au Big Data, ils doivent donc parvenir à vulgariser leur langage afin qu’il soit exploitable au maximum et parfaitement intégré dans la chaine de valeur.
Jusqu’à présent, les données sont la meilleure source de connaissances pour les entreprises. En effet, elles en génèrent plus que jamais, d’où l’apparition du terme Big Data. Cependant, accumuler de telles quantités d’informations numériques à très peu d’utilité à moins que ces organisations en comprennent le sens. C’est là qu’interviennent les logiciels de Business Intelligence en self-service tels que Power BI.
Qu’est-ce que Power BI ?
Power BI est le nom commun attribué à une variété d’applications et de services basés sur le Cloud. Ces derniers sont conçus pour aider les entreprises à collecter, gérer et analyser diverses sources de données via une interface facile à utiliser. Il permet de rassembler les données et de les traiter. Mais surtout, il est utile pour transformer les données en informations intelligibles souvent à l’aide de graphiques et de tableaux visuellement précis et faciles à traiter. Cela permet aux utilisateurs de créer des rapports interactifs et de les partager à toutes les parties prenantes d’une entreprise.
Cette application Microsoft se connecte à une variété de sources de données. Il peut s’agir de feuilles de calcul Excel ou de bases de données sur un data warehouse. Il peut également se connecter à des applications à la fois dans le Cloud et sur les serveurs de l’entreprise.
Cette appellation est un terme général et peut faire référence à une application de bureau Windows appelée Power BI Desktop. Il peut s’agir d’un outil ETL (Extract, Transform and Load) dénommé Power Query ou d’un service en ligne SaaS (Software as a Service) appelé Power BI Service. Il peut aussi s’agir d’applications mobiles Power BI pour les Smartphones et tablettes Windows ainsi que pour les appareils iOS et Android.
Power BI est basé sur Microsoft Excel. En tant que tel, la courbe d’apprentissage d’Excel vers Power BI n’est pas si raide. Quiconque peut utiliser Excel peut utiliser Power BI. Mais, ce dernier est beaucoup plus puissant que la feuille de calcul.
Que fait cette application d’analyse de données ?
Dans tout environnement d’entreprise, il est essentiel d’unifier toutes les informations disponibles autour d’une même plateforme que ce soit dans le Cloud ou en local. Pour ce faire, Power BI est l’outil idéal. Il permet d’appliquer les connaissances de la Business Intelligence (BI) en exploitant des données en temps réel provenant de différentes sources et en créant des rapports. Sur un simple tableau de bord se trouvent les résultats de tous les éléments à analyser et partager entre plusieurs professionnels d’une même entreprise.
En effet, cette application d’analyse de données est utilisée pour la création de rapports basés sur les données de l’entreprise. En utilisant Power BI, l’utilisateur peut se connecter à un large éventail d’ensembles de données et classer les informations fournies par le biais de la data visualisation afin qu’elles puissent être mieux comprises et assimilées. Le tableau de bord généré à partir de ces données peut être partagé avec d’autres utilisateurs.
Power BI aide les entreprises à voir non seulement ce qui s’est déroulé dans le passé et ce qui se passe dans le présent, mais également ce qui pourrait se produire dans le futur. Cet outil d’analyse de données est doté de fonctionnalités d’apprentissage automatique. Il permet ainsi à son utilisateur de détecter un modèle de données et d’utiliser ce modèle pour effectuer des prédictions éclairées et exécuter des scénarios de simulation. Ces estimations permettent à l’entreprise pour laquelle il travaille de générer des prévisions. Elle aura ainsi la capacité de se préparer à répondre à la demande future et à adopter des mesures clés.
6 raisons d’utiliser Power BI
Pour les entreprises qui souhaitent plus de puissance de reporting et de force analytique que ce qu’offre Excel, Power BI est à un tout autre niveau du Business Intelligence. Avec cet outil, les entreprises peuvent collecter, analyser et visualiser l’ensemble de leurs données, ce qui leur donne un meilleur aperçu de leur productivité et de leur compétitivité. Ainsi, elles peuvent prendre des décisions plus éclairées basées sur des données réelles.
Pour mieux comprendre la puissance de Power Bi, voici quelques-uns de ses principaux avantages :
- Les entreprises peuvent gérer de grandes quantités de données via cette application qu’en utilisant d’autres plateformes d’analyse de données.
- Les informations peuvent être visualisées à l’aide de modèles afin que les entreprises puissent mieux comprendre leurs données.
- Il est basé sur le service Cloud de sorte que les utilisateurs bénéficient de capacités d’intelligence de pointe et d’algorithmes puissants régulièrement mis à jour.
- Plusieurs personnalisations permettent aux utilisateurs de créer des tableaux de bord afin d’accéder rapidement aux données dont ils ont besoin.
- Il propose une interface intuitive qui le rend beaucoup plus facile à utiliser que les feuilles de calcul complexes.
- Il garantit la sécurité des données en offrant des contrôles d’accessibilité internes et externes.
Pour résumer, Power BI est la solution professionnelle pour visualiser et transformer les données. Mais, il sert surtout à partager des informations avec tous les services de l’entreprise, de manière efficace et rapide. Grâce à ses tableaux de bord intuitifs et à son contrôle d’accessibilité, tout le monde dispose d’informations en temps réel. Toutes les parties prenantes pourront les consulter à tout moment et en tout lieu.
L’analyse des données pour soutenir la prise de décision
Power BI est l’un des plus pratiques et performants outils Microsoft pour l’analyse de données. Il s’est imposé comme le leader du secteur. Il reflète d’ailleurs les connaissances et l’expérience de Microsoft dans ce domaine à travers des solutions telles qu’Excel ou SQL Server et ses compléments (SSAS, SSIS et SSRS).
Power BI facilite la transformation des données en informations grâce à des modèles analytiques. Cela va de l’information à la connaissance en passant par des rapports analytiques avec des graphiques, des tableaux, etc. L’objectif de Microsoft est d’offrir un outil de prise de décisions intelligentes en réduisant les risques. Il apporte une réponse efficace aux besoins d’un des professionnels qui interviennent dans ce domaine : le data analyst.
À part cela, Power Bi est également un outil multiplateforme pour la surveillance de l’entreprise en temps réel par les parties prenantes partout et à tout moment.
L’autre atout de Power BI dans l’analyse des données est son intégration totale avec la suite Office 365. Il donne accès à SharePoint, à un calendrier, à Microsoft Flow pour les flux de travail et à une longue liste de fonctionnalités et de possibilités sans quitter l’environnement Office 365.
Par ailleurs, Microsoft s’est fortement engagé envers les techniques d’apprentissage automatique. Power BI offre de multiples fonctionnalités dans ce domaine :
- L’analyse automatique des informations
- Le calcul des corrélations
- L’identification de valeurs aberrantes
- Le regroupement
- L’intégration de Python pour l’importation de données et la création de graphiques
- Etc.