Skip to content
02_Eléments/Icônes/Flèche à gauche Retour à Insight
Connaissances > Audiences

La véritable magie de la science des données

3 minutes de lecture | Kevin Lyons, vice-président principal, Data Science | Août 2019

Si, comme le disait l'auteur de science-fiction Arthur C. Clarke, "toute technologie suffisamment avancée est indiscernable de la magie", on a parfois l'impression que la science des données consiste à faire sortir des lapins d'un chapeau. Cette vision est, bien sûr, erronée. C'est la perception de ce que j'appelle la "magie des données", où les gens croient qu'il suffit de pomper des données dans une extrémité de la "machine de la science des données" pour que le gadget parfait (la solution aux problèmes de chacun) émerge de l'autre côté.

Dans une large mesure, c'est parce que la grande majorité des gens ne comprennent pas les rouages de la science des données, et lorsque vous entrez dans les domaines les plus avancés, comme l'apprentissage profond, même de nombreux scientifiques des données reconnaîtront qu'ils ne comprennent pas les nombreux niveaux de complexité. Mais si vous êtes un spécialiste de la science des données, vous en savez (généralement) assez pour savoir quand vous n'êtes pas dans votre élément. En dehors de la communauté des scientifiques des données, cependant, ce n'est pas toujours le cas. Et c'est compréhensible.

C'est en partie de notre faute. C'est un club difficile, historiquement difficile à pénétrer pour les "étrangers", et encore moins à comprendre. Les langues de la science des données ont été tenues à l'écart. Tout comme l'Église catholique romaine a choisi le latin ecclésiastique comme langue de communication de base pour contrôler les messages, en particulier au Moyen-Âge et au début de l'ère moderne, nous, les scientifiques des données, pourrions être accusés d'actions similaires, bien qu'évidemment pas à la même échelle ni avec un impact aussi direct sur des populations entières. Mais, tout comme les Réformes du 16ème siècle ont permis de libérer la langue, rendant les principes des différentes églises chrétiennes plus accessibles aux masses, la science des données doit maintenant étendre sa langue vernaculaire. 

Un langage commun nous permettrait d'aller au-delà de la croyance que les data scientists ont des capacités mystiques pour résoudre n'importe quel problème, en faisant passer les données dans un environnement d'IA pour produire les résultats souhaités, comme par magie. Cela aiderait les gens à comprendre que la science des données n'est pas une panacée magique.

En fait, si vous voulez vraiment une science des données avancée, l'une des pires choses à faire est d'affecter un data scientist à la résolution de problèmes isolés ou ad hoc, car cela va cloisonner la communication en maintenant la science des données dans l'arrière-boutique.

Au contraire, la meilleure façon de faire proliférer la science des données est d'exposer les problèmes au niveau de l'entreprise, en comprenant que, si elle est bien faite, la science des données est un sport d'équipe. Le fait de disposer d'équipes pluridisciplinaires dédiées à des produits ou à des clients permet d'obtenir des résultats commerciaux supérieurs et de développer une compréhension interfonctionnelle. Une cohorte comprenant un associé commercial, un chef de produit, un ingénieur, un data scientist et des représentants d'autres organisations fonctionnelles clés devrait être enfermée dans une pièce ininterrompue pour une réunion des esprits axée sur les plus grands besoins et opportunités. C'est là que la véritable magie opère.

Néanmoins, le voyageur qui s'engage dans cette voie doit être conscient des signes avant-coureurs. Si, en travaillant avec des clients ou d'autres tiers dans un esprit de collaboration, vous commencez à chercher des solutions explicables par absolument tout le monde, faites une pause. De même qu'un magicien ne limite pas son spectacle à des tours élémentaires, le public comprend que les scientifiques des données ne doivent pas se contenter de solutions facilement explicables. Le fait d'édulcorer délibérément le processus peut avoir l'effet collatéral de fournir une solution moins qu'optimale pour le problème. C'est un équilibre.

Cet équilibre repose sur la confiance des entreprises dans les capacités de leurs scientifiques des données. La confiance dans le fait que les scientifiques des données partageront notre langage autant que possible, mais qu'ils ne dilueront pas les solutions lorsque les choses deviennent trop techniques, et que nous resterons toujours fidèles à notre discipline.

Cet article a été initialement publié sur Medium.

Poursuivre la recherche d'informations similaires