© This questionnaire is protected by copyright: if you use it, please also cite the source.
Les intervenants se présentent -
Qui êtes-vous et qu’est-ce qui fait que vous êtes pertinents pour ce sujet ? Pourquoi était-il souhaitable de vous choisir pour en parler, aidez-nous à saisir votre légitimité sur ce thème de réflexion. Enfin, dites-nous dans votre introduction pourquoi le sujet vous a séduit et/ou convaincu de faire le déplacement : en quoi est-il intellectuellement stimulant pour vous ?
|
Je viens du métier (marketing, secteur banque assurance) et la data pour moi n'est pas une fin en soi, juste un levier parmi d'autres Cela fait deux ans que j'investi au quotidien dans la maîtrise opérationnelle des données - mastère big data telecom paris tech en 2013 - puis développement avec un associé de Mémorandum, cabinet de conseil en management avec une forte composante data. - Je collabore aussi avec l'institut Mines Telecom sur le montage de projet big data entre industriels et chercheurs sur Teralab (plateforme Big data
Ce qui m'intéresse dans le sujet : le big data n'est pas une fin en soit et en tirer le meilleur parti pas automatique. Avec mon associé Mémorandum nous animons des meet up "data business" qui travaillent cette question d'un stricte point de vue métier. Je suis consultant Avant-Vente chez HP autour de la solution Vertica. Cette technologie est mise en oeuvre dans le cadre de projet Big Data pour optimiser l'analyse des données structurées. En France, par exemple, notre solution est mise en oeuvre par BlaBlaCar pour un ensemble de besoins autour de l'analyse de données, cette mise en oeuvre est un bon exemple de l'évolution des approches autour de l'analyse des données. Ce thème est très important aujourd'hui parce qi'il est un vecteur de transformation pour beaucoup d'entreprise. |
À qui s’adresse ce thème de réflexion ?
À qui profitera-t-il de façon notoire ? Qui est concerné ? Qui sont les bénéficiaires (directs ou indirects) d’une réflexion approfondie sur le sujet qui nous rassemble ici ? Puisque nous abordons ce thème : nous devons nous demander pour qui il sera le plus utile de nous écouter en débattre ! On appelait ça le public cible jadis ;-) Aidons-les à se reconnaître.
|
La cible au sein des entreprises : toutes les directions opérationnelles. Les DSI sont des utilisateurs parmi d'autres et pourraient montrer la voix plutôt que la bétonner.
La taille des entreprises joue beaucoup dans le comportement data - les majors compagnies, qui ont des gigas données de data (Airbus, Total, la Société Générale) - elles peuvent investir dans une analyse fine de leur données, et ont atteint une masse critique de la données accumulées : elles peuvent monter un datalab, faire de la recherche dessus, et tenter toutes les techniques (ML, deeplearning..). - les startups qui construisent des business modèles autour de l’uberisation de l’économie (ShareVoisins, Blablacar, Deezer, Leboncoin…) - toutes les ‘petites’ entreprises, à partir d’une centaine d’employés, qui pensent que les big data ne sont pas pour elles. Elles ne voient pas simplement les avantages de la data, alors que les gains de productivité peuvent être important pour elles. C’est le coeur de cible de Mémorandum.
En synthèse : ceux qui pensent que le big data c'est de la magie qu'il faut vieux confier à des magiciens. Beaucoup d'entreprises de toute nature s'interrogent sur les nouvelles technologies qui peuvent leur permettre de mieux exploiter les données, à ce titre, ce que font les uns ou les autres est toujours riche d'enseignement.
|
L'actualité autour de ce sujet ?
Quelle est l’actualité, et/ou quelles sont les tendances du moment qui justifient qu’on traite de ce sujet, que faut-il savoir afin de comprendre le contexte dans lequel nous le traitons ?
|
Beaucoup d'actualité sur le deep learning .. des approches que les PME risquent de na pas oser approcher avant des années ... alors que leur implémentation est toujours open source et que des outils mettent de plus en plus les algos à portée des non programmeurs (Dataiku, azure ML, ..) Le thème du BigData cristallise beaucoup d'attentes et d'interrogations. La multiplicité des solutions (et des discours) devrait être une source d'inspiration puisque des solutions innovantes et très spécialisées apportent de nouvelles possibilités. Dans ce foisonnement de solutions, il semble plus souvent que les entreprises ont du mal à faire le tri |
Écosystème et contexte de marché ?
Si pertinent, dites-nous qui sont les acteurs majeurs, à ne pas perdre de vue dans notre sujet, ceux qui contribuent à impacter, structurer, transformer voire créer l’écosystème. Quelles sont les données essentielles à prendre en compte quant à l’état du marché qui touche à ce sujet business ? Ici : diagnostic général à base de faits concrets, chiffres, background, études pertinentes. Et même, si pertinent, une histoire ou une anecdote à raconter, une image à montrer : quoi que ce soit qui puisse nous servir à mieux planter le décor.
|
Je pense d'abord à Igor Carron et Franck Bardol qui animent une communauté de satascientist avec le meet up machine learning. et à tous les autres meet up connexes De meme que les briques techniques sont gratuites et open source, l'accès à la communauté est gratuit et ouvert. Je suis avec attention les acteurs qui transforment la datascience en commodité. ceux qui font que les personnes qui dans les bureaux ne savent pas faire un tableau croisé dynamique vont lancer demain un random forest sans le savoir
|
Concepts et définitions et mots clés ?
Avant d’aller plus loin, quels seraient les concepts clés à introduire pour que ce sujet soit correctement traité, et pour bien nous assurer que nous aurons un vocabulaire commun pour la suite ?
|
-Big data : la tète et les jambes, le machine learning et les infras de manipulation massive. Quand on fait une course les deux sont importants - le machine learning accessible en open source R Python (plus les api) suffit pour exploiter plusieurs giga de données sur son poste de travail. Dans ce cadre l'urgence n'est pas de construire ou d'acheter un cluster - l'infrastructure technique (hadoop, spark, ... ) sont indispensable pour des volumes vraiment massifs ou récurrents. Ce n'est de mon point de vue jamais le bon point d'entrée pour démarrer.
--> la valeur n'attend pas le nombre des octets. L'entreprise à des milliers de process à tester pour s’entraîner à penser data et en tirer des bénéfices opérationnels immédiats avant de "payer pour voir" sur des solutions industrielles BigData et analytics renvoient à un cycle plus ou moins complexe de gestion de données, de l'aquisition de ces données à l'analyse prédictive, Chaque projet spécifique porte des caractéristiques propres en lien avec ses besoins propres. Effectivement, les usages d'un côté Dataviz et Machine Learning, l'infrastructure d'autre part Hadoop, SQL ou NoSQL sont deux sujets majeurs de questionnement
|
Interrogations suscitées par le sujet ?
Quelles sont les bonnes questions à se poser à ce sujet pour l’aborder de façon pertinente et si possible, intellectuellement pertinente (et stimulante) ? (D’un point de vue strictement méthodologique, ce sont aussi les questions connexes qu’il soulèvera forcément et que talkshow va forcément devoir aborder selon vous : essayez de lister de l’ordre de 5 à 10 bonnes questions que nous devrons nous poser)
|
Ce questionnaire est déjà pas mal .. éventuellement les questions que j'aime poser à mes interlocuteurs - quand le "big data" aura répondu à votre question, qu'allez vous faire avec la réponse ? - le big data trouve des réponses mais ne sait pas poser les questions : comment vous organisez vous pour faire émerger des questions percutantes ? ... |
Points de vigilance à observer ?
Quels sont les écueils, les mises en garde, les points de vigilance liés à ce sujet ? Donnez-nous votre vision des erreurs possibles à garder à l’esprit avant d’aborder ce thème. En forme de mises en garde : ce n’est pas toujours forcément utile, mais il se peut qu’un sujet doive être d’emblée canalisé. Autrement dit : comment cadrer ce sujet pour éviter qu’il ne parte dans une mauvaise direction ? En outre, y a-t-il un risque quelconque : de malentendu, d’incomplétude, de polémique. Un sujet peut parfois en cacher un autre, ou peut même déranger, sait-on jamais.
|
Je prends le sujet d'un point de vue métier, pas technique. si on part sur les avantages comparé distributions d'outil .. je serai un auditeur attentif !
Eviter aussi le débat sur des subtilités sémantiques "big data", datamining" machine learning, analytics, BI, ... chacun a sa compréhension et sa sensibilité (j'ai la mienne ;) : on pourrait en rester à la volonté partager de transformer des paquets de données en des meilleures décisions (automatisées ou non) dans l'entreprise |
Enjeux métier : transformations ou évolutions en ligne de mire ?
Quels sont les enjeux qui dans ce sujet touchent (potentiellement) à votre métier et à son évolution, ou révèlent qu’il va probablement se transformer ? (on peut évidemment parler du métier de vos clients le cas échéant)
|
Le data scientist sera bientôt remplacé par la machine. En attendant on a le droit de se cultiver et de comprendre comment ca marche. La seule façon pour cela c'est de passer à l'action.
Pour mes clients le risque est de confier de plus en plus de décisions opérationnelles à un sous traitant qui stocke et analyse ses données pour son compte. Un reporting powerpoint ne suffit plus à garder la maîtrise opérationnelle de son activité |
La pensée dominante : un semblant de consensus ?
En lien direct avec la question posée, y a-t-il un (plus ou moins vague) consensus qui semble entourer cette thématique de réflexion à l’échelle de l’écosystème. Y a-t’il une doctrine dominante, qui soit dit en passant, puisse (potentiellement) nécessiter qu’on la bouscule un peu ?
|
|
No bullshit : identifier les foutaises sur le sujet.
Quelles sont les pires foutaises, erreurs, fumisteries ou même charlataneries que vous ayez entendues ou que vous ayez observées en terme d’approche sur ce thème business ? – On peut aussi dans cette optique, aborder l’écart qui existe entre discours/mythes/théories et réalité(s) ?
|
pas vraiment bullshit mais ... la mode d'utiliser les données des réseaux sociaux, voire même les DMP qui traquent le moindre log web me semblent etre en partie des effets de mode et d'émulation de groupe. Non qu'il n'y ai rien à faire sur le sujet mais cela revient à escalader ;l'everest pour la première fois par la face nord en hiver quand il y a des milliers de chemins soft qui permettent de grimper efficacement.
En gros j'ai le sentiment que nombre d'entreprises commencent pas des sujets qu'elle ne peuvent clairement pas commencer à traiter en interne. comme ca la question de l'externalisation ne se pose même pas et on peut retarder encore un peu le moment de s'y mettre vraiment |
Comment passer à l’action ?
Explorons maintenant vos préconisations pour traiter ce sujet selon votre approche et vos choix méthodologiques quand il s’agit de mettre en pratique, dans une entreprise ou un projet business, vos propres convictions sur ce thème. De la théorie au passage à l'acte. Au travers de vos propres retours d’expérience : quelles sont les possibilités et vécus en termes d’exécution ? Où sont les compléments possibles avec d’autres éventuelles méthodes ou approches, d’autres écoles de pensée ?
|
les mauvaises façon de commencer (de mon point de vue) quand on pense que le big data est une potion magique - commencer par fabriquer un chaudron (un cluster interne) - commencer par recruter un druide (un data scientist) - commencer par réunir les datas (les ingrédients de la potion) --> ces démarches sont une bonne façon de repousser le moment de commencer à (vraiment) travailler, à réfléchir à une démarche de travail, d'exploration, une stratégie opérationnelle. Dans chacune de ces 3 premières approches, l'entreprise se retrouve après avaoir atteint son premier objectif devant une question encore plus crue (il a investi du budget) : est qu'est ce que je fais maintenant ?
Autre approche : faire des petits pas avec un objectif strat long terme - petits pas : je teste une foultitude de question sur des questions très précises. je peux sous traiter dans un premier temps à un cabinet spécialisé (faire tourner un algo n'est rapide et peu onéreux). Enjeu : comprendre comment poser une question et toucher du doigt les réponses apportées, commencer le transfert de compétence - vision long terme : développer une maîtrise interne de la donnée dans l'entreprise. le pire : développer une super approche auprès d'un sous traitant qui absorbe toutes les données et maîtrise seul l'infra et les algos. certaines entreprises comprennent bien cela et forment leurs effectifs à penser et agir data. c'est à leur portée. |
Insight : comment surmonter les possibles résistances ?
Partagez avec nous une matière à penser, illustrée par votre façon personnelle (si nécessaire) de faire bouger les lignes sur ce sujet, pour convertir vos interlocuteurs ou votre public en faveur de vos convictions sur ce thème business. Qu’est-ce que vous pourriez énoncer de surprenant, à contre-courant, qui puisse faire l’effet d’un électrochoc salutaire ? Objectif : trouver le bon argument pour achever de convaincre et séduire, faire passer une vision, une idée importantes sur ce sujet.
|
un projet big data est un projet RH, un des rares projets vraiment concret d'ouverture et de synergie dans l'entreprise. En effet, on peut faire plus fort que l'open innovation (j'ouvre mes données à des acteurs tiers pour qu'ils jouent avec) : je peux ouvrir mes données entre services, à l'intérieur de l'entreprise : que la marketing exploite les datas de la direction des risques, que la compta exploite les données marketings, que les RH exploitent les données de chacun ... ca peut se faire de manière brutale (Amazon) ou progressivement sur base de volontariat. Un premier manager ouvre ses données, un challenge interne incite à la meilleure réutilisation par les autres services, .. |
Tentative de synthèse -
Pour conclure, que faudrait-t-il idéalement retenir de tout ce qui a été dit ? Mots-clés, idées force, et conseils de mise en pratique en résumé.
|
just do it fail fast and learn ... |
Matière à penser.
Vous arrive-t-il, sur ce sujet, d’avoir lu des propos un peu provocateurs, ou de les avoir vous-mêmes écrits ou proférés ? C’est le moment d’éveiller l’empêcheur de tourner en rond qui sommeille en vous s’il n’est pas déjà sur le pont. Vous pouvez faire bouger ce débat, voire l’écosystème qui l’entour, en nous montrant votre côté rebelle ou en citant d’autres rebelles.
|
supprimer le mot "big" dans big data me suffira |
Suggestion de speakers
Qui d’autre aimeriez-vous voir intervenir sur un sujet comme celui-là ? Qui peut polémiquer face à qui ? Vos idées nous intéressent : non, malgré les apparences nous ne connaissons pas tout le monde...
|
christophe benavent, olivier Guillouzouic |
Une bonne manière de conclure ?
Chut, ne le répétez à personne… Mais nous ne sommes pas supposés savoir à l’avance comment se termine un sujet de débat… mais on a le droit de le souhaiter ‼ Selon, vous, quelle serait la bonne conclusion vers laquelle il serait souhaitable d’orienter le débat : disons, celle qui vous ravirait le plus ? Attention, ça ne veut pas dire qu’il ira dans ce sens, mais si vous avez une « envie » en la matière, ou un objectif, c’est toujours bon de le savoir ne serait-ce que pour comparer.
|
on exploite la données produites au cours de l'émission : - connexion, déconnexions - analyse d'image (qui bouge plus ou moins) analyse de son (qui s'exprime, comment avec quelle syntaxe, ..) - intervention réseaux sociaux, qui quoi quand comment quel réseau .. - ... (oups .. je viens de démarrer un projet en partant de la donnée ;) |