En cliquant sur "Accepter", vous acceptez le stockage de cookies sur votre appareil pour améliorer la navigation sur le site, analyser l'utilisation du site et contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.

Fermer

« A-t-on besoin uniquement de beaucoup de données pour faire des progrès en IA ? »

« A-t-on besoin uniquement de beaucoup de données pour faire des progrès en IA ? »

Interview de Laurence Devillers du 03 mai 2019

Par L'Usine Nouvelle

L'apprentissage machine est une technologie d’IA permettant aux  ordinateurs d’apprendre sans avoir été programmés explicitement pour cela. La majorité des programmes d’apprentissage sont pour l’instant dit supervisés, c’est-à-dire ont besoin d’être nourri par des données annotées. Le deep learning (apprentissage profond) est un type d’apprentissage automatique qui utilise des outils statistiques pour établir des modèles à partir de grands corpus de données (big data). Aujourd’hui, plus il a de données annotées, plus le système d’apprentissage profond peaufine ses modèles.

Pour toutes ces approches, les données annotées sont pour l’instant le pétrole. Mais jusqu’où cela est-il vrai ?

Les systèmes actuels sont très  performants pour certaines tâches demandant des calculs complexes et une grande mémoire mais les indices qu’ils extraient sont très différents des indices utilisés par les humains pour les mêmes tâches. D'une part,  lorsqu’ils font des erreurs, elles sont très différentes de ce que font les humains. Les systèmes sont donc peu transparents et peu intelligibles. D’autre part, ces systèmes apprennent des comportements statistiquement représentés, les cas rares sont toujours oubliés. Il est donc nécessaire de surveiller les biais de ces algorithmes. Un autre point peu mentionné est que les systèmes de deep learning apprennent sans raisonnement, ils construisent leurs modèles uniquement à partir de corrélations d'indices.

A quoi servent-ils ?

Par exemple à la reconnaissance de la parole, de visages, d’objets défectueux, de tumeurs malignes… mais aussi à la reconnaissance d’émotions dans le visage et dans la voix pour le recrutement, l’aide à la décision marketing, l’aide au diagnostic médical...

Qui a les données ?

Les géants du numérique américains et chinois, ceux qui gèrent le trafic des données et qui ont des applications sur internet : les sites de rencontre, mais aussi les montres ou enceintes connectées, bref l’IoT… Par exemple, Facebook, Google et Amazon enregistrent nos données, plusieurs scandales ont défrayé la chronique récemment sur ce sujet. Ces données ne sont pas annotées et sont souvent difficiles à utiliser dans les systèmes d’apprentissage machine sans un effort de nettoyage et de calibration, ce qui coûte beaucoup d’argent.

Qui annotent ?

Les technologies de reconnaissance vocale comme Alexa d’Amazon ne seraient pas en mesure d’interpréter ou de répondre à nos commandes vocales sans avoir recueilli des milliers d’heures de données de la parole de personnes avec des accents, avec des troubles d’élocution, dans différentes langues, avec des voix ou de la musique en arrière-plan, etc. Amazon paie des milliers d’employés notamment aux Etats-Unis, en Roumanie, en Inde ou encore au Costa Rica pour écouter les conversations des utilisateurs de son assistant personnel Alexa afin d’annoter les données et d’améliorer les réponses du système aux demandes des utilisateurs. Les échanges vocaux sont retranscrits, annotés et viennent enrichir l’algorithme si nécessaire. Il est urgent de faire de la recherche sur l’apprentissage en ligne ne nécessitant pas d’annotations.

Où est le respect de la vie privée ?

Dans la bataille pour la collecte des données entre les USA et la Chine, la protection des données personnelles (RGPD : règlement général de protection des données) est un atout majeur en Europe. Nous créons des conditions de confiance pour collecter des données afin de permettre aux entreprises européennes de relever les défis de l'IA et surtout pour préserver le marché européen ainsi que nos valeurs et notre liberté. L'IA a une incidence forte sur la société d'un point de vue économique mais aussi sociétal et de liberté d'opinion. Il ne s'agit pas tant de rivaliser que de monter un marché européen et de valoriser nos approches plus citoyennes. Il y a un certain nombre d’obligations du RGPD que les entreprises américaines respectent déjà. D'ailleurs, les américains alertés par tous les scandales sur les données sont aussi en train de rédiger un RGPD « à l’américaine » un peu moins contraignant donc c'était une excellente idée. En Chine, la police chinoise utilise un système de classement reposant sur le big data pour identifier les groupes d’individus suspects. Ces capacités de surveillance amplifiées, augmenteront de fait la coercition et la surveillance de ceux considérés comme des éléments instables, y compris les pétitionnaires et les dissidents !

Peut-on se passer d’expertise humaine et utiliser l’apprentissage profond pour toutes questions ?

Le système de reconnaissance vocale BAIDU utilise un ensemble énorme de données (données collectées mais aussi synthétisées) pour apprendre la robustesse au bruit et la variation de voix entre les locuteurs. L’apprentissage profond, formé sur un ensemble de données, y compris plus de 100 000 heures de données synthétisées, permet d’améliorer considérablement la reconnaissance de la parole. Pour lui, plus besoin de dictionnaire phonétique, ni même de concept de phonème pour faire de la reconnaissance de la parole par exemple. Bref, le système apprend à reconnaître des formes sans aucune connaissance experte. Ces 100 000 heures de données synthétisées sont-elles réellement différentes des données déjà présentes ?

Quel autre type d’apprentissage aujourd’hui ?

Il existe 3 principaux types d’apprentissage : l’apprentissage supervisé, non supervisé et par renforcement. L'apprentissage non supervisé est un problème d'apprentissage automatique où le logiciel doit trouver des structures sous-jacentes dans les données non annotées. L'apprentissage par renforcement marche grâce à des mesures de récompense par essai-erreur.

Peut-on éviter la nécessité d'annoter d'énormes quantités de données ?

La solution est l’apprentissage en ligne dans le monde réel. Les USA et les Européens sont toujours à la pointe sur l'innovation et les recherches en IA. Un des objectifs actuels des chercheurs est de modifier ou combiner ces algorithmes pour construire des systèmes entrainés sur peu de données annotées au départ. Ces systèmes pourront améliorer leur performance par un apprentissage en continu à partir de données capturées automatiquement sans besoin d'annotation. Ce mode d’apprentissage plus autonome nécessitera un contrôle quasi-permanent des connaissances de la machine.

Pour conclure, il est urgent que nous collections des données en Europe mais aussi que nous continuions une recherche de qualité. La santé, les transports, l'environnement et la défense sont les 4 axes prioritaires sur lesquels nous devons nous battre grâce à l’intelligence artificielle dans le respect de nos valeurs éthiques. Il faut investir massivement en recherche et sur des plateformes pour arriver à concurrencer les géants de la technologie sur notre marché.

Prêts à développer une stratégie de Croissance Servicielle ?

Êtes-vous prêts à donner un nouvel élan à votre entreprise, à travers une approche orientée Services, une relation clients singulière et fidélisante, un modèle économique disruptif et en phase avec votre politique RSE, une politique managériale adaptée à toutes les générations, une performance commerciale revisitée et durable, et/ou des coopérations clients-fournisseurs-partenaires inédites et à forte valeur ajoutée ?
Chez Service&Sens, nous sommes là pour vous guider dans le développement de votre stratégie de croissance sur mesure, en transformant chacun de vos défis en opportunités concrètes, portées par vos équipes.

Contactez-nous
Télécharger cet article :
Merci, vos informations ont bien été envoyées
Télécharger
Oops! Something went wrong while submitting the form.
Partager cet article :

Abonnez-vous à Transform'Action News, notre newsletter incontournable !

En vous abonnant, vous aurez un accès privilégié à un monde d'avantages. Tous les deux mois, nous vous partagerons des contenus exclusifs, des analyses prospectives, des actualités de l'industrie, des conseils d'experts et bien plus encore.
Rejoignez notre communauté dynamique et enrichissante dès maintenant en vous abonnant à notre newsletter.
C'est rapide, facile et gratuit. Et souvenez-vous, l'information est le pouvoir.

M'inscrire à la newsletter

D'autres articles sur le même sujet

Transformer son entreprise avec intelligence : pourquoi faire appel à un consultant au bon moment change tout

Transformer son entreprise avec intelligence : pourquoi faire appel à un consultant au bon moment change tout

Pourquoi le bon consultant fait toute la différence ? Dans un monde en mutation permanente, réussir sa transformation exige bien plus que de la volonté : il faut de l’expertise, du rythme et une gouvernance solide. Le recours au conseil, longtemps perçu comme un luxe ou une béquille, devient un levier stratégique à condition d’être aligné sur les priorités, utilisé avec méthode, et intégré à la dynamique interne. L’enjeu n’est pas d’externaliser, mais de renforcer. Le bon consultant n’est pas un pilote, mais un copilote éclairé. Bien utilisé, il accélère, structure et transmet. Mal cadré, il disperse. À vous d’en faire un catalyseur, pas un coût.

Lire cet article
Agentic AI et Agent-Washing : le double défi stratégique pour les entreprises en 2025

Agentic AI et Agent-Washing : le double défi stratégique pour les entreprises en 2025

L’essor fulgurant de l’intelligence artificielle a vu émerger un terme aujourd’hui omniprésent dans les communications tech : celui d’Agentic AI, désignant des agents intelligents capables de prendre des décisions et d’agir de manière autonome, dans des domaines aussi variés que la gestion, la relation client, ou la cybersécurité. Entre promesses et réalité, force est de constater que, derrière des slogans marketing alléchant, bon nombre de solutions sont avant tout des chatbots ou robots d’automatisation traditionnels rebaptisés “agents”, sans capacité réelle d’autonomie ni de raisonnement. Ce phénomène porte un nom : l’agent washing, ou "AI Agent Washing." Selon une étude récente, plus de 40 % des projets qualifiés d’agentic AI seraient voués à l’échec d’ici fin 2027, non seulement en raison de coûts et d’une valeur métier incertaine, mais aussi à cause d’une vaste surs d’offres sur-étiquetées, où seuls environ 130 fournisseurs sur des milliers proposent de réelles capacités d’agent autonome. Une majorité de ces projets restera au niveau de démonstrations de principe, tandis que l’excitation suscitée par ces technologies masque les limites et les risques opérationnels, éthiques et juridiques.

Lire cet article
Comment les technologies 4.0 redessinent le SAV ?

Comment les technologies 4.0 redessinent le SAV ?

Dans les usines comme dans les centres de services, la 4e révolution industrielle est en marche. Impression 3D, intelligence artificielle, jumeaux numériques, automatisation et analyse prédictive bouleversent la façon dont les entreprises conçoivent, produisent et maintiennent leurs produits. Pourtant, un domaine stratégique reste souvent en retrait : le service après-vente. Et si c’était justement le bon moment pour faire du SAV un terrain d’expérimentation et d’innovation à haute valeur ajoutée ?

Lire cet article