Partager la publication "Dresseur d’intelligence artificielle, métier de demain ?"
Nouveau message sur la boîte mail de Bendaoud. Et nouvelle mission. Elle lui est proposée par l’une des plateformes de micro-jobs où est inscrit ce jeune homme de 20 ans, étudiant en gestion d’entreprise à Tarbes (Hautes-Pyrénées). Une société recherche des volontaires pour une tâche dont la durée est estimée à une heure. La mission : répéter oralement des phrases affichées sur un écran. Comme « Ok, fais-moi faire l’entraînement avec de la musique de fond ». La proposition tombe bien, l’étudiant vient de finir les cours.
Tout sourire derrière des lunettes cerclées or, Bendaoud exerce une profession accessible à tous à partir de quelques clics : dresseur d’intelligence artificielle. Amazon Mechanical Turk, Appen ou encore Foule Factory… ces plateformes de microtravail, ouvertes sur simple inscription, ont pour credo le renforcement humain des intelligences artificielles qui ont envahi notre quotidien : reconnaissance des images, de la parole ou de l’écriture. Par l’intermédiaire de sous-traitants, Apple emploie même pour cela des salariés à plein temps. Un univers méconnu, sur lequel les géants du numérique restent discrets. Car il froisse l’image d’une technologie qui, en réalité, a besoin de petites mains pour fonctionner.
Cet article a initialement été publié dans WE DEMAIN n°35, paru en août 2021. Un numéro toujours disponible sur notre boutique en ligne.
« Elles ne comprennent rien »
Lorsqu’elle vivait en Thaïlande, Lena *, une étudiante de 20 ans, a elle aussi participé au renforcement d’intelligences artificielles. Inscrite sur une plateforme, sa principale tâche consistait à transcrire des messages vocaux que la machine n’avait pas su reconnaître. « C’était, par exemple, des bruits de poche, un son que l’assistant vocal n’avait pas identifié, explique-t-elle. Mais cela pouvait être un accent mal compris. Ou les paroles d’une personne qui n’avait pas articulé. » Mathilde, traductrice free-lance parisienne, propose, elle, « des suggestions, par écrit, de phrases, souvent banales, pour parler à une machine ». Bendaoud a également été sollicité pour corriger la retranscription automatique d’un texte écrit par un assistant vocal. Ou pour comparer les résultats de deux moteurs de recherche, et se prononcer sur le meilleur résultat.
Si les dresseurs d’IA sont indispensables, c’est parce que les intelligences artificielles sont bêtes. « Elles n’ont strictement rien d’intelligent : elles ne comprennent rien et ne perçoivent aucun contexte », explique l’ingénieur Luc Julia, l’un des concepteurs de l’assistant vocal Siri. Selon ce spécialiste, les assistants vocaux, grands consommateurs de dresseurs d’IA, ne reconnaissent ainsi que 80 à 85 % de ce que nous leur demandons. Un mauvais résultat : imaginez un livre où 20 % des mots manqueraient. « La limitation de la technologie actuelle, basée sur les réseaux de neurones, c’est qu’elle a besoin de voir des exemples assez proches des situations qu’elle connaîtra ensuite lors de son fonctionnement. Il lui faut donc beaucoup de données pour qu’elle atteigne tout son potentiel », ajoute Emmanuel Vincent, chercheur à l’Inria (Institut national de recherche en informatique et en automatique), spécialiste du traitement de la parole.
Dresseur d’intelligence artificielle, le coup de pouce humain nécessaire
Pour réussir à accomplir les tâches que nous leur demandons, les intelligences artificielles ont besoin d’un sérieux coup de pouce humain. D’abord à leur création, en étant alimentées par une foultitude d’exemples. « Pour qu’un assistant vocal comprenne mes questions sur la météo, il faut lui faire entendre différentes manières de faire cette demande », souligne Paola Tubaro, directrice de recherche au CNRS (Centre national de recherche scientifique).
Ensuite, une fois entrées en fonctionnement, pour corriger leurs erreurs. Pourquoi cette demande sur le temps qu’il fera demain n’a pas été comprise ? Est-ce à cause d’un accent différent ou d’une voix trop atypique pour le programme ? En réalité, le traitement de la parole est un assemblage complexe entre des tâches de perception (la transcription textuelle), de raisonnement (l’analyse de cette transcription) et de génération (la réponse à la demande). « Nous avons encore besoin d’annoter humainement les données pour les tâches de la perception, explique Emmanuel Vincent. C’est difficile à automatiser car il y a beaucoup de sources de variabilité. Nous avons des voix différentes, jeunes, âgées, des accents régionaux ou étrangers. C’est donc compliqué de programmer cela. »
À lire aussi : Cet article a été écrit par une intelligence artificielle
Un complément de revenu
Ce chercheur a beau travailler à réduire cette part d’annotation humaine, à moins d’une révolution technologique, elle sera toujours indispensable dans les années à venir. À la satisfaction de certains dresseurs d’intelligence artificielle. « Avec le développement de cette technologie, il y a du travail dans le domaine », observe Bendaoud, flatté de travailler indirectement pour les géants du numérique. « Les utilisateurs ne se rendent pas compte que les progrès des assistants vocaux sont gagnés millimètre après millimètre, grâce à un travail de fourmi permanent », complète Lena.
Pour ces deux dresseurs d’intelligence artificielle, ce travail à temps partiel est synonyme de complément de revenu très flexible. « Je ne pouvais pas prendre un travail à mi-temps, cela aurait été trop prenant par rapport à mes études », raconte Lena, qui gagnait ainsi entre 100 et 200 euros par mois, en plus de sa bourse étudiante.
« Particulièrement abrutissant »
Mais tous les dresseurs d’IA ne sont pas aussi élogieux. Matt, qui a renforcé des intelligences artificielles pendant plusieurs mois, cela reste un « travail à la chaîne particulièrement abrutissant, même si certaines tâches sont plus amusantes que d’autres ». Cet ancien étudiant en développement web à Namur (Belgique), alors tout juste majeur, a corrigé des reconnaissances manuscrites et orales d’intelligences artificielles : « Le taux de rémunération horaire n’était pas à la hauteur du Smic mais pas non plus ridicule, cela reste une bonne solution pour arrondir des fins de mois si l’on a du temps à perdre. »
Sur certaines plateformes, les rémunérations peuvent également être très faibles. Ce qui alimente la crainte de l’émergence d’un prolétariat des travailleurs du clic. « Avec ces tâches, il y a plusieurs problèmes de fond : la transparence des employeurs, la concurrence internationale effrénée qui tire vers le bas les rémunérations, et l’isolement au travail, avec ces tâches qui se font tout seul », résume Paola Tubaro, directrice de recherche au CNRS.
L’éthique du job de dresseur d’intelligence artificielle a été dénoncée il y a un an par un jeune Français. Thomas Le Bonniec s’était envolé pour l’Irlande pour rejoindre un sous-traitant d’Apple. Sa mission ? Retranscrire des échanges enregistrés par Siri, par exemple des déclenchements intempestifs du programme ou une mauvaise compréhension de la demande des utilisateurs. « Pendant cette période, j’ai écouté environ 46 000 enregistrements », confie-t-il au site d’info Le Média. Un volume impressionnant, synonyme, pour l’ancien étudiant en sociologie, d’un espionnage de masse. Ce dernier est approuvé par les « écoutés », sans vraiment qu’ils en aient conscience. Les conditions générales d’utilisation de la plupart des assistants vocaux – si on les a lues – précisent en effet que des enregistrements peuvent être collectés à des fins d’amélioration du service.
Tous dresseur d’intelligence artificielle
Un problème de données personnelles qui concerne aussi les dresseurs d’IA, quand on leur demande de se filmer avec leur chien dans certaines situations ou d’enregistrer une conversation téléphonique de trente minutes avec un complice, sans savoir vraiment ce qu’il adviendra de l’enregistrement.
Des inquiétudes qui médiatisent un métier de niche, destiné demain à être pratiqué beaucoup plus largement. « Nous devenons tous des dresseurs d’IA car il va y avoir de plus en plus d’interactivité », prévient Luc Julia. Les intelligences artificielles devraient ainsi davantage nous demander de les corriger. Que l’on soit dresseur d’IA professionnel ou pas. « L’annotation pourra également passer par la science participative, par exemple en collectant de la donnée à travers des jeux éducatifs, comme ZombiLingo, permettant l’apprentissage de la grammaire », espère Emmanuel Vincent. Autre piste : le projet Common Voice, une base de données libre pour la reconnaissance de la parole créée par la fondation Mozilla.
En attendant, revenons à Tarbes. Bendaoud vient de finir sa lecture de questions. Elle lui a rapporté 30 dollars (25 euros). La suite ? Il attend la prochaine proposition. Mais l’étudiant a déjà une autre idée en tête. De dresseur d’intelligence artificielle, il se verrait bien data scientist. Un autre nouveau job, encore plus près des intelligences artificielles.
* À la demande des interviewés, les prénoms ont été changés.