IA : « Des humains sont essentiels pour entraîner les systèmes »

IA : « Des humains sont essentiels pour entraîner les systèmes »

Maxime Cornet et Clément Le Ludec, à Paris, le 26 janvier 2024.

Les intelligences artificielles (IA) sont plus humaines qu’on ne le pense. La mise au point de bon nombre de systèmes de reconnaissance d’images, d’analyse de textes, de manipulation de sons… nécessite le travail de « petites mains » essentielles. Les jeunes sociologues Maxime Cornet, doctorant à l’Institut interdisciplinaire de l’innovation, et Clément Le Ludec (Centre d’études et de recherches de sciences administratives et politiques, à Paris), qui a soutenu son doctorat en mars, ont tenté de comprendre leur rôle en interrogeant, depuis 2021, une vingtaine d’entreprises dans ce secteur en France. Cela les a amenés à étudier sept de leurs sous-traitants à Madagascar, ainsi qu’environ deux cents de leurs employés. Dans le journal Big Data & Society, ils ont publié, en 2023, avec Antonio Casilli, « Le problème de l’annotation. Travail humain et externalisation entre la France et Madagascar ».

Pourquoi les systèmes d’intelligence artificielle ont-ils besoin de petites mains ?

Clément Le Ludec : Ces techniques servent à classer, à détecter…, selon des principes d’apprentissage. De grandes quantités de données dites d’entraînement – images, vidéos, textes… – servent à leur mise au point, afin de pouvoir généraliser les réponses sur de nouvelles données. Des humains sont donc essentiels pour entraîner les IA, soit pour générer des données, par exemple en se filmant passant devant une caméra, soit pour vérifier que les prédictions du modèle sont correctes. Mais l’activité principale consiste à annoter les textes ou les images, afin de construire le corpus d’apprentissage, par exemple en indiquant sur la photo d’un carrefour quels sont les panneaux de signalisation, ou en identifiant des traces de rouille sur des photos de poteaux électriques, ou en repérant si un client est en train de voler dans un magasin. Même ce que l’on appelle l’IA générative est concernée. ChatGPT a nécessité beaucoup d’annotations pour apprendre au programme ce qui est une réponse acceptable ou non, selon une certaine échelle de valeurs. Dans notre base de données d’entreprises recourant à ces tâches humaines, un tiers appartient au secteur du traitement automatique des langues.

Maxime Cornet : Dans cette foule d’activités humaines, nous avons même vu une quatrième activité, la plus « extrême », qui est d’embaucher des gens pour se substituer au logiciel et faire croire au client qu’il y a une intelligence artificielle derrière.

Comment ce travail invisible est-il organisé ?

M. C. : Certaines entreprises conservent ces tâches en interne, notamment si les données sont sensibles. Mais beaucoup nous disent que pour ce travail répétitif et pénible, qui peut consister à visionner plusieurs centaines d’images par jour, ils ne trouvent personne en France. D’où l’externalisation que nous avons constatée vers des entreprises spécialisées à Madagascar. Aucune étude quantitative n’existe à notre connaissance pour estimer la part de cette externalisation, mais dans notre base de données d’une vingtaine d’entreprises, deux tiers ont recours à cette sous-traitance pour ce travail sur les données. Nous estimons aussi que ce dernier représente 5 % à 10 % du coût d’un logiciel d’IA. Le développement de l’intelligence artificielle ne signifie pas des pertes d’emplois dus à l’automatisation, comme avancé par certains, mais plutôt leur déplacement dans les pays en développement.

Il vous reste 63.83% de cet article à lire. La suite est réservée aux abonnés.

Avatar
LJD

Les commentaires sont fermés.