Émission de Xavier de la Porte, autour de la thèse de sociologie de Camille Girard-Chanudet.
Passionnante plongée dans le quotidien d'une équipe d'annotatrices pour entrainer un algorithme d'anonymisation de décisions de justice :
On perçoit à quel point les catégories d'annotation pèsent lourd, et combien il est crucial que l'annotation humaine se place dans une perspective d'intelligence collective.
Derrière un imaginaire peuplé d’androïdes rutilantes se cachent les petites mains qui annotent patiemment les données. Un travail sans fin, car le réel sans cesse changeant échappe à l'automatisation.
La thèse de sociologie de Camille Girard-Chanudet éclaire les rouages du deep learning : au palais de justices, des travailleuses de catégorie C travaillent avec application à annoter les données pour un algorithme d'anonymisation des décisions de justice destinées (entre autres) aux startups des legal techs.
L'émission de Xavier de La Porte révèle l'ampleur des collaborations humaines encapsulées dans les machines que l'on voudrait nous présenter comme intelligentes. C'est une myriade de décisions qui conduisent à définir des catégories réductrices pour saisir le réel. Ces catégories s'imposent silencieusement - d'abord aux travailleuses et travailleurs du clics, puis aux utilisatrices et utilisateurs des services d'IA.
Toutefois, à la différence de la majeure partie du "digital labor" étudié par Antonio A. Casilli et ses collègues du programme Panoptiwork, cet exemple démontre qu'il est possible de mobiliser l'IA dans une perspective d'intelligence collective.
L'intelligence collective, c'est "la mise en commun de la réflexivité afin de finaliser une action qui ne pourrait pas l'être par une seule personne" (Samuel Szoniecky et Nasreddine Bouhaï). Cette mise en commun n'est possible qu'au prix de contraintes destinées à rendre le travail interopérable. Ainsi, l'activité des annotatrices du Palais de Justice est cadrée par des catégories, mais leur position pérenne leur permet d'interroger et de faire évoluer ces catégories.
Les grands modèles de NLP sur lesquels s'appuient de telles applications restent ceux que des entreprises privées daignent partager en open source. Ils ne sont pas entrainés dans des conditions aussi idylliques, loin de là. Est-ce tolérable ?
En lisant le déroulement de l'altercation, je n'ai pas pu m'empêcher de me rappeler une situation similaire vécue il y a quelques années.
Mon épouse et moi descendions une ruelle étroite du centre-ville de Metz. Je poussais la poussette de notre fille encore bébé. Une voiture était mal stationnée sur le trottoir et celui d'en face était saturé de véhicules également. A l'approche des fêtes, la circulation était dense. N'ayant pas d'autre possibilité, je me suis engagé sur la route. L'automobiliste derrière moi n'a pas apprécié et a accéléré bruyamment en passant à quelques centimètre de moi.
Tout comme le cycliste décédé cette semaine, j'ai frappé de colère sur le toit de son véhicule. Le type s'est arrêté pour descendre et venir me menacer, son visage collé au mien. En mon fort intérieur, j'étais prêt à me faire casser la gueule sous les yeux de tous les témoins pour que ce type prenne cher. Je pense qu'il l'a compris à mon regard, il a lâché l'affaire : ce type d'individu ne comprend que ce langage.
Si j'avais été seul, sans témoins, ou si j'avais semblé plus vulnérable (au hasard, si j'étais une femme ou simplement un peu plus gringalet), j'aurais simplement dû subir sans réagir. Dans toutes les affaires de violences, je suis mal à l'aise qu'on se focalise sur le genre des victimes : le problème c'est la violence viriliste, l'abus de pouvoir, d'où qu'elle vienne. Le fait que ce soit surtout l'apanage des hommes devrait nous inciter à valoriser d'autres comportements chez toutes et tous, plutôt qu'à encourager les femmes à suivre l'exemple des "femmes fortes" ou des "femmes de pouvoir" qui ne font que reproduire le modèle viriliste.