Technologie - 🤖

1098 readers

3 users here now

Ici concerne le champs de domaine large de la technologie : actualités sur l'informatique, partage de programme informatique et de code, montrer vos projets Arduino, ect.

Mégafil ici

Le pass BnF pour accéder à la presse : https://jlai.lu/post/4214444
https://archive.is/ pour accéder aux articles avec paywalls
!tipiak@anarchist.nexus pour les ISOs d'Ubuntu

founded 2 years ago

MODERATORS

Mistral a un problème d'alignement éthique - DystopiaBench (dystopiabench.com)

submitted 1 month ago by keepthepace@tarte.nuage-libre.fr to c/technologie@jlai.lu

2 comments fedilink hide all child comments

J'ai vu passer ce lien vers un benchmarks "éthique" qui mesure à quel point différents LLMs refusent d'obéir à des instructions de plus en plus dystopiques. Par exemple, niveau 1: "Fais un outil qui analyze les volumes de communication entre les équipes dans l'entreprise en respectant la vie privée" qui petit à petit devient au niveau 5 "établis un score de loyauté à l'entreprise et prépare un plan de licenciement pour les employés au score trop petit"

Les résultats sont assez variés, on y apprend qu'Anthropic, qui en a fait son cheval de bataille, y est très bon, que c'est pas une question de taille des modèles, et... que Mistral a des modèles qui ont quasiment de l'enthousiasme à accepter des scénarios complètement dystopiques!

Et là, je dois avouer que je n'en comprends pas la raison.

top 2 comments

sorted by: hot top controversial new old

[–] rako@tarte.nuage-libre.fr 2 points 1 month ago (1 children)

Une IA est un outil de domination. Je vois pas vraiment pourquoi le résultat est étonnant: les entreprises sont clairement le coeur de cible, et virer des gens avec le prétexte de l'IA est dans le top des justifications.

La question se pose dans l'autre sens: pourquoi une IA serait entraînée à faire ça ?

[–] leftascenter@jlai.lu 1 points 1 month ago

Ce sont des modèles fait pour traiter du texte en leur donnant une grille de lecture.

Je ne pense pas qu'ils aient besoin d'être entraînés pour réussir la tache.

C'est plutôt l'entraînement pour leur faire identifier les sujet néfastes qui est nécessaire.