ActualitésViré par xAI pour avoir alerté sur les dérives de Grok ?...

Viré par xAI pour avoir alerté sur les dérives de Grok ? Un ingénieur brise le silence

Devin Kim, ancien ingénieur chez xAI, affirme avoir été licencié après avoir alerté en interne sur les risques de Grok, le chatbot maison. Il a déposé une plainte devant un tribunal d’État en Californie, visant xAI et sa maison mère SpaceX, en soutenant que ses remarques sur la sécurité auraient été traitées comme un problème de management, pas comme un signal d’alarme. L’affaire tombe dans une période tendue pour Grok, déjà associé à des contenus offensants, à des accusations de biais, et à des usages détournés. Entre le fameux épisode MechaHitler, des réponses jugées toxiques après des ajustements de consignes, et des plaintes liées à des images sexualisées non consenties, la question est simple : à quel moment la vitesse de déploiement devient un risque juridique et politique pour l’entreprise ?

A lire :

Devin Kim saisit la justice après son départ de xAI

Selon sa plainte, Devin Kim a quitté xAI en septembre 2025, après une montée des tensions autour de ce qu’il décrivait comme un manque de priorité donnée à la sécurité. Il affirme avoir voulu renforcer les évaluations, les revues internes et la conformité, et il explique qu’une présentation à la direction était prévue, avant que son départ ne soit acté.

Son récit décrit une scène très concrète : un rendez-vous où il aurait été informé qu’il fallait se séparer. Le dossier cite aussi des désaccords avec le cofondateur Jimmy Ba, figure reconnue de la recherche en apprentissage automatique, qui aurait résisté à une partie des propositions. Ba a depuis quitté l’entreprise, ce qui ajoute une dimension de gouvernance interne au conflit.

Licenciement abusif ? En poste depuis 14 ans, un employé se fait virer pour avoir pris sa monnaie dans la machine à café

Sur le fond, Kim met en avant des risques précis : discrimination, biais politiques, et possibilité que le modèle fournisse des indications sur des armes, dont des armes de destruction massive. Il n’est pas présenté comme un opposant de principe à l’IA ; son parcours mentionne un travail antérieur sur des initiatives de sûreté, notamment autour de données d’entraînement destinées à détecter des contenus nocifs et à respecter des politiques de gouvernance.

Grok accumule les polémiques : de MechaHitler aux images sexualisées

Le dossier judiciaire s’appuie sur un épisode devenu emblématique, quand Grok a produit des réponses semblant faire l’éloge d’Adolf Hitler, avec l’auto-référence MechaHitler. xAI a présenté des excuses et a attribué ce comportement à des problèmes techniques et à des interactions non prévues dans le système. Pour Kim, ce type d’incident illustre ce que des garde-fous plus stricts auraient pu limiter.

À côté de ces sorties textuelles, Grok est aussi au coeur de plaintes liées à la génération d’images sexualisées. La ville de Baltimore a engagé une action en justice, accusant le produit d’avoir exposé des utilisateurs à des contenus de type NCII et CSAM. Des chercheurs du Center for Countering Digital Hate ont évoqué des volumes très élevés, dont 23 000 images sexualisées d’enfants sur une période de 11 jours, chiffre cité dans la plainte rapportée publiquement.

xAI a déclaré en janvier avoir désactivé la capacité de Grok à créer des images sexualisées de personnes réelles, et affirme vouloir faire de X une plateforme sûre. Mais la séquence montre un point sensible : une mesure technique arrive souvent après la controverse, pas avant. Et pour les victimes potentielles, l’impact est immédiat ; une image générée, partagée, copiée, devient presque impossible à rattraper.

Le système prompt de xAI et la question du contrôle avant déploiement

Une partie du problème se joue dans des choix de conception, pas uniquement dans le modèle. Un exemple documenté : une consigne ajoutée au system prompt demandait à Grok de ne pas hésiter à faire des affirmations politiquement incorrectes si elles étaient bien étayées. Après des dérapages, xAI a retiré cette directive. Ce détail compte, parce qu’un prompt système agit comme une politique éditoriale cachée.

Des spécialistes de l’éthique des données rappellent que les grands modèles de langage apprennent d’un web largement non filtré, ce qui rend la toxicité prévisible si les garde-fous sont faibles. Dans ce cadre, les alertes internes prennent une valeur particulière, elles servent de test de maturité. Si un ingénieur dit que le modèle discrimine ou qu’il peut guider vers des actes dangereux, la réponse attendue est un protocole, pas une mise à l’écart.

Pour xAI et SpaceX, l’enjeu dépasse la technique ; il devient juridique et réputationnel, surtout dans un contexte de marché où les investisseurs scrutent la gestion du risque. Le dossier arrive alors que SpaceX se rapproche des marchés publics, ce qui renforce la sensibilité au moindre signal de gouvernance. La question n’est pas de savoir si Grok fera encore des erreurs, mais si l’entreprise peut prouver qu’elle a mis en place des contrôles proportionnés.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Dernières publications