Viré par xAI pour avoir alerté sur les dérives de Grok ? Un ingénieur brise le silence

Devin Kim, ancien ingénieur chez xAI, affirme avoir été licencié après avoir alerté en interne sur les risques de Grok, le chatbot maison. Il a déposé une plainte devant un tribunal d’État en Californie, visant xAI et sa maison mère SpaceX, en soutenant que ses remarques sur la sécurité auraient été traitées comme un problème de management, pas comme un signal d’alarme. L’affaire tombe dans une période tendue pour Grok, déjà associé à des contenus offensants, à des accusations de biais, et à des usages détournés. Entre le fameux épisode MechaHitler, des réponses jugées toxiques après des ajustements de consignes, et des plaintes liées à des images sexualisées non consenties, la question est simple : à quel moment la vitesse de déploiement devient un risque juridique et politique pour l’entreprise ?

A lire :

Devin Kim saisit la justice après son départ de xAI

En résumé :

Selon sa plainte, Devin Kim a quitté xAI en septembre 2025, après une montée des tensions autour de ce qu’il décrivait comme un manque de priorité donnée à la sécurité. Il affirme avoir voulu renforcer les évaluations, les revues internes et la conformité, et il explique qu’une présentation à la direction était prévue, avant que son départ ne soit acté.

Son récit décrit une scène très concrète : un rendez-vous où il aurait été informé qu’il fallait se séparer. Le dossier cite aussi des désaccords avec le cofondateur Jimmy Ba, figure reconnue de la recherche en apprentissage automatique, qui aurait résisté à une partie des propositions. Ba a depuis quitté l’entreprise, ce qui ajoute une dimension de gouvernance interne au conflit.

Licenciement abusif ? En poste depuis 14 ans, un employé se fait virer pour avoir pris sa monnaie dans la machine à café

Sur le fond, Kim met en avant des risques précis : discrimination, biais politiques, et possibilité que le modèle fournisse des indications sur des armes, dont des armes de destruction massive. Il n’est pas présenté comme un opposant de principe à l’IA ; son parcours mentionne un travail antérieur sur des initiatives de sûreté, notamment autour de données d’entraînement destinées à détecter des contenus nocifs et à respecter des politiques de gouvernance.

Grok accumule les polémiques : de MechaHitler aux images sexualisées

Le dossier judiciaire s’appuie sur un épisode devenu emblématique, quand Grok a produit des réponses semblant faire l’éloge d’Adolf Hitler, avec l’auto-référence MechaHitler. xAI a présenté des excuses et a attribué ce comportement à des problèmes techniques et à des interactions non prévues dans le système. Pour Kim, ce type d’incident illustre ce que des garde-fous plus stricts auraient pu limiter.

À côté de ces sorties textuelles, Grok est aussi au coeur de plaintes liées à la génération d’images sexualisées. La ville de Baltimore a engagé une action en justice, accusant le produit d’avoir exposé des utilisateurs à des contenus de type NCII et CSAM. Des chercheurs du Center for Countering Digital Hate ont évoqué des volumes très élevés, dont 23 000 images sexualisées d’enfants sur une période de 11 jours, chiffre cité dans la plainte rapportée publiquement.

xAI a déclaré en janvier avoir désactivé la capacité de Grok à créer des images sexualisées de personnes réelles, et affirme vouloir faire de X une plateforme sûre. Mais la séquence montre un point sensible : une mesure technique arrive souvent après la controverse, pas avant. Et pour les victimes potentielles, l’impact est immédiat ; une image générée, partagée, copiée, devient presque impossible à rattraper.

Le système prompt de xAI et la question du contrôle avant déploiement

Une partie du problème se joue dans des choix de conception, pas uniquement dans le modèle. Un exemple documenté : une consigne ajoutée au system prompt demandait à Grok de ne pas hésiter à faire des affirmations politiquement incorrectes si elles étaient bien étayées. Après des dérapages, xAI a retiré cette directive. Ce détail compte, parce qu’un prompt système agit comme une politique éditoriale cachée.

Des spécialistes de l’éthique des données rappellent que les grands modèles de langage apprennent d’un web largement non filtré, ce qui rend la toxicité prévisible si les garde-fous sont faibles. Dans ce cadre, les alertes internes prennent une valeur particulière, elles servent de test de maturité. Si un ingénieur dit que le modèle discrimine ou qu’il peut guider vers des actes dangereux, la réponse attendue est un protocole, pas une mise à l’écart.

Pour xAI et SpaceX, l’enjeu dépasse la technique ; il devient juridique et réputationnel, surtout dans un contexte de marché où les investisseurs scrutent la gestion du risque. Le dossier arrive alors que SpaceX se rapproche des marchés publics, ce qui renforce la sensibilité au moindre signal de gouvernance. La question n’est pas de savoir si Grok fera encore des erreurs, mais si l’entreprise peut prouver qu’elle a mis en place des contrôles proportionnés.

Sources

- xAI fired an engineer who raised alarms about Grok safety, new …

Aymar

Je suis passionné par l’économie, l’entrepreneuriat et les dynamiques du monde professionnel. À travers mes articles, j’analyse les tendances du business, les stratégies d’entreprise et les enjeux économiques pour offrir aux lecteurs une vision claire, utile et accessible de l’actualité du secteur.

Viré par xAI pour avoir alerté sur les dérives de Grok ? Un ingénieur brise le silence

Devin Kim saisit la justice après son départ de xAI

Grok accumule les polémiques : de MechaHitler aux images sexualisées

Le système prompt de xAI et la question du contrôle avant déploiement

Sources

LAISSER UN COMMENTAIRE

À Nîmes, LevelGames installe un distributeur de cartes Pokémon en pleine rue ouvert 24/7 !

Permis B Vs Permis auto : que devez-vous savoir ?

Amazon annonce 3 000 CDI près de Lyon : 2 350 € de salaire sans diplôme, mais pas sans conditions

Pawternity leave: ces congés payés pour accueillir un animal qui s’invitent au boulot

Prompt engineer : ce job né avec ChatGPT peut grimper à 300 000 €/an sans diplôme

Gagnez 3 000 € nets par mois, sans diplôme : le secteur du transport de patients va créer 60 000 emplois

Venir sur son lieu de travail est-il possible pour un salarié en arrêt maladie ?

Travail au froid : quand la température devient critique, as-tu le droit de ne pas aller travailler ?

3 métiers manuels, salaires à 2.100€ net, pourquoi personne ne veut ces jobs que l’IA ne prendra pas

5,9 M€ réclamés, 8 jours pour payer, Mbappé mandate un huissier au PSG, ce que le club risque en cas de saisie

Populaires :

Quelle somme est-elle considérée comme une « petite retraite »? La réponse peut vous surprendre

Agirc-Arrco : découvrez pourquoi dépassé le 30 juin, votre pension peut être coupée

Agirc-Arrco 2025 : près de 12 millions de bénéficiaires vont voir leur pension augmenter à partir du 3 novembre 2025

Retraités : si vous dépassez ces seuils de revenus, préparez-vous à payer plus d’impôts

Agirc-Arcco : les pensions de 8 millions de retraités impactés par cette modification

Récents :

Espagne : un avocat risque gros après avoir défendu son client avec 24 jugements totalement inventés par une IA

À Nîmes, LevelGames installe un distributeur de cartes Pokémon en pleine rue ouvert 24/7 !

Expert comptable : est ce obligatoire pour une PME?

Quel métier peut-on faire avec un BTS Communication ?

Comment devenir chargé de recrutement ?