Le « moment Spoutnik » de DeepSeek ou l’arsenalisation du langage pour justifier la surenchère guerrière

La publicisation du modèle de langage chinois DeepSeek, équivalent fonctionnel de ses concurrents états-uniens tels que ChatGPT, a suscité une panique médiatique. Une partie de la presse généraliste a repris la qualification de « moment Spoutnik » pour illustrer la singularité de la séquence, mettant sur un même plan l’humiliation que constitua pour les États-Unis la mise en orbite du premier satellite soviétique en 1957 avec l’entrée en scène d’une nouvelle intelligence artificielle chinoise sur le marché. Cette escalade verbale sous forme de remémoration traumatique s’inscrit dans une longue tradition d’utilisation du langage pour renforcer la logique militaire en exacerbant la peur, dans le but de justifier des actions agressives sous couvert d’urgence technologique et géopolitique. Je donne ici une perspective historique à ce momentum technologique, dans le but de mesurer l’implication d’une telle analogie, et aussi les débats que cette mise en scène vient masquer, à commencer  les conditions de production de l’IA.

DeepSeek, « moment Spoutnik » ?

La publicisation début janvier du modèle de langage chinois DeepSeek R1 a déclenché ce qui semble s’apparenter à un vent de panique médiatique. La chronique des événements est désormais bien documentée : le modèle de langage aurait été entraîné avec 2 000 puces Nvidia seulement, pour un montant total avoisinant les 6 millions de dollars, soit beaucoup moins que ses équivalents états-uniens (500 millions pour ChatGPT/OpenAI). Ce montant relativement faible bouleverse la stratégie étatsunienne privilégiant l’inflation démesurée de la puissance de calcul incarnée dans le projet « Stargate » annoncé par Donald Trump dans les jours qui ont précédé. 

Stargate est un investissement massif, 500 milliards de dollars étalés sur quatre ans, dans le domaine de l’intelligence artificielle. Des fonds privés sont mobilisés à travers une série d’acteurs techniques ou financiers tels que Microsoft, NVIDIA, OpenAI, SoftBank, Oracle et le fond émirati MGX. Après un tel effort, l’annonce de DeepSeek fait office de douche froide : la capitalisation boursière de la société NVIDIA, pourvoyeuse de puces électroniques dans le domaine de l’IA, a dévissé de 590 milliards d’euros. Le modèle chinois rebattrait les cartes de la course à l’intelligence artificielle.

S’ensuit un traitement médiatique dramatisant le moment. Sur « X », Marc Andressen, capital-risqueurs emblématique de la Silicon Valley, fondateur de A16 et surtout connu pour ses positions ouvertement libertariennes et tendanciellement fascistes, écrit que « DeepSeek R1 est un moment Spoutnik », en référence au premier satellite lancé par l’Union Soviétique en 1957. Bien que la paternité de la formule reviendrait à Azeem Azhar (Stanford University) dans un billet publié le 31 décembre 2024, c’est bien son emploi par Andressen un mois plus tard qui est repris à l’envi par une presse qui sensationnalise la période. 

Garder la tête froide

Certains analystes avaient vu le coup venir, et tempèrent l’effet de surprise. Le coût de l’entraînement est trompeur, explique à Forbes Richard Socher, CEO de You.com (un outil de recherche impliquant l’IA). Ces 6 millions de dollars représentent le coût très marginal d’un seul entraînement – ce que la documentation technique de DeepSeek précise –, or la construction d’un modèle peut en demander plusieurs milliers. DeepSeek est lui-même bâti sur d’autres modèles open source ou présentés comme tels, à l’instar de Llama de la société Meta. 

D’autres PDG d’entreprises technologiques dans le domaine de l’IA abondent, comme May Habib (Writer) ou Itamar Friedman (Quodo.ai) : non seulement l’annonce ne les étonne pas, mais il leur apparaît évident que les montants évoqués ne représentent pas l’intégralité du coût du modèle. Par ailleurs, le prochain modèle o3 d’OpenAI affiche de bons scores, tandis que le nouveau modèle de raisonnement libre de Google DeepMind domine encore les classements. Les États-Unis n’ont donc pas entièrement perdu la course.

Pour Sfstandard, Garrison Lovely explique que DeepSeek est certes impressionnant mais n’est pas un « moment Spoutnik ». La formule qui a suscité une fièvre médiatique, sert avant tout les intérêts du vaste portefeuille d’Andreessen et son agenda économique : « Son fonds de capital-risque de 52 milliards de dollars, Andreessen Horowitz (a16z), investit aussi bien dans des startups de technologie de défense comme Anduril que dans des géants de l’IA comme OpenAI et Meta (dont Andreessen est membre du conseil d’administration). »

Le spectre d’une domination chinoise, attisée par l’écho de Spoutnik, pourrait dès lors déclencher un flot de contrats gouvernementaux, de subventions et de dérégulation, au bénéfice de l’industrie de l’IA. Les initiatives en faveur de son encadrement, largement critiquées par Andressen, en pâtissent déjà : Trump n’a pas attendu DeepSeek pour abroger le décret de Biden sur la sécurisation des systèmes d’intelligence artificielle qui, selon lui, entraverait son potentiel économique.

Comprendre le « moment Spoutnik » et la rhétorique des « fossés technologiques »

L’analogie entre Spoutnik et DeepSeek mérite d’être analysée avec une certaine profondeur historique. Notons d’abord que si la célèbre sphère d’aluminium de 60 cm de diamètre a produit une déflagration objective conduisant entre autres choses, à la création de l’ARPA et de la NASA, il s’agit aussi d’une construction médiatique conduite dans un contexte politique où les réactions ont largement divergé. Les sondages d’opinion menés quelques jours après le lancement du satellite montrent que la majorité des états-uniens ne sont pas particulièrement inquiets, bien qu’étonnés d’un tel lancement. Le sentiment qui domine est l’indifférence. Autre élément de contexte : en 1957, des sondages montrent que l’image des États-Unis se dégrade au sein de sa sphère d’influence. En 1960, 59 % des Britanniques et 37 % des Français croient en la supériorité soviétique (1). Quand bien même ce retard est tout à fait relatif, j’y reviendrai, sa perception est réelle et compte d’un point de vue purement symbolique. 

À ce moment-là de l’histoire, l’usage de formules suscitant la surenchère guerrière en brandissant le retard relatif des États-Unis ne s’arrête pas à Spoutnik. Elles sont légions dès le début des 1950, réveillant des frayeurs liées à l’idée d’« attaque surprise » qui traverse la pensée stratégique américaine, surtout depuis Pearl Harbor. En 1954, des rumeurs font ainsi état d’écarts (« gaps », ou fossés) dans le nombre de bombardiers portant des ogives nucléaires (le « Bomber gap »), puis pendant la campagne présidentielle, J.F Kennedy axe une partie de sa campagne sur le prétendu retard des États-Unis en matière de missiles (le « Missile gap »). Ses rivaux, Eisenhower et Nixon, vice-Président et candidat, ne peuvent toutefois pas le contredire sans révéler l’existence de missions secrètes réalisées par les avions de reconnaissance U-2 au-dessus du territoire soviétique : le « missile gap » est une fiction politique, mais vient toutefois alimenter la surenchère guerrière et consolider le complexe militaro-industriel. Le refroidissement des passions n’interviendra qu’une fois la dissuasion mutuelle stabilisée à travers une surveillance mutuelle des capacités adverses via les satellites de reconnaissance et divers traités de désarmement. 

La théâtralisation catastrophiste des capacités du camp adverse a atteint des sommets d’absurdité. En 1970, le « Psi gap » vient cristalliser de nouvelles inquiétudes. La formule  fait son apparition dans le livre Psychic Discoveries behind the Iron Curtain de Sheila Ostrander et Lynn Schroeder, qui affirment que les agences de renseignement soviétiques conduisent des recherches en vue de trouver les talents psychiques pour déstabiliser l’Ouest, et qu’une vingtaine de centres destinés à étudier les phénomènes paranormaux sont déjà en place et financés depuis 1967. Ils urgent les États-Unis de s’engouffrer dans la brèche. En 1972, la Defense Intelligence Agency (DIA) commande ainsi un rapport qui établit la liste des risques qu’un tel programme soviétique fait peser sur l’Amérique, de la localisation des mouvements de troupes à l’assassinat ciblé de leaders et la désactivation à distance d’équipements militaires de tous types, y compris dans l’espace. 

La même année, l’Office of Strategic Intelligence (OSI) et le Stanford Research Institute (SRI) amorcent un programme pilote financé par la CIA, conduisant des expériences fictives et en situations réelles avec des Remote viewers, sortes de médiums en capacité de percevoir et de décrire des cibles distantes et l’intérieur de certains bâtiments ennemis. Les Remote viewers sont mis à profit pour localiser des satellites et même la station MIR lancée en 1986, ainsi que les missiles Scud irakiens pendant l’opération Tempête du désert. Le programme, renommé Stargate en 1990 (ça ne s’invente pas), s’arrête en 1995, car « incapable de fournir des informations tactiques utiles en temps réel pour les soldats activement engagés dans un combat ». Dit autrement, la culture du secret pousse à prendre part à des projets tout à fait saugrenus. 

Du « missile gap » au « compute gap »

Ces multiples évocations de « gaps » sont loin d’être anecdotiques. Historiquement, elles sont vécues comme des manquements au devoir national et servent d’argument d’autorité à une partie des élites états-uniennes (les plus va-t-en guerre, pour le dire plus franchement). Ces références ont été déclinées dans l’industrie numérique. En novembre 2024, avant même la publicisation de DeepSeek dans la presse généraliste, Chris Lehane, « Chief Global Affairs Officer » chez OpenAI, s’exprime lors d’un événement organisé par le CSIS (Center for Strategic and International Studies) et qualifie de « compute gap » l’écart entre les capacités de calcul des États-Unis et de la Chine. Il appelle au passage, à orienter 175 milliards de dollars vers les infrastructures d’IA aux États-Unis. Attiser la peur de la Chine, substitut fonctionnel à l’URSS, fournit la justification ultime pour avancer à toute vitesse, à grands coups de contrats gouvernementaux. 

Par-delà l’opposition géopolitique entre blocs, le moment DeepSeek vient illustrer une série de problèmes avant tout internes à l’économie numérique états-unienne. D’abord, la grande volatilité des valeurs boursières, comme l’ont répété depuis un moment plusieurs analystes et chercheurs tels que Timnit Gebru, et de nombreux autres ayant alerté sur la possibilité prochaine d’une « bulle » dans le domaine de l’intelligence artificielle. DeepSeek signale également la relative inefficacité de la stratégie de « containment » de la Chine par les États-Unis dans le domaine technologique, qui a paradoxalement permis au pays de s’assurer une certaine indépendance en la matière,  quand bien même celle-ci fait débat puisque les puces utilisées auraient été obtenues avant les restrictions des contrôles à l’importation.

Parler de « moment Spoutnik » n’est par ailleurs ni conforme à ce que Spoutnik a réellement été (un exploit certes, mais rapidement égalé par les États-Unis, alors que les deux pays travaillaient en silo sans aucune collaboration), ni à ce que DeepSeek permet réellement : une potentielle appropriation des systèmes d’intelligence artificielle par une quantité importante de nouveaux acteurs. Dans un article publié sur Quark Daily, Malcolm Murray, expert en gestion des risques de l’intelligence artificielle, avance que DeepSeek est moins un « moment Spoutnik » qu’un « moment Ford T », c’est-à-dire une inflexion vers l’industrialisation de l’IA : « Le fait qu’une petite entreprise débutante, utilisant une génération plus ancienne de puces, puisse répliquer des performances de pointe en seulement quelques mois suggère que nous allons assister à une période de prolifération de modèles très capables dans les prochaines années ». Les pays du Sud Global, comme l’Inde par exemple, pourraient y trouver leur compte en bâtissant des modèles performants sans recourir à des investissements massifs tels que ceux enclenchés par les États-Unis.

« Hype the technology, hide the workers »

Toutefois, préjuger de l’expansion des modèles sur la seule base de capacités techniques n’épuise pas ce que ce débat autour du « moment Spoutnik » masque : les modèles d’IA n’émanent pas du néant et les puces électroniques ne suffisent pas à les rendre performants. DeepSeek ne s’est pas fait avec « des bouts de ficelles ».

Comme le montrent les chercheurs Antonio Casilli, Thomas le Bonniec et Julian Posada dans un document publié le 05 février 2025 sur le site du DipLab « Hype the technology, hide the workers », le coût de DeepSeek est très probablement sous-estimé, non pas seulement en raison du débat encore en cours sur l’origine et le nombre de puces électroniques, mais à cause de la non prise en compte de la présence d’annotateurs qui contribuent à entraîner le modèle. Le débat est donc mal orienté et Spoutnik n’aide pas à y voir plus clair. De manière caractéristique, les « Tech bros » états-uniens prennent trop au sérieux les informations livrées par le concurrent chinois, et n’abordent jamais la question des annotateurs. Sam Altman par exemple, pointe du doigt la possible fraude de DeepSeek qui aurait entraîné son modèle en reproduisant le comportement d’un modèle plus grand (on parle de « distillation »), et use ainsi d’un « vieux cliché xénophobe selon lequel l’innovation asiatique ne serait que de l’ingéniosité occidentale », mais reste muet quant au travail caché qui permet d’atteindre de telles performances.

Les capacités de DeepSeek, rappellent les chercheurs, sont largement issues d’une force de travail massive  et sous-payée : les modèles ne s’entraînent pas tout seul. Des annotateurs – DeepSeek prétend n’être dotée que d’une équipe de 32 personnes – transcrivent les textes, labellisent les images, classifient des vidéos, etc. Ils seraient entre 154 et 435 millions dans le Sud global, soit « entre 4,4 % et 12,5 % de la main-d’œuvre mondiale, englobant à la fois les freelances et les travailleurs des données ». Si l’équipe du DipLab a déjà largement documenté leur rôle dans la production de divers systèmes d’intelligence artificielle dans des pays comme le Brésil ou Madagascar (et pas seulement des modèles de langage, voir notamment, l’intervention de Maxime Cornet et Clément Le Ludec à NEC 2024), le terrain chinois reste largement fermé aux chercheurs. En 2018, une enquête du New York Times montrait toutefois que l’ambition chinoise en matière d’IA était largement basée du travail précaire : les entreprises chinoises du secteur mobilisent des travailleurs issus de régions pauvres et densément peuplées qui viennent remplir des « usines de données » dans des zones reculées, avec le soutien des gouvernements locaux. 

Ce modèle est érigé en politique publique, expliquent Casilli, Le Bonniec et Posada : « L’annotation de données bénéficie désormais du soutien officiel du gouvernement chinois, ce qui fait baisser le coût du travail des données — un avantage qui a probablement joué un rôle dans l’ascension rapide de DeepSeek. » Du côté de DeepSeek, le recours à cette main d’œuvre n’est que partiellement assumé : « Le discours de la startup oscille entre la trivialisation et l’élévation de ce travail de données. DeepSeek minimise l’annotation comme étant banale tout en la présentant simultanément comme une activité savante. Il semble même que le fondateur, Liang Wenfeng, participe occasionnellement à l’étiquetage des données. »

***

Les analogies entre les industries astronautiques et numériques ont leurs limites. D’une certaine manière, leur emploi contribue à instrumentaliser l’histoire et à servir des agendas politiques offensifs parfaitement identifiés : de la « course à l’espace » à la « course à l’IA », il est tentant de tirer des fils qui ne mènent qu’à actualiser une rhétorique vengeresse ne résumant qu’à gros traits la structuration sociales du développement technologique. 

Ceux qui emploient ces formules opèrent par réductionnisme, ne voyant l’impérialisme que dans une confrontation entre nations et jamais dans ce qui constitue son fondement social, dans la division internationale, et nationale, du travail. De la même manière, tirer de ce moment la conclusion que l’Europe devrait se lancer dans cette course elle aussi, comme l’ont affirmé certains, passe outre les conditions de production de l’intelligence artificielle et l’autre rôle diplomatique qu’il conviendrait de donner au Vieux Continent : assurer l’utilisation sûre et responsable de cette technologie à travers des actions concrètes; la reconnaissance du travail de la donnée; le renforcement de la régulation sur la captation des données; une meilleure mesure de l’impact de l’IA sur les droits fondamentaux tout au long du cycle de vie de l’IA. Si la course à l’IA est basée sur l’exploitation de travailleurs précaires, alors l’Europe n’a pas besoin de cette IA là, d’autres numériques sont possibles. Fût-elle imparfaite, ce dont nous avons besoin est de transparence, cette même transparence qui a permis aux deux blocs de ne pas s’affronter sur le terrain nucléaire pendant la Guerre Froide.

(1) Voir Walter A. McDougall, The Heavens and the Earth, op. cit., p. 240- 241.

S’abonner
Notifier de
guest
3 Commentaires
Inline Feedbacks
View all comments
Gagnaire Georges
Gagnaire Georges
1 jour il y a

Comme toujours, merci pour vos articles précis et éclairants.
J’ai néanmoins une question : avez-vous des chiffres concernant le nombre de personnes travaillant actuellement au niveau mondial sur l’annotation des données pour les « IA » ? ou plus généralement au service d’applications numériques ?
Merciiiiii

Georges
Georges
17 heures il y a

Merci pour votre réponse.
Oui pour IA = modèles de langage… enfin je crois ! Je ne suis pas le plus geek de la bande !
Je suis en fait en recherche d’ordre de grandeur du nombre de personnes dont le travail est invisibilisé, exploité par nos pratiques numériques… Le fait postcolonial mis en lumière par Maxime Cornet et Clément Le Ludec dans la vidéo dont vous donnez le lien est éloquente de ce point de vue là !
Ce sont des données très difficiles à trouver qui gagneraient à être collectées et mises en valeur.