La Guerre Froide de l’IA avec la Chine s’intensifie
Bienvenue dans cette analyse approfondie des derniers développements dans la course à l’intelligence artificielle entre la Chine et les États-Unis. Bien que l’IA soit généralement abordée sous l’angle des avancées technologiques et de ses applications pratiques dans le monde des affaires, il existe indéniablement une dimension géopolitique qui sous-tend ce domaine en pleine expansion.
L’escalade des tensions : La Chine restreint les voyages de ses experts en IA
Ce weekend, nous avons assisté à une escalade significative dans cette bataille technologique : la Chine a commencé à bloquer les visites de ses leaders en IA aux États-Unis. Selon le Wall Street Journal, Pékin a donné instruction à ses principaux chercheurs et entrepreneurs en IA d’éviter de voyager vers les États-Unis. Cette décision serait motivée par la crainte que les scientifiques chinois puissent divulguer des informations confidentielles concernant les progrès nationaux en matière d’IA, ou même qu’un incident similaire à celui de 2019 se reproduise, lorsqu’un dirigeant de Huawei avait été détenu au Canada à la demande de Washington.
Il est important de noter qu’il ne s’agit pas d’une interdiction formelle de voyager, mais en Chine, un avertissement sévère de rester fidèle aux intérêts de l’État équivaut pratiquement à une obligation. Cette mesure suggère clairement que Pékin considère de plus en plus l’IA comme une priorité économique et de sécurité nationale, et est prêt à mettre en place des politiques en conséquence.
Les effets déjà visibles
Les effets de cette politique se font déjà sentir. Liang Wangang, fondateur de DeepSeek, était notamment absent lors du Sommet sur l’action de l’IA à Paris le mois dernier. Xia L, analyste technologique chez Eurasia Group, estime que Pékin s’inquiète de perdre ses meilleurs talents, commentant : « Pour le secteur technologique, la fuite des cerveaux peut avoir un effet dévastateur sur un pays. Le signal initial est ‘restez ici, ne partez pas’. »
De façon intéressante, Palmer Luckey, fondateur d’Anduril, a récemment plaidé lors du podcast Shawn Ryan Show pour le retour des « visas de défection » – des visas qui ne visent pas seulement à attirer des talents d’autres pays, mais qui, comme condition préalable, nuisent également aux pays d’origine en leur retirant ces compétences. Si l’on relie les points avec la politique chinoise, on peut certainement voir les prémices d’un nouveau pacte entre la classe politique et technologique.
Un rapprochement stratégique entre le gouvernement chinois et les géants technologiques
Le président Xi Jinping a organisé un symposium avec des leaders technologiques en février, incluant Jack Ma, le fondateur d’Alibaba, auparavant mis sur liste noire. Ceci est significatif car il y a quelques années, lorsque Ant Financial était sur le point de réaliser ce qui aurait probablement été la plus grande introduction en bourse de l’histoire, la Chine est intervenue, a tué l’IPO, et Jack Ma a pratiquement disparu des radars pendant les deux années suivantes, hormis quelques apparitions symboliques pour rassurer le public qu’il n’était pas mort.
Lors de cet événement en février, le président Xi a serré la main de Ma, signalant certainement une amélioration des relations. Fang Chuchang, associé fondateur du cabinet de conseil pékinois Hutong Research, a déclaré que c’était « un geste fort pour dire au marché et aux fonctionnaires locaux hésitants que ce sont nos champions et que nous devons les soutenir sans faillir face à tous les risques ». Fang a ajouté : « Avec beaucoup de ces entrepreneurs ayant des intérêts significatifs aux États-Unis, Pékin a besoin d’un front uni également pour prévenir une fuite majeure de capitaux. »
L’accélération des investissements chinois dans l’IA
Ces nouvelles surviennent alors que les investissements chinois s’intensifient dans le sillage de DeepSeek. Honor, fabricant de smartphones et ancienne division de Huawei, a annoncé un budget R&D de 10 milliards de dollars sur les 5 prochaines années. La société prévoit également d’entrer en bourse prochainement. Reuters rapporte que des entreprises d’IA comme Honor suscitent l’intérêt des gouvernements locaux d’une manière qui n’aurait pas été possible il y a encore un an.
La semaine dernière, Alibaba a annoncé son intention de consacrer 53 milliards de dollars aux centres de données d’IA au cours des 3 prochaines années. Ce serait une dépense record pour le secteur chinois de l’IA, dépassant significativement les prévisions des analystes. Tencent et Alibaba affirment désormais tous deux avoir des modèles qui surpassent le R1 de DeepSeek, tandis que DeepSeek se prépare à lancer son modèle R2 en mai.
Le cas DeepSeek : des marges impressionnantes et une efficacité remarquable
Faisons un détour rapide dans l’univers de DeepSeek. L’entreprise a également fait beaucoup parler d’elle ce weekend lorsqu’elle a revendiqué une marge bénéficiaire de 55% tout en proposant certains des services d’inférence les moins chers du secteur. Le laboratoire chinois a publié le code de son système d’inférence pour que d’autres laboratoires puissent reproduire leurs résultats.
DD Dosa de Menow Ventures a écrit : « DeepSeek vient de faire savoir au monde qu’ils génèrent 200 millions de dollars par an avec une marge bénéficiaire de plus de 500%. Revenus par jour : 562 000 $. Coûts par jour : 87 000 $. Revenus par an : environ 205 millions $. Tout cela en facturant 2,19 $ par million de tokens sur R1, environ 25 fois moins qu’OpenAI. Si cette entreprise était aux États-Unis, elle vaudrait 10 milliards de dollars. »
Il faut toutefois nuancer ces chiffres enthousiastes. DeepSeek a supposé que tous les tokens étaient facturés au prix plein de R1, sans tenir compte des diverses remises actuellement appliquées. Ils ont même admis : « Nos revenus réels sont substantiellement plus bas ». Néanmoins, ces chiffres suggèrent qu’il y a beaucoup de marge pour une IA moins coûteuse.
Ben Buchanan a écrit : « Au cas où quelqu’un se le demanderait, cela représente une amélioration de 255 fois du coût par token depuis le lancement du ChatGPT original. Oui, c’est exactement à quoi ressemble un décollage rapide. »
DeepSeek semble largement atteindre cela en optimisant l’utilisation de ses GPU. L’équipe a écrit du code pour accéder à leur cluster d’inférence à un niveau plus bas, contournant CUDA et débloquant plus d’efficacité. L’optimisation revendiquée par DeepSeek pour les puces H800 moins puissantes était même proche de l’optimisation de NVIDIA pour la puce Blackwell B200.
Le développeur Nar a écrit : « Question bête, mais comment personne n’a-t-il réalisé que nous sous-utilisions les GPU avant que DeepSeek ne nous le montre ? C’est tellement incroyable. »
C’est une question vraiment intéressante à suivre, car elle a des implications importantes pour toutes ces préoccupations selon lesquelles la capacité GPU aux États-Unis est dramatiquement surconstruite.
L’influence du modèle DeepSeek et ses implications pour l’avenir de l’IA
Le modèle DeepSeek a clairement une influence significative. Le Financial Times a écrit ce weekend sur la façon dont les entreprises se précipitent pour utiliser des processus de distillation suite aux résultats de DeepSeek.
Certains soutiennent que l’implication est que l’avenir de l’IA de pointe aux États-Unis doit être open source. Jared Dunmon, ancien directeur de l’IA au Pentagone, a écrit dans Foreign Affairs : « Clairement, les États-Unis ne peuvent plus compter uniquement sur des systèmes d’IA fermés provenant de grandes entreprises pour concurrencer la Chine, et le gouvernement américain doit faire davantage pour soutenir les modèles open source, même s’il s’efforce de limiter l’accès chinois aux technologies de puces de pointe et aux données d’entraînement. »
« Pour maintenir sa domination, les États-Unis devraient monter un programme complet pour développer et déployer les meilleurs LLM open source, tout en s’assurant que ce sont toujours les entreprises américaines qui construisent les modèles d’IA les plus capables – ceux qui résident encore probablement au sein d’entreprises privées hautement capitalisées. »
Dunmon a commenté qu’un effet secondaire malheureux de la croissance massive de DeepSeek est qu’elle pourrait donner à la Chine le pouvoir d’intégrer dans des modèles d’IA générative largement utilisés les valeurs du Parti communiste chinois. Il a suggéré que l’influence potentielle de l’IA chinoise pourrait être encore plus puissante que TikTok.
C’est bien sûr l’une des idées centrales émanant de l’administration Trump : les États-Unis doivent présenter une option viable au monde pour que l’IA chinoise ne soit pas considérée comme la référence mondiale par défaut.
Appels à la collaboration malgré les tensions
Alors que les industries de l’IA chinoise et américaine s’éloignent l’une de l’autre, certains diplomates exhortent à la collaboration sur les risques. L’ambassadeur de Chine aux États-Unis, Shi Fang, a appelé à une coopération plus étroite sur l’IA. Il a déclaré : « Alors que la nouvelle vague de révolution scientifique et technologique et de transformation industrielle se déploie, ce dont nous avons besoin n’est pas un blocus technologique, mais une ‘recherche profonde’ pour le progrès humain. »
Fang a exhorté les deux superpuissances mondiales à promouvoir conjointement la gouvernance mondiale de l’IA, avertissant que les technologies émergentes comme l’IA pourraient ouvrir la boîte de Pandore si elles ne sont pas contrôlées. Cela pourrait amener des « rhinocéros gris » – terme qui fait référence à des risques facilement prévisibles que les gens ignorent jusqu’à ce qu’ils deviennent une crise.
Les inquiétudes concernant ces « rhinocéros gris » s’intensifient également. Écrivant pour Brookings la semaine dernière, le directeur de recherche Michael O’Hanlon est allé jusqu’à suggérer que l’IA non contrôlée pourrait déclencher une guerre nucléaire. Il a affirmé : « En examinant plusieurs cas de la rivalité américano-soviétique pendant la Guerre froide, on peut voir ce qui aurait pu se passer si l’IA avait existé à cette époque et qu’on lui avait confié la tâche de décider de lancer des armes nucléaires ou de prévenir une attaque nucléaire anticipée, et qu’elle s’était trompée dans sa prise de décision. »
Il est important de noter que, concernant la fenêtre d’Overton actuelle, personne n’a jamais suggéré que l’IA devrait avoir accès aux codes nucléaires. En fait, c’est peut-être la seule chose sur laquelle tout le monde s’accorde : cela ne devrait absolument jamais arriver.
Conclusion : Une complexité croissante dans un monde en mutation rapide
Ce que nous avons ici est un mélange incroyablement complexe de questions politiques et économiques. Rappelons que la semaine dernière, nous avons évoqué comment Microsoft plaidait auprès de l’administration Trump pour réduire les contrôles à l’exportation, affirmant qu’ils ne fonctionnaient pas. Et même si cela est en jeu, d’autres comme Rand soutiennent également que DeepSeek prouve de façon concluante que les contrôles sur les puces n’ont pas réussi à ralentir suffisamment la Chine, et qu’ils doivent à tout le moins être recalibrés pour un monde centré sur l’inférence.
Tout cela signifie que plus ces modèles se rapprochent en termes de capacités, plus l’accent est mis sur la bataille de soft power que représente l’IA. La vitesse à laquelle l’IA se développe étire toutes nos capacités à travers les domaines des affaires et de la technologie – pourquoi la géopolitique serait-elle différente ?
La course à la suprématie de l’IA entre la Chine et les États-Unis continue de s’intensifier, avec des implications profondes pour l’économie mondiale, la sécurité nationale et l’avenir de la technologie. Alors que nous naviguons dans ces eaux complexes, une chose est claire : l’IA est désormais fermement ancrée au cœur des relations internationales et de la compétition géopolitique du 21e siècle.
