Le 20 janvier 2024, la start-up chinoise DeepSeek a frappé fort avec son dernier modèle d’intelligence artificielle (IA) générative DeepSeek-R1 : développée pour seulement 5,6 millions de dollars, un faible coût comparé à GPT-4 qui a nécessité 100 millions de dollars.
Malgré les restrictions américaines sur l’exportation de semi-conducteurs, DeepSeek a été créée en avril 2023 à Hangzhou, dans le bassin industriel chinois près de Shanghai, et s'est démarquée par ses capacités d’innovations. Depuis le lancement de DeepSeek-R1, les grandes entreprises de la tech accusent DeepSeek de leurs chutes en bourse. Le cours de Nvidia, fabricant américain de semi-conducteurs et première capitalisation mondiale, s’est effondré le 27 janvier et perdu 600 milliards de dollars en un jour.
L’avantage technologique et économique de DeepSeek se fonde sur l’apprentissage par “renforcement” (un modèle qui tente par lui-même des solutions) et l'utilisation de nombres codés en 8 bits, ce qui limite le nombre de calculs et les coûts d’apprentissage. De plus, DeepSeek a rendu son code open source, ce qui permet à d'autres développeurs de le modifier et de l'utiliser, une pratique semblable à celles de Meta ou Mistral, pour leurs propres modèles.
Lire aussi : Automatisation : aller encore plus loin avec l’IA générative
Une IA concurrente sur un marché convoité
DeepSeek offre des fonctionnalités similaires à celles de ses concurrents occidentaux : la réponse à des questions de culture générale ou encore la rédaction de synthèse. Elle s’appuie sur un grand modèle de langage (LLM) et peut communiquer dans plusieurs langues, mais maîtrise surtout l'anglais et le chinois.
La concurrence fait rage avec l’arrivée de DeepSeek qui intervient peu de temps après l'annonce, par le président américain Donald Trump, du lancement du projet Stargate, destiné à développer l'IA aux États-Unis, avec un financement de 500 milliards de dollars.