DeepSeek : l'IA générative chinoise qui bouscule ChatGPT d'OpenAi

  • deepseek-ia-generative-chinoise-bouscule-chatgpt-openai.jpeg

    DeepSeek-R1, le modèle d’IA à 5,6 millions de dollars, redistribue les cartes d’un marché dominé par les géants américains (DeepSeek).
  • Avec son modèle moins onéreux que ChatGPT, le modèle d’intelligence artificielle DeepSeek-R1, développé par une jeune start-up chinoise, s’attaque à la domination américaine malgré les restrictions technologiques.

    Le 20 janvier 2024, la start-up chinoise DeepSeek a frappé fort avec son dernier modèle d’intelligence artificielle (IA) générative DeepSeek-R1 : développée pour seulement 5,6 millions de dollars, un faible coût comparé à GPT-4 qui a nécessité 100 millions de dollars. 

    Malgré les restrictions américaines sur l’exportation de semi-conducteurs, DeepSeek a été créée en avril 2023 à Hangzhou, dans le bassin industriel chinois près de Shanghai, et s'est démarquée par ses capacités d’innovations. Depuis le lancement de DeepSeek-R1, les grandes entreprises de la tech accusent DeepSeek de leurs chutes en bourse. Le cours de Nvidia, fabricant américain de semi-conducteurs et première capitalisation mondiale, s’est effondré le 27 janvier et perdu 600 milliards de dollars en un jour.

    L’avantage technologique et économique de DeepSeek se fonde sur l’apprentissage par “renforcement” (un modèle qui tente par lui-même des solutions) et l'utilisation de nombres codés en 8 bits, ce qui limite le nombre de calculs et les coûts d’apprentissage. De plus, DeepSeek a rendu son code open source, ce qui permet à d'autres développeurs de le modifier et de l'utiliser, une pratique semblable à celles de Meta ou Mistral, pour leurs propres modèles.

    Lire aussi : Automatisation : aller encore plus loin avec l’IA générative

    Une IA concurrente sur un marché convoité 

    DeepSeek offre des fonctionnalités similaires à celles de ses concurrents occidentaux : la réponse à des questions de culture générale ou encore la rédaction de synthèse. Elle s’appuie sur un grand modèle de langage (LLM) et peut communiquer dans plusieurs langues, mais maîtrise surtout l'anglais et le chinois. 

    La concurrence fait rage avec l’arrivée de DeepSeek qui intervient peu de temps après l'annonce, par le président américain Donald Trump, du lancement du projet Stargate, destiné à développer l'IA aux États-Unis, avec un financement de 500 milliards de dollars. 
     

    À lire sur Archimag
    Les podcasts d'Archimag
    La mise à disposition des décisions de justice en Open Data a vu le jour grâce à la loi pour une République numérique votée en 2016. Les articles 20 et 21 prévoient la mise en open data des quatre millions de décisions de justice produites chaque année par les tribunaux français. Camille Girard-Chanudet est chercheuse en sociologie au sein du Centre d’étude des mouvements sociaux. En 2023, elle a soutenu une thèse devant l’École des hautes études en sciences sociales (EHESS) : "La justice algorithmique en chantier, sociologie du travail et des infrastructures de l’intelligence artificielle". Dans ce cadre elle a rencontré les équipes de la Cour de cassation qui procèdent à l’anonymisation des décisions de justice.

    Serda Formations Data 2023