Maison > Nouvelles > Deepseek AI: pas abordable, coûte 1,6 milliard de dollars à développer

Deepseek AI: pas abordable, coûte 1,6 milliard de dollars à développer

Apr 07,25(il y a 2 mois)
Deepseek AI: pas abordable, coûte 1,6 milliard de dollars à développer

Cependant, il est encore moins cher que ses concurrents.

Le nouveau chatbot de Deepseek s'est présenté à moi avec cette description intrigante:

Salut, j'ai été créé pour que vous puissiez demander n'importe quoi et obtenir une réponse qui pourrait même vous surprendre.

Aujourd'hui, l'intelligence artificielle développée par Deepseek est devenue un formidable concurrent sur le marché, contribuant notamment à l'une des plus grandes baisses de cours des actions de Nvidia.

Test de profondeur Image: esigame.com

Ce qui distingue ce modèle, c'est son architecture innovante et ses méthodes de formation. Il utilise plusieurs technologies de pointe:

Prédiction multi-token (MTP): Au lieu de prédire un mot à la fois, le modèle prévoit plusieurs mots simultanément en analysant différentes parties d'une phrase. Cette approche améliore considérablement la précision et l'efficacité du modèle.

Mélange d'experts (MOE): Cette architecture utilise divers réseaux de neurones pour traiter les données d'entrée. La technologie accélère la formation d'IA et améliore les performances. Dans Deepseek V3, 256 réseaux neuronaux sont utilisés, huit étant activés pour chaque tâche de traitement de jeton.

Attention latente multi-tête (MLA): ce mécanisme aide à se concentrer sur les parties les plus importantes d'une phrase. MLA extrait les détails clés des fragments de texte à plusieurs reprises plutôt qu'une seule fois, réduisant la probabilité de manquer des informations importantes. Grâce à cela, l'IA est plus susceptible de capturer des nuances cruciales dans les données d'entrée.

La startup chinoise de premier plan Deepseek a affirmé avoir créé un modèle d'IA compétitif avec des coûts minimaux, déclarant qu'ils avaient dépensé seulement 6 millions de dollars pour la formation du puissant réseau de neurones Deepseek V3 et utilisé seulement 2048 processeurs graphiques.

Deepseek v3 Image: esigame.com

Cependant, les analystes de semi-analyse ont découvert que Deepseek exploite une grande infrastructure de calcul comprenant environ 50 000 GPU NVIDIA Hopper. Cela comprend 10 000 unités H800, 10 000 H100 plus avancés et des lots supplémentaires de GPU H20. Ces ressources sont distribuées dans plusieurs centres de données et sont utilisées pour la formation, la recherche et la modélisation financière de l'IA.

L'investissement total de la société dans les serveurs s'élève à environ 1,6 milliard de dollars, avec des dépenses opérationnelles estimées à 944 millions de dollars.

Deepseek est une filiale du High-Flyer de fonds spéculatifs chinois, qui a décroché la startup en tant que division distincte axée sur les technologies de l'IA en 2023. Contrairement à la plupart des startups qui louent le pouvoir de calcul des fournisseurs de cloud, Deepseek possède ses propres centres de données, ce qui lui donne un contrôle total sur l'optimisation du modèle AI et l'activation plus rapidement des innovations. La société reste autofinancée, ce qui a un impact positif sur sa flexibilité et sa vitesse de prise de décision.

En profondeur Image: esigame.com

De plus, certains chercheurs de Deepseek gagnent plus de 1,3 million de dollars par an, attirant les meilleurs talents des principales universités chinoises (la société n'embauche pas de spécialistes étrangers).

Même en considérant cela, la récente allégation de Deepseek de formation de son dernier modèle pour seulement 6 millions de dollars semble irréaliste. Ce chiffre se réfère uniquement au coût de l'utilisation du GPU pendant la pré-formation et ne tient pas compte des dépenses de recherche, du raffinement du modèle, du traitement des données ou des coûts d'infrastructure globale.

Depuis sa création, Deepseek a investi plus de 500 millions de dollars dans le développement de l'IA. Cependant, contrairement aux grandes entreprises chargées par la bureaucratie, la structure compacte de Deepseek lui permet de mettre en œuvre activement et efficacement les innovations d'IA.

En profondeur Image: esigame.com

L'exemple de Deepseek démontre qu'une entreprise d'IA indépendante bien financée peut rivaliser avec les leaders de l'industrie. Néanmoins, les experts soulignent que le succès de l'entreprise est en grande partie dû à des milliards d'investissements, à des percées techniques et à une équipe solide, tandis que les affirmations sur un "budget révolutionnaire" pour le développement de modèles d'IA sont quelque peu exagérés.

Pourtant, les coûts des concurrents restent considérablement plus élevés. Par exemple, comparez le coût de la formation des modèles: Deepseek a dépensé 5 millions de dollars sur R1, tandis que le chatppt4o a coûté 100 millions de dollars.

Découvrir
  • Infinite Cultivation
    Infinite Cultivation
    Entrez dans le monde enchanteur de la culture infinie, un jeu inactif social qui donne vie à la riche tapisserie de la littérature fantastique orientale (Wuxia / Xianxia). Ce jeu n'est pas seulement une autre boue (donjon multi-utilisateur) ou un simple MMORPG; C'est un retour au cœur de ce qui rend ces genres si captivat
  • Wordscapes In Bloom
    Wordscapes In Bloom
    Plongez dans le tout nouveau jeu de mots qui passe le cerveau que vous vous retrouverez à jouer pendant des heures: ** Wordscapes in Bloom **! Ce jeu n'est pas seulement amusant; C'est une séance d'entraînement mental dans un jardin botanique serein rempli de superbes arrière-plans de puzzle. Il est conçu pour tester votre instant, aidant Y
  • Word Connect - Puzzle de jeux
    Word Connect - Puzzle de jeux
    Plongez dans les jeux de mots les plus populaires du monde avec le Ultimate Word Connect Challenge! Découvrez le frisson de l'application Hit Word Connect # 1, connue comme le jeu de mots le plus addictif jamais créé! Téléchargez gratuitement le dernier jeu de puzzle de mots et immergez-vous dans un design d'aventure de puzzle passionnant
  • Jardin des Mots:Jeu de lettres
    Jardin des Mots:Jeu de lettres
    Garden of Words est un jeu de puzzle de mots passionnant qui non seulement défie votre vocabulaire, mais stimule également votre cerveau. Avec une vaste collection de plus d'une centaine de mots croisés et l'ajout de nouveaux niveaux régulièrement, ce jeu promet un divertissement sans fin. L'objectif principal du jardin de
  • Pro des Mots
    Pro des Mots
    Êtes-vous prêt à défier votre logique et à étendre votre lexique? Ne cherchez pas plus loin - téléchargez "Word Pro" pour une expérience revigorante et libre-taquine cérébrale! Le gameplay est simple mais captivant: faites simplement glisser les blocs de lettres pour construire des mots et accumuler des pièces. Commencez votre voyage cérébral n
  • كلمة السر الذكية بريك
    كلمة السر الذكية بريك
    Smart Password Break Game est une nouvelle version passionnante du jeu de mot de passe classique, réputé pour ses défis d'intelligence et de résolution de puzzle. Cette édition mise à jour 2022-2023 promet des heures de plaisir et de divertissement tout en améliorant vos compétences d'intuition et d'observation.