Lar > Notícias > Deepseek AI: Não é acessível, custa US $ 1,6 bilhão para desenvolver

Deepseek AI: Não é acessível, custa US $ 1,6 bilhão para desenvolver

Apr 07,25(9 meses atrás)
Deepseek AI: Não é acessível, custa US $ 1,6 bilhão para desenvolver

No entanto, ainda é mais barato que seus concorrentes.

O novo chatbot de Deepseek me apresentou com esta descrição intrigante:

Olá, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que pode até surpreendê -lo.

Hoje, a inteligência artificial desenvolvida pela Deepseek emergiu como um concorrente formidável no mercado, contribuindo principalmente para uma das maiores quedas de preços das ações da NVIDIA.

Teste Deepseek Imagem: Ensigame.com

O que diferencia esse modelo são seus métodos inovadores de arquitetura e treinamento. Emprega várias tecnologias de ponta:

Previsão com vários toques (MTP): Em vez de prever uma palavra de cada vez, o modelo prevê várias palavras simultaneamente analisando diferentes partes de uma frase. Essa abordagem aumenta significativamente a precisão e a eficiência do modelo.

Mistura de especialistas (MOE): Esta arquitetura utiliza várias redes neurais para processar dados de entrada. A tecnologia acelera o treinamento de IA e melhora o desempenho. Em Deepseek V3, 256 redes neurais são utilizadas, com oito sendo ativados para cada tarefa de processamento de token.

Atenção latente de várias cabeças (MLA): Esse mecanismo ajuda a se concentrar nas partes mais significativas de uma frase. O MLA extrai os principais detalhes dos fragmentos de texto repetidamente, e não apenas uma vez, reduzindo a probabilidade de perder informações importantes. Graças a isso, é mais provável que a IA capture nuances cruciais nos dados de entrada.

A proeminente startup chinesa Deepseek alegou ter criado um modelo de IA competitivo com custos mínimos, afirmando que gastaram apenas US $ 6 milhões no treinamento da poderosa rede neural Deepseek V3 e usou apenas 2048 processadores gráficos.

Deepseek v3 Imagem: Ensigame.com

No entanto, analistas da semiânica descobriram que a DeepSeek opera uma grande infraestrutura computacional, compreendendo aproximadamente 50.000 GPUs NVIDIA Hopper. Isso inclui 10.000 unidades H800, 10.000 H100s mais avançados e lotes adicionais de GPUs H20. Esses recursos são distribuídos em vários data centers e são utilizados para treinamento, pesquisa e modelagem financeira de IA.

O investimento total da empresa em servidores é de cerca de US $ 1,6 bilhão, com despesas operacionais estimadas em US $ 944 milhões.

A Deepseek é uma subsidiária do fundo de hedge chinês High-Flyer, que saiu da startup como uma divisão separada focada nas tecnologias de IA em 2023. Ao contrário da maioria das startups que alugam o poder de computação de fornecedores de nuvem, a DeepSeek possui seus próprios data centers, oferecendo controle total sobre o otimização do modelo de IA e a implementação mais rápida de inovações. A empresa permanece auto-financiada, o que afeta positivamente sua flexibilidade e velocidade de tomada de decisão.

Deepseek Imagem: Ensigame.com

Além disso, alguns pesquisadores da Deepseek ganham mais de US $ 1,3 milhão anualmente, atraindo os principais talentos das principais universidades chinesas (a empresa não contrata especialistas estrangeiros).

Mesmo considerando isso, a recente reivindicação da Deepseek de treinar seu modelo mais recente por apenas US $ 6 milhões parece irrealista. Este número refere-se apenas ao custo do uso da GPU durante o pré-treinamento e não explica despesas de pesquisa, refinamento de modelos, processamento de dados ou custos gerais de infraestrutura.

Desde a sua criação, a Deepseek investiu mais de US $ 500 milhões em desenvolvimento de IA. No entanto, diferentemente das empresas maiores sobrecarregadas pela burocracia, a estrutura compacta da Deepseek permite que ela implemente ativamente e efetivamente as inovações de IA.

Deepseek Imagem: Ensigame.com

O exemplo da Deepseek demonstra que uma empresa independente de IA independente pode competir com os líderes do setor. No entanto, os especialistas enfatizam que o sucesso da empresa se deve em grande parte a bilhões de investimentos, avanços técnicos e uma equipe forte, enquanto as reivindicações sobre um "orçamento revolucionário" para o desenvolvimento de modelos de IA são um pouco exageradas.

Ainda assim, os custos dos concorrentes permanecem significativamente maiores. Por exemplo, compare o custo do treinamento do modelo: Deepseek gastou US $ 5 milhões em R1, enquanto o ChatGPT4O custou US $ 100 milhões.

Descobrir
  • A - Z Click
    A - Z Click
    Teste a sua velocidade clicando de A a ZDesafie-se a clicar de A a Z o mais rápido possível. Compita com amigos compartilhando suas melhores pontuações.Novidades na Versão 1.3Última atualização em 30 de agosto de 2024SDK de destino do Android atualiz
  • Opino - Social App for Polls
    Opino - Social App for Polls
    Este aplicativo permite que os usuários criem, compartilhem e participem de enquetes sobre uma enorme variedade de temas—desde debates culturais populares até perguntas pessoais do dia a dia. É perfeito para obter feedback rápido, desfrutar de opiniõ
  • Poker Mania
    Poker Mania
    Mergulhe no emocionante universo do pôquer móvel com o Poker Mania, o jogo que transforma a forma como você joga e interage. Seu destaque "Chat de Voz em Tempo Real" permite que você se comunique naturalmente com outros jogadores usando sua voz, tor
  • Solitaire Circus
    Solitaire Circus
    Afasta-te da azáfama do teu dia e relaxa com o eterno jogo de cartas Solitário, disponível diretamente no teu dispositivo Android. O Solitaire Circus oferece uma experiência bonita e fácil de usar, com gráficos nítidos e animações fluidas para uma s
  • Real Chess
    Real Chess
    Chess Master HD - Experiência de Xadrez 3DUm aplicativo de xadrez deslumbrante projetado para jogadores apaixonadosMergulhe no jogo atemporal do xadrez como nunca antes, com visuais 3D de tirar o fôlego e jogabilidade suave. Nossos gráficos avançados
  • Game Space
    Game Space
    What is a Casino? How to Choose the Best One for YouA casino is a fun place to play games and try to win money. However, there are some things you should know before you head to the nearest one. These include what to expect, how to choose the best on