Casa > Notizia > DeepSeek AI: non conveniente, costa $ 1,6 miliardi per lo sviluppo

DeepSeek AI: non conveniente, costa $ 1,6 miliardi per lo sviluppo

Apr 07,25(21 ore fa)
DeepSeek AI: non conveniente, costa $ 1,6 miliardi per lo sviluppo

Tuttavia, è ancora più economico dei suoi concorrenti.

Il nuovo chatbot di DeepSeek si è presentato a me con questa descrizione intrigante:

Ciao, sono stato creato in modo da poter chiedere qualsiasi cosa e ottenere una risposta che potrebbe persino sorprenderti.

Oggi, l'intelligenza artificiale sviluppata da DeepSeek è emersa come un formidabile concorrente sul mercato, contribuendo in particolare a uno dei maggiori calo dei prezzi delle azioni di Nvidia.

Test di DeepSeek Immagine: Ensigame.com

Ciò che distingue questo modello è la sua architettura innovativa e metodi di formazione. Impiega diverse tecnologie all'avanguardia:

Previsione multi-token (MTP): invece di prevedere una parola alla volta, il modello prevede simultaneamente più parole analizzando diverse parti di una frase. Questo approccio migliora significativamente sia l'accuratezza che l'efficienza del modello.

Miscela di esperti (MOE): questa architettura utilizza varie reti neurali per elaborare i dati di input. La tecnologia accelera la formazione dell'intelligenza artificiale e migliora le prestazioni. In DeepSeek V3, vengono utilizzate 256 reti neurali, con otto attivate per ciascuna attività di elaborazione dei token.

Attenzione latente multi-testa (MLA): questo meccanismo aiuta a concentrarsi sulle parti più significative di una frase. MLA estrae i dettagli chiave dai frammenti di testo ripetutamente anziché solo una volta, riducendo la probabilità di perdere informazioni importanti. Grazie a questo, l'IA ha maggiori probabilità di acquisire sfumature cruciali nei dati di input.

L'importante startup cinese Deepseek ha affermato di aver creato un modello di intelligenza artificiale competitivo con costi minimi, affermando che hanno speso solo $ 6 milioni per formare la potente rete neurale Deepseek V3 e hanno utilizzato solo 2048 processori grafici.

DeepSeek V3 Immagine: Ensigame.com

Tuttavia, gli analisti della seminalisi hanno scoperto che DeepSeek gestisce una grande infrastruttura computazionale che comprende circa 50.000 GPU di nvidia Hopper. Ciò include 10.000 unità H800, 10.000 H100 più avanzati e batch aggiuntivi di GPU H20. Queste risorse sono distribuite su diversi data center e sono utilizzate per la formazione, la ricerca e la modellazione finanziaria dell'IA.

L'investimento totale della società nei server ammonta a circa $ 1,6 miliardi, con spese operative stimate in $ 944 milioni.

DeepSeek è una consociata dell'Hedge Fund cinese High-Flyer, che ha lasciato la startup come una divisione separata focalizzata sulle tecnologie di intelligenza artificiale nel 2023. A differenza della maggior parte delle startup che affittano il potere di calcolo dai fornitori di cloud, Deepseek possiede i propri data center, dando il pieno controllo sull'ottimizzazione dei modelli di intelligenza artificiale e che emettono l'implementazione più secca delle innovazioni. L'azienda rimane autofinanziata, il che influisce positivamente sulla sua flessibilità e velocità decisionale.

Deep -Week Immagine: Ensigame.com

Inoltre, alcuni ricercatori di DeepSeek guadagnano oltre $ 1,3 milioni all'anno, attirando i migliori talenti dalle principali università cinesi (la società non assume specialisti stranieri).

Anche considerando questo, la recente affermazione di Deepseek di addestrare il suo ultimo modello per soli $ 6 milioni sembra irrealistica. Questa cifra si riferisce solo al costo dell'utilizzo della GPU durante il pre-allenamento e non tiene conto delle spese di ricerca, del perfezionamento del modello, dell'elaborazione dei dati o dei costi complessivi di infrastruttura.

Fin dalla sua istituzione, DeepSeek ha investito oltre $ 500 milioni nello sviluppo dell'IA. Tuttavia, a differenza delle più grandi aziende gravate dalla burocrazia, la struttura compatta di Deepseek gli consente di implementare attivamente ed efficacemente le innovazioni di intelligenza artificiale.

Deep -Week Immagine: Ensigame.com

L'esempio di DeepSeek dimostra che una società di intelligenza artificiale indipendente ben finanziata può competere con i leader del settore. Tuttavia, gli esperti sottolineano che il successo dell'azienda è in gran parte dovuto a miliardi di investimenti, scoperte tecniche e un team forte, mentre le affermazioni su un "budget rivoluzionario" per lo sviluppo di modelli di intelligenza artificiale sono in qualche modo esagerate.

Tuttavia, i costi dei concorrenti rimangono significativamente più alti. Ad esempio, confronta il costo della formazione del modello: DeepSeek ha speso $ 5 milioni su R1, mentre CHATGPT4O costa $ 100 milioni.

Scoprire
  • Mercedes-Benz (USA/CA)
    Mercedes-Benz (USA/CA)
    Sperimenta una connettività senza pari con il tuo veicolo Mercedes-Benz attraverso l'app Mercedes-Benz (USA/CA), su misura per i proprietari dell'anno modello 2019 o di veicoli più recenti. Questa app consente di monitorare dettagli essenziali come chilometraggio, livelli di carburante e persino individuare la posizione del veicolo su una mappa,
  • Textgram -Text on Photo,Story
    Textgram -Text on Photo,Story
    Con TextGram - Testo su foto, storia, puoi trasformare i tuoi messaggi in visioni accattivanti aggiungendo testo alle tue foto, creando disegni unici e condividendo la tua creatività con amici e follower. Sia che tu stia mirando a creare un post accattivante sui social media, progetta una mosca professionale
  • Nova tv movies and tv shows
    Nova tv movies and tv shows
    Sei stanco di scorrere all'infinito attraverso vari servizi di streaming per trovare il film o il programma televisivo perfetto? Non cercare oltre l'app Nova TV Films and TV Show! Questa app per film gratuita e illimitata ti offre l'accesso a una vasta gamma di contenuti, dai classici senza tempo alle ultime serie TV. Con t
  • PolishHearts Tindo version
    PolishHearts Tindo version
    Stai cercando di connettersi con i polacchi all'estero? Non guardare oltre l'app più popolare del mondo per incontrare altri polacchi: la versione Tindo polacco! Che tu stia cercando una relazione, un'amicizia o una data casuale, questa app ti ha coperto. Con una pletora di partite disponibili ogni
  • Мой Beeline (Казахстан)
    Мой Beeline (Казахстан)
    Gestisci e controlla senza sforzo i tuoi servizi Beeline con l'app мой Beeline (казхх). Questo potente strumento consente di cambiare tariffe, monitorare le spese, trasferire fondi e effettuare pagamenti direttamente dal saldo con facilità. Con opzioni di accesso sicure e rapide, rimanere connessi è solo un
  • My Movies 3 - Movie & TV List
    My Movies 3 - Movie & TV List
    Organizzare la tua collezione di serie di film e TV non è mai stata più semplificata rispetto all'app My Movies 3 - Film & TV List. Offri addio all'inserimento di dati manuali noiosi e abbraccia l'efficienza della scansione batch, che consente di indicizzare rapidamente l'intera collezione. Con un vasto cont di database