Bahay > Balita > Deepseek AI: Hindi abot -kayang, nagkakahalaga ng $ 1.6 bilyon upang mabuo

Deepseek AI: Hindi abot -kayang, nagkakahalaga ng $ 1.6 bilyon upang mabuo

Apr 07,25(21 oras ang nakalipas)
Deepseek AI: Hindi abot -kayang, nagkakahalaga ng $ 1.6 bilyon upang mabuo

Gayunpaman, mas mura pa ito kaysa sa mga katunggali nito.

Ang bagong chatbot mula sa Deepseek ay nagpakilala sa akin sa nakakaintriga na paglalarawan:

Kumusta, nilikha ako upang maaari kang magtanong ng anuman at makakuha ng isang sagot na maaaring sorpresa ka.

Ngayon, ang artipisyal na katalinuhan na binuo ng Deepseek ay lumitaw bilang isang kakila -kilabot na katunggali sa merkado, lalo na na nag -aambag sa isa sa pinakamalaking pagbagsak ng presyo ng stock ng NVIDIA.

Pagsubok sa Deepseek Larawan: ensigame.com

Ang nagtatakda ng modelong ito ay ang makabagong mga pamamaraan ng arkitektura at pagsasanay. Gumagamit ito ng maraming mga teknolohiyang paggupit:

Multi-Token Prediction (MTP): Sa halip na hulaan ang isang salita nang sabay-sabay, ang mga modelo ng pagtataya ng maraming mga salita nang sabay-sabay sa pamamagitan ng pagsusuri ng iba't ibang mga bahagi ng isang pangungusap. Ang pamamaraang ito ay makabuluhang nagpapabuti sa parehong kawastuhan at kahusayan ng modelo.

Paghahalo ng mga eksperto (MOE): Ang arkitektura na ito ay gumagamit ng iba't ibang mga neural network upang maproseso ang data ng pag -input. Ang teknolohiya ay nagpapabilis sa pagsasanay sa AI at nagpapabuti sa pagganap. Sa Deepseek V3, 256 Neural Networks ay ginagamit, na may walong naaktibo para sa bawat gawain sa pagproseso ng token.

Multi-head latent pansin (MLA): Ang mekanismong ito ay tumutulong na tumuon sa pinakamahalagang bahagi ng isang pangungusap. Ang MLA ay kumukuha ng mga pangunahing detalye mula sa mga fragment ng teksto nang paulit -ulit sa halip na isang beses lamang, binabawasan ang posibilidad ng nawawalang mahalagang impormasyon. Salamat sa ito, ang AI ay mas malamang na makuha ang mga mahahalagang nuances sa data ng pag -input.

Ang kilalang Startup ng Tsino na Deepseek ay nagsabing lumikha ng isang mapagkumpitensyang modelo ng AI na may kaunting gastos, na nagsasabi na ginugol lamang nila ang $ 6 milyon sa pagsasanay sa malakas na neural network na Deepseek V3 at ginamit lamang ang 2048 na mga graphic processors.

Deepseek v3 Larawan: ensigame.com

Gayunpaman, natuklasan ng mga analyst mula sa semianalysis na ang Deepseek ay nagpapatakbo ng isang malaking imprastraktura ng computational na binubuo ng humigit -kumulang 50,000 NVIDIA HOPPER GPU. Kasama dito ang 10,000 H800 unit, 10,000 mas advanced H100s, at karagdagang mga batch ng H20 GPU. Ang mga mapagkukunang ito ay ipinamamahagi sa maraming mga sentro ng data at ginagamit para sa pagsasanay sa AI, pananaliksik, at pagmomolde sa pananalapi.

Ang kabuuang pamumuhunan ng kumpanya sa mga server ay nagkakahalaga ng halos $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na tinatayang $ 944 milyon.

Ang Deepseek ay isang subsidiary ng Chinese Hedge Fund High-flyer, na nag-iwas sa pagsisimula bilang isang hiwalay na dibisyon na nakatuon sa mga teknolohiya ng AI noong 2023. Hindi tulad ng karamihan sa mga startup na nagrenta ng kapangyarihan ng computing mula sa mga tagapagbigay ng ulap, ang Deepseek ay nagmamay-ari ng sariling mga sentro ng data, na binibigyan ito ng ganap na kontrol sa pag-optimize ng modelo ng AI at pagpapagana ng mas malaking pagpapatupad ng mga makabagong ideya. Ang kumpanya ay nananatiling pondo sa sarili, na positibong nakakaapekto sa kakayahang umangkop at bilis ng paggawa ng desisyon.

Deepseek Larawan: ensigame.com

Bukod dito, ang ilang mga mananaliksik sa Deepseek ay kumita ng higit sa $ 1.3 milyon taun -taon, na umaakit sa nangungunang talento mula sa nangungunang unibersidad ng Tsino (ang kumpanya ay hindi umarkila ng mga dayuhang espesyalista).

Kahit na isinasaalang -alang ito, ang kamakailang pag -angkin ng Deepseek sa pagsasanay sa pinakabagong modelo nito para sa $ 6 milyon lamang ay tila hindi makatotohanang. Ang figure na ito ay tumutukoy lamang sa gastos ng paggamit ng GPU sa panahon ng pre-pagsasanay at hindi account para sa mga gastos sa pananaliksik, pagpipino ng modelo, pagproseso ng data, o pangkalahatang mga gastos sa imprastraktura.

Mula nang ito ay umpisahan, ang Deepeek ay namuhunan ng higit sa $ 500 milyon sa pag -unlad ng AI. Gayunpaman, hindi tulad ng mga mas malalaking kumpanya na pasanin ng burukrasya, ang compact na istraktura ng Deepseek ay nagbibigay -daan sa aktibo at epektibong ipatupad ang mga makabagong AI.

Deepseek Larawan: ensigame.com

Ang halimbawa ng Deepseek ay nagpapakita na ang isang mahusay na pinondohan na independiyenteng kumpanya ng AI ay maaaring makipagkumpetensya sa mga pinuno ng industriya. Gayunpaman, binibigyang diin ng mga eksperto na ang tagumpay ng kumpanya ay higit sa lahat dahil sa bilyun -bilyong pamumuhunan, mga teknikal na tagumpay, at isang malakas na koponan, habang ang pag -angkin tungkol sa isang "rebolusyonaryong badyet" para sa pagbuo ng mga modelo ng AI ay medyo pinalaki.

Gayunpaman, ang mga gastos sa mga kakumpitensya ay mananatiling mas mataas. Halimbawa, ihambing ang gastos ng pagsasanay sa modelo: Ang Deepseek ay gumugol ng $ 5 milyon sa R1, habang ang Chatgpt4O ay nagkakahalaga ng $ 100 milyon.

Tuklasin
  • free Girls chat
    free Girls chat
    Interesado sa pagpapalawak ng iyong panlipunang bilog at pag -alis ng mga bagong pagkakaibigan sa online? Ang Free Girls Chat app ay ang iyong go-to solution! Nag -aalok ang app na ito ng magkakaibang pagpili ng mga chat room kung saan maaari kang makisali sa mga batang babae mula sa iba't ibang mga bansa, kabilang ang India, Pakistan, at Bangladesh. Kung ikaw ay nasa m
  • luvdy - Anonymous Dating Among Friends
    luvdy - Anonymous Dating Among Friends
    Ang pag -navigate sa maselan na balanse ng pagkakaibigan at pag -iibigan ay maaaring maging mahirap, lalo na kung nagmamahal ka sa isang kaibigan ngunit hindi sigurado sa kanilang damdamin. Ipasok ang ** Luvdy - Anonymous na pakikipag -date sa mga kaibigan **, ang makabagong solusyon na idinisenyo upang matulungan kang galugarin ang mga damdaming ito nang maingat at ligtas. Kasama
  • ALGERIA DATING CHAT
    ALGERIA DATING CHAT
    Sabik ka bang makilala ang mga solong kalalakihan at kababaihan mula sa Algeria? Tuklasin ang perpektong solusyon sa Algeria dating chat app! Nag-aalok ang platform na ito ng isang ligtas at madaling gamitin na kapaligiran, na idinisenyo upang matulungan kang kumonekta sa isang malawak na pamayanan ng mga algerian na walang kapareha. Ang pag -set up ng iyong profile ay ganap na libre at s
  • Alimentaria & HOSTELCO
    Alimentaria & HOSTELCO
    Maghanda upang mapahusay ang iyong karanasan sa paparating na mga palabas sa kalakalan ng Alimentaria & Hostelco kasama ang opisyal na mobile app. Ang malakas na tool na ito ay nagbibigay -daan sa iyo upang walang kahirap -hirap na mag -navigate sa katalogo ng mga exhibitors, kung saan makakahanap ka ng detalyadong impormasyon sa mga kalahok na kumpanya, ang kanilang mga ipinakita na produkto, at ika
  • Fruzo Chat, Flirt & Dating App
    Fruzo Chat, Flirt & Dating App
    Napapagod ka na ba sa walang katapusang pag -swipe at walang pagbabago na pag -uusap sa teksto sa tradisyonal na mga apps sa pakikipag -date? Panahon na upang baguhin ang iyong diskarte sa pagkikita ng mga bagong tao na may Fruzo Chat, Flirt & Dating app! Ang pagputol ng social platform na ito ay nagpapakilala sa iyo sa isang mundo kung saan ang live na video chat ang susi sa Forgi
  • Teething Calendar
    Teething Calendar
    Para sa lahat ng matulungin na mga magulang doon, ang kalendaryo ng teething ay ang perpektong kasama sa pagsubaybay sa pagsabog ng pangunahing ngipin ng iyong maliit na ngipin. Pinapayagan ka ng kalendaryo ng user-friendly na ito na madaling idokumento at subaybayan ang tiyempo ng bawat hitsura ng ngipin, subaybayan ang pagkakasunud-sunod ng pagsabog, at i-jot down ang isang