Deepseek AI: niet betaalbaar, kost $ 1,6 miljard om te ontwikkelen

Het is echter nog steeds goedkoper dan zijn concurrenten.
De nieuwe chatbot van Deepseek stelde me aan mij voor met deze intrigerende beschrijving:
Hallo, ik ben gemaakt, zodat je alles kunt vragen en een antwoord kunt krijgen dat je misschien zou kunnen verrassen.
Tegenwoordig is de door Deepseek ontwikkelde kunstmatige intelligentie naar voren gekomen als een formidabele concurrent in de markt, met name die bijdraagt aan een van de grootste aandelenkoersdaling van NVIDIA.
Afbeelding: ensigame.com
Wat dit model onderscheidt, zijn de innovatieve architectuur- en trainingsmethoden. Het maakt gebruik van verschillende geavanceerde technologieën:
Multi-token voorspelling (MTP): in plaats van één woord tegelijk te voorspellen, voorspelt het model meerdere woorden tegelijkertijd door verschillende delen van een zin te analyseren. Deze benadering verbetert zowel de nauwkeurigheid als de efficiëntie van het model aanzienlijk.
Mix van experts (MOE): deze architectuur maakt gebruik van verschillende neurale netwerken om invoergegevens te verwerken. De technologie versnelt AI -training en verbetert de prestaties. In Deepseek V3 worden 256 neurale netwerken gebruikt, waarbij er acht worden geactiveerd voor elke tokenverwerkingstaak.
Multi-head latente aandacht (MLA): dit mechanisme helpt zich te concentreren op de belangrijkste delen van een zin. MLA haalt herhaaldelijk sleuteldetails uit tekstfragmenten uit in plaats van slechts één keer, waardoor de kans op het missen van belangrijke informatie wordt verminderd. Dankzij dit zal de AI eerder cruciale nuances vastleggen in de invoergegevens.
De prominente Chinese startup Deepseek beweerde een competitief AI -model te hebben gecreëerd met minimale kosten, waarin stond dat ze slechts $ 6 miljoen hebben uitgegeven aan het trainen van het krachtige neurale netwerk Deepseek V3 en slechts 2048 grafische processors gebruikten.
Afbeelding: ensigame.com
Analisten uit de semianyse ontdekten echter dat Deepseek een grote computationele infrastructuur heeft die ongeveer 50.000 Nvidia Hopper GPU's omvat. Dit omvat 10.000 H800 -eenheden, 10.000 meer geavanceerde H100's en extra batches van H20 GPU's. Deze middelen worden verdeeld over verschillende datacenters en worden gebruikt voor AI -training, onderzoek en financiële modellering.
De totale investering van het bedrijf in servers bedraagt ongeveer $ 1,6 miljard, met operationele kosten geschat op $ 944 miljoen.
Deepseek is een dochteronderneming van het Chinese hedgefonds High-Flyer, dat de startup afspelde als een afzonderlijke divisie gericht op AI-technologieën in 2023. In tegenstelling tot de meeste startups die rekenkracht huren van cloudproviders, bezit Deepseek zijn eigen datacenters, waardoor het volledige controle over AI-modeloptimalisatie heeft en faster implementatie van innovaties. Het bedrijf blijft zelf gefinancierd, wat een positieve invloed heeft op zijn flexibiliteit en besluitvormingssnelheid.
Afbeelding: ensigame.com
Bovendien verdienen sommige onderzoekers van Deepseek per jaar meer dan $ 1,3 miljoen en trekken ze toptalent aan van toonaangevende Chinese universiteiten (het bedrijf huurt geen buitenlandse specialisten in).
Zelfs gezien dit, lijkt de recente claim van Deepseek om zijn nieuwste model te trainen voor slechts $ 6 miljoen onrealistisch. Dit figuur verwijst alleen naar de kosten van GPU-gebruik tijdens pre-training en houdt geen rekening met onderzoekskosten, modelverfijning, gegevensverwerking of algemene infrastructuurkosten.
Sinds de oprichting heeft Deepseek meer dan $ 500 miljoen geïnvesteerd in AI -ontwikkeling. In tegenstelling tot grotere bedrijven die worden belast door bureaucratie, stelt de compacte structuur van Deepseek echter in staat AI -innovaties actief en effectief te implementeren.
Afbeelding: ensigame.com
Het voorbeeld van Deepseek toont aan dat een goed gefinancierd onafhankelijk AI-bedrijf kan concurreren met marktleiders. Desalniettemin benadrukken experts dat het succes van het bedrijf grotendeels te wijten is aan miljarden in investeringen, technische doorbraken en een sterk team, terwijl claims over een "revolutionair budget" voor het ontwikkelen van AI -modellen enigszins overdreven zijn.
Toch blijven de kosten van concurrenten aanzienlijk hoger. Vergelijk bijvoorbeeld de kosten van modelopleiding: Deepseek heeft $ 5 miljoen uitgegeven aan R1, terwijl Chatgpt4o $ 100 miljoen kostte.
-
free Girls chatGeïnteresseerd in het uitbreiden van uw sociale kring en het online smeden van nieuwe vriendschappen? De gratis Girls Chat-app is je go-to-oplossing! Deze app biedt een gevarieerde selectie chatrooms waar u zich kunt bezighouden met meisjes uit verschillende landen, waaronder India, Pakistan en Bangladesh. Of je in de m bent
-
luvdy - Anonymous Dating Among FriendsNavigeren door de delicate balans tussen vriendschap en romantiek kan een uitdaging zijn, vooral als je verliefd bent op een vriend maar niet zeker van hun gevoelens. Enter ** Luvdy - Anonieme dating tussen vrienden **, de innovatieve oplossing die is ontworpen om u te helpen deze gevoelens discreet en veilig te verkennen. Met
-
ALGERIA DATING CHATWilt u alleenstaande mannen en vrouwen uit Algerije ontmoeten? Ontdek de perfecte oplossing met de Algeria Dating Chat -app! Dit platform biedt een veilige en eenvoudig te gebruiken omgeving, ontworpen om u te helpen contact te maken met een enorme gemeenschap van Algerijnse singles. Het instellen van uw profiel is volledig gratis en s
-
Alimentaria & HOSTELCOMaak je klaar om je ervaring te verbeteren op de aankomende Alimentaria & Hostelco -beurs met de officiële mobiele app. Met deze krachtige tool kunt u moeiteloos door de catalogus van de exposanten navigeren, waar u gedetailleerde informatie kunt vinden over deelnemende bedrijven, hun tentoongestelde producten en th
-
Fruzo Chat, Flirt & Dating AppBen je de eindeloze veeg- en monotone tekstgesprekken beu op traditionele dating -apps? Het is tijd om een revolutie teweeg te brengen in uw aanpak om nieuwe mensen te ontmoeten met Fruzo -chat-, flirt- en dating -app! Dit geavanceerde sociale platform introduceert je in een wereld waar live videochat de sleutel is om te vergeten
-
Teething CalendarVoor alle attente ouders die er zijn, is Titting -zuskalender de perfecte metgezel bij het bijhouden van de primaire tandenuitbarsting van je kleine tanden. Met deze gebruiksvriendelijke agenda kunt u eenvoudig de timing van elk tand uiterlijk documenteren en bewaken, de reeks uitbarsting volgen en een