Dom > Aktualności > Deepseek AI: Nie jest przystępny, kosztował 1,6 miliarda dolarów na rozwój
Deepseek AI: Nie jest przystępny, kosztował 1,6 miliarda dolarów na rozwój

Jest jednak nadal tańszy niż jego konkurenci.
Nowy chatbot z Deepseek przedstawił mi ten intrygujący opis:
Cześć, zostałem stworzony, abyś mógł zapytać o wszystko i uzyskać odpowiedź, która może cię nawet zaskoczyć.
Dzisiaj sztuczna inteligencja opracowana przez Deepseek pojawiła się jako potężny konkurent na rynku, w szczególności przyczyniając się do jednego z największych spadków cen akcji w NVIDIA.
Zdjęcie: engame.com
Tym, co wyróżnia ten model, to innowacyjna architektura i metody szkolenia. Stosuje kilka najnowocześniejszych technologii:
Prognozowanie wielu tokenów (MTP): Zamiast przewidywać jedno słowo jednocześnie, model prognozuje wiele słów jednocześnie poprzez analizę różnych części zdania. Podejście to znacznie zwiększa zarówno dokładność, jak i wydajność modelu.
Mieszanka ekspertów (MOE): Architektura ta wykorzystuje różne sieci neuronowe do przetwarzania danych wejściowych. Technologia przyspiesza szkolenie AI i poprawia wydajność. W Deepseek V3 wykorzystywane jest 256 sieci neuronowych, a osiem jest aktywowanych dla każdego zadania przetwarzania tokenu.
Utrzymująca uwaga wielowłócona (MLA): Ten mechanizm pomaga skupić się na najważniejszych częściach zdania. MLA wielokrotnie wyodrębnia kluczowe szczegóły z fragmentów tekstu, a nie tylko raz, zmniejszając prawdopodobieństwo braku ważnych informacji. Dzięki temu sztuczna inteligencja jest bardziej skłonna do przechwytywania kluczowych niuansów w danych wejściowych.
Wybitny chiński startup Deepseek twierdził, że stworzył konkurencyjny model AI przy minimalnych kosztach, stwierdzając, że wydali tylko 6 milionów dolarów na szkolenie potężnej sieci neuronowej Deepseek V3 i zastosowali zaledwie 2048 procesorów graficznych.
Zdjęcie: engame.com
Jednak analitycy z semianalizy odkryli, że Deepseek prowadzi dużą infrastrukturę obliczeniową obejmującą około 50 000 GPU Nvidia Hopper. Obejmuje to 10 000 jednostek H800, 10 000 bardziej zaawansowanych H100 i dodatkowe partie H20 GPU. Zasoby te są dystrybuowane w kilku centrach danych i są wykorzystywane do szkolenia AI, badania i modelowanie finansowe.
Całkowita inwestycja Spółki w serwerach wynosi około 1,6 miliarda dolarów, a wydatki operacyjne szacują na 944 mln USD.
Deepseek jest spółką zależną chińskiego funduszu hedgingowego High-Flyer, która odrzuciła start-upa jako odrębny podział koncentrujący się na technologiach AI w 2023 r.. W przeciwieństwie do większości startupów, które wynajmują siłę obliczeniową od dostawców chmur, Deepseek jest właścicielem własnych centrów danych, co daje mu pełną kontrolę nad optymalizacją modelu AI i włączając szybką wdrażanie innowacji. Firma pozostaje finansowana, co pozytywnie wpływa na jego elastyczność i szybkość podejmowania decyzji.
Zdjęcie: engame.com
Ponadto niektórzy badacze Deepseek zarabiają ponad 1,3 miliona dolarów rocznie, przyciągając najlepsze talenty wiodących chińskich uniwersytetów (firma nie zatrudniał zagranicznych specjalistów).
Nawet biorąc to pod uwagę, ostatnie twierdzenie Deepseeka o szkolenie najnowszego modelu za jedyne 6 milionów dolarów wydaje się nierealne. Liczba ta odnosi się jedynie do kosztu wykorzystania GPU podczas wstępnego treningu i nie uwzględnia kosztów badań, udoskonalania modelu, przetwarzania danych lub ogólnych kosztów infrastruktury.
Od samego początku Deepseek zainwestował ponad 500 milionów dolarów w rozwój AI. Jednak w przeciwieństwie do większych firm obciążonych biurokracją, kompaktowa struktura Deepseek pozwala jej aktywnie i skutecznie wdrażać innowacje AI.
Zdjęcie: engame.com
Przykład Deepseek pokazuje, że dobrze finansowana niezależna firma AI może konkurować z liderami branży. Niemniej jednak eksperci podkreślają, że sukces firmy wynika głównie z miliardów inwestycji, przełomów technicznych i silnego zespołu, podczas gdy twierdzenia o „rewolucyjnym budżecie” dla opracowywania modeli AI są nieco przesadzone.
Mimo to koszty konkurencji pozostają znacznie wyższe. Na przykład porównaj koszty treningu modelowego: Deepseek wydał 5 milionów dolarów na R1, podczas gdy Chatgpt4O kosztował 100 milionów dolarów.
-
Whiplr - Messenger with Kinks!Uwolnij swoje pragnienia i połącz się z podobnie myślącymi osobami dyskretnie za pomocą WHIPLR - Messenger with Kinks!, Innowacyjna aplikacja do przesyłania wiadomości zaprojektowana w celu uwolnienia się od ograniczeń tradycyjnych platform. Zanurz się w świecie, w którym możesz swobodnie wyrażać swoje załamania i fetysze. Z kompleksowym
-
AutowiniAutowini to najlepsza platforma handlowa dla samochodów, ciężarówek, autobusów i części w Korei. Specjalizująca się w sprzedaży używanych koreańskich samochodów z Korei Południowej, Autowini oferuje najskuteczniejszy wybór koreańskich samochodów używanych dostępnych w dowolnym miejscu na rynku. Czy jesteś na rynku używanych koreańskich samochodów,
-
Таксопарк СтабильныйWprowadzenie aplikacji ** stabilnej **, zaprojektowanej specjalnie dla kierowców taksówek w celu usprawnienia i poprawy ich doświadczenia zawodowego. Dzięki stabilne możesz bez wysiłku zarządzać profilem kierowcy we flocie taksówkowej, aby uzyskać aktualne i łatwo dostępne dane. Aplikacja oferuje również kompleksową kontrolę
-
Rizo DriverRizo Driver to najnowocześniejsza aplikacja zaprojektowana specjalnie dla kierowców pracujących z usługą telefoniczną samochodową, Rizo. Ta aplikacja upoważnia kierowców, umożliwiając im dostosowanie ich harmonogramów pracy do własnych potrzeb i wybieranie najbardziej odpowiednich żądań jazdy, zapewniając maksymalną elastyczność i wydajność
-
Veloz MotoVeloz Moto - Professional: Ultimate App for Motoboy dostawa profesjonalisty Moto - profesjonalista to najnowocześniejsza aplikacja zaprojektowana specjalnie dla profesjonalistów w branży usług dostarczania Motoboy. To potężne narzędzie jest dostosowane do zwiększenia wydajności i skuteczności
-
How to Draw Real VegetablesUwolnij swojego wewnętrznego artysty dzięki naszej ** Jak rysować prawdziwe warzywa ** aplikacja! Niezależnie od tego, czy jesteś początkującym, czy doświadczonym artystą, nasza łatwa w użyciu aplikacja oferuje samouczki krok po kroku na temat rysowania różnych uroczych, kreskówek i realistycznych warzyw. Od papryki po brokuły, naucz się tworzyć oszałamiające rysunki w
-
Misja AI rozgrywa się w Ecos La Brea
-
Roblox: Najnowsze kody Anime RNG TD! Odkryj elementy do odblokowania już teraz
-
Co oznacza SVP u rywali Marvela? Odpowiedział
-
Pokémon TCG Pocket wkrótce upuszcza nowe mityczne rozszerzenie wyspy
-
Dlaczego Shellfire VPN jest koniecznością dla każdego gracza z Androidem