Rumah > Berita > DeepSeek AI: Tidak Mampu, berharga $ 1.6 bilion untuk berkembang

DeepSeek AI: Tidak Mampu, berharga $ 1.6 bilion untuk berkembang

Apr 07,25(21 jam yang lalu)
DeepSeek AI: Tidak Mampu, berharga $ 1.6 bilion untuk berkembang

Walau bagaimanapun, ia masih lebih murah daripada pesaingnya.

Chatbot baru dari DeepSeek memperkenalkan dirinya kepada saya dengan keterangan yang menarik ini:

Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda.

Hari ini, kecerdasan buatan yang dibangunkan oleh DeepSeek telah muncul sebagai pesaing yang hebat di pasaran, terutamanya menyumbang kepada salah satu penurunan harga saham terbesar di Nvidia.

Ujian DeepSeek Imej: ensigame.com

Apa yang membezakan model ini adalah kaedah seni bina dan latihan yang inovatif. Ia menggunakan beberapa teknologi canggih:

Ramalan Multi-Token (MTP): Daripada meramalkan satu perkataan pada satu masa, model meramalkan pelbagai perkataan secara serentak dengan menganalisis bahagian-bahagian yang berlainan dari ayat. Pendekatan ini meningkatkan ketepatan dan kecekapan model.

Campuran Pakar (MOE): Senibina ini menggunakan pelbagai rangkaian saraf untuk memproses data input. Teknologi ini mempercepat latihan AI dan meningkatkan prestasi. Di Deepseek V3, 256 rangkaian saraf digunakan, dengan lapan diaktifkan untuk setiap tugas pemprosesan token.

Perhatian Laten Multi-Head (MLA): Mekanisme ini membantu memberi tumpuan kepada bahagian-bahagian yang paling penting dalam satu kalimat. MLA mengekstrak butiran utama dari serpihan teks berulang kali bukan sekadar sekali, mengurangkan kemungkinan maklumat penting yang hilang. Terima kasih kepada ini, AI lebih cenderung untuk menangkap nuansa penting dalam data input.

Permulaan Cina yang terkenal DeepSeek mendakwa telah mencipta model AI yang kompetitif dengan kos yang minimum, menyatakan bahawa mereka hanya membelanjakan $ 6 juta untuk melatih rangkaian saraf yang kuat DeepSeek V3 dan hanya menggunakan pemproses grafik 2048.

DeepSeek V3 Imej: ensigame.com

Walau bagaimanapun, penganalisis dari semianalisis mendapati bahawa DeepSeek mengendalikan infrastruktur pengiraan yang besar yang terdiri daripada kira -kira 50,000 GPU NVIDIA Hopper. Ini termasuk 10,000 unit H800, 10,000 lebih maju H100s, dan kumpulan tambahan GPU H20. Sumber -sumber ini diedarkan di beberapa pusat data dan digunakan untuk latihan AI, penyelidikan, dan pemodelan kewangan.

Jumlah pelaburan syarikat dalam pelayan berjumlah sekitar $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan $ 944 juta.

DeepSeek adalah anak syarikat dana lindung nilai Cina yang tinggi, yang memancarkan permulaan sebagai bahagian yang berasingan yang memberi tumpuan kepada teknologi AI pada tahun 2023. Syarikat itu tetap dibiayai sendiri, yang memberi kesan positif kepada kelonggaran dan kelajuan membuat keputusan.

Deepseek Imej: ensigame.com

Lebih -lebih lagi, beberapa penyelidik di DeepSeek memperoleh lebih dari $ 1.3 juta setiap tahun, menarik bakat teratas dari universiti -universiti China yang terkemuka (syarikat itu tidak mengupah pakar asing).

Walaupun memandangkan ini, tuntutan DeepSeek baru -baru ini melatih model terkini untuk hanya $ 6 juta nampaknya tidak realistik. Angka ini hanya merujuk kepada kos penggunaan GPU semasa latihan pra-latihan dan tidak mengambil kira perbelanjaan penyelidikan, penghalusan model, pemprosesan data, atau kos infrastruktur keseluruhan.

Sejak penubuhannya, DeepSeek telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Walau bagaimanapun, tidak seperti syarikat yang lebih besar yang dibebani oleh birokrasi, struktur padat DeepSeek membolehkannya secara aktif dan berkesan melaksanakan inovasi AI.

Deepseek Imej: ensigame.com

Contoh DeepSeek menunjukkan bahawa syarikat AI bebas yang dibiayai dengan baik dapat bersaing dengan pemimpin industri. Walau bagaimanapun, pakar menekankan bahawa kejayaan syarikat itu sebahagian besarnya disebabkan oleh berbilion -bilion dalam pelaburan, penemuan teknikal, dan pasukan yang kuat, sementara tuntutan tentang "anggaran revolusioner" untuk membangunkan model AI agak dibesar -besarkan.

Namun, kos pesaing kekal lebih tinggi. Sebagai contoh, bandingkan kos latihan model: DeepSeek membelanjakan $ 5 juta pada R1, manakala CHATGPT4O berharga $ 100 juta.

Temui
  • تعارف واتسآب
    تعارف واتسآب
    Adakah anda ingin bertemu dengan orang baru dan mungkin mencari cinta? Aplikasi تعارف واتasaan adalah platform anda di mana beribu-ribu pengguna yang sahih berkumpul untuk berbual, menjalin persahabatan baru, dan mungkin menemui percintaan. Dengan kemasukan ahli baru yang berterusan, anda akan mempunyai peluang yang tidak berkesudahan untuk berhubung dengan Indiv
  • Quick Flirt 18+
    Quick Flirt 18+
    Adakah anda ingin mengembangkan bulatan sosial anda dan mungkin mencari percintaan? Aplikasi FLAST 18+ cepat adalah pintu masuk anda untuk berbual harian dengan perseorangan yang menakjubkan, di mana anda mungkin hanya bertemu rakan kongsi ideal anda. Sama ada anda bermimpi berjalan -jalan romantis atau hanya mencari perbualan yang menarik dalam sembang dalam talian kami
  • Anime Dragon Serie en Latino
    Anime Dragon Serie en Latino
    Menyelam ke alam semesta anime yang mempesonakan dengan aplikasi Anime Dragon Serie en Latino, di mana anda boleh mengakses setiap episod siri Anime Dragon dalam audio Latin berkualiti tinggi. Menghidupkan semula detik -detik yang menggembirakan yang mencetuskan imaginasi anda, semuanya dibentangkan dalam bentuk asalnya untuk meningkatkan tontonan anda
  • Mercedes-Benz (USA/CA)
    Mercedes-Benz (USA/CA)
    Pengalaman sambungan yang tidak dapat ditandingi dengan kenderaan Mercedes-Benz anda melalui aplikasi Mercedes-Benz (Amerika Syarikat/CA), disesuaikan untuk pemilik model tahun 2019 atau kenderaan baru. Aplikasi ini memberi anda kuasa untuk memantau butiran penting seperti jarak tempuh, tahap bahan api, dan juga menentukan lokasi kenderaan anda di peta,
  • Textgram -Text on Photo,Story
    Textgram -Text on Photo,Story
    Dengan Textgram - teks pada foto, cerita, anda boleh mengubah mesej anda menjadi visual yang menawan dengan menambahkan teks ke foto anda, membuat reka bentuk unik, dan berkongsi kreativiti anda dengan rakan dan pengikut. Sama ada anda berhasrat untuk membuat jawatan media sosial yang menarik, merancang lalat profesional
  • Nova tv movies and tv shows
    Nova tv movies and tv shows
    Adakah anda bosan menatal tanpa henti melalui pelbagai perkhidmatan streaming untuk mencari filem atau rancangan TV yang sempurna? Lihatlah lebih jauh daripada filem Nova TV dan aplikasi TV! Aplikasi filem percuma yang tidak terhad ini menawarkan anda akses kepada pelbagai kandungan, dari klasik yang tidak berkesudahan ke siri TV terkini. Dengan t