Rumah > Berita > DeepSeek AI: Tidak Mampu, berharga $ 1.6 bilion untuk berkembang

DeepSeek AI: Tidak Mampu, berharga $ 1.6 bilion untuk berkembang

Apr 07,25(2 bulan yang lalu)
DeepSeek AI: Tidak Mampu, berharga $ 1.6 bilion untuk berkembang

Walau bagaimanapun, ia masih lebih murah daripada pesaingnya.

Chatbot baru dari DeepSeek memperkenalkan dirinya kepada saya dengan keterangan yang menarik ini:

Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda.

Hari ini, kecerdasan buatan yang dibangunkan oleh DeepSeek telah muncul sebagai pesaing yang hebat di pasaran, terutamanya menyumbang kepada salah satu penurunan harga saham terbesar di Nvidia.

Ujian DeepSeek Imej: ensigame.com

Apa yang membezakan model ini adalah kaedah seni bina dan latihan yang inovatif. Ia menggunakan beberapa teknologi canggih:

Ramalan Multi-Token (MTP): Daripada meramalkan satu perkataan pada satu masa, model meramalkan pelbagai perkataan secara serentak dengan menganalisis bahagian-bahagian yang berlainan dari ayat. Pendekatan ini meningkatkan ketepatan dan kecekapan model.

Campuran Pakar (MOE): Senibina ini menggunakan pelbagai rangkaian saraf untuk memproses data input. Teknologi ini mempercepat latihan AI dan meningkatkan prestasi. Di Deepseek V3, 256 rangkaian saraf digunakan, dengan lapan diaktifkan untuk setiap tugas pemprosesan token.

Perhatian Laten Multi-Head (MLA): Mekanisme ini membantu memberi tumpuan kepada bahagian-bahagian yang paling penting dalam satu kalimat. MLA mengekstrak butiran utama dari serpihan teks berulang kali bukan sekadar sekali, mengurangkan kemungkinan maklumat penting yang hilang. Terima kasih kepada ini, AI lebih cenderung untuk menangkap nuansa penting dalam data input.

Permulaan Cina yang terkenal DeepSeek mendakwa telah mencipta model AI yang kompetitif dengan kos yang minimum, menyatakan bahawa mereka hanya membelanjakan $ 6 juta untuk melatih rangkaian saraf yang kuat DeepSeek V3 dan hanya menggunakan pemproses grafik 2048.

DeepSeek V3 Imej: ensigame.com

Walau bagaimanapun, penganalisis dari semianalisis mendapati bahawa DeepSeek mengendalikan infrastruktur pengiraan yang besar yang terdiri daripada kira -kira 50,000 GPU NVIDIA Hopper. Ini termasuk 10,000 unit H800, 10,000 lebih maju H100s, dan kumpulan tambahan GPU H20. Sumber -sumber ini diedarkan di beberapa pusat data dan digunakan untuk latihan AI, penyelidikan, dan pemodelan kewangan.

Jumlah pelaburan syarikat dalam pelayan berjumlah sekitar $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan $ 944 juta.

DeepSeek adalah anak syarikat dana lindung nilai Cina yang tinggi, yang memancarkan permulaan sebagai bahagian yang berasingan yang memberi tumpuan kepada teknologi AI pada tahun 2023. Syarikat itu tetap dibiayai sendiri, yang memberi kesan positif kepada kelonggaran dan kelajuan membuat keputusan.

Deepseek Imej: ensigame.com

Lebih -lebih lagi, beberapa penyelidik di DeepSeek memperoleh lebih dari $ 1.3 juta setiap tahun, menarik bakat teratas dari universiti -universiti China yang terkemuka (syarikat itu tidak mengupah pakar asing).

Walaupun memandangkan ini, tuntutan DeepSeek baru -baru ini melatih model terkini untuk hanya $ 6 juta nampaknya tidak realistik. Angka ini hanya merujuk kepada kos penggunaan GPU semasa latihan pra-latihan dan tidak mengambil kira perbelanjaan penyelidikan, penghalusan model, pemprosesan data, atau kos infrastruktur keseluruhan.

Sejak penubuhannya, DeepSeek telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Walau bagaimanapun, tidak seperti syarikat yang lebih besar yang dibebani oleh birokrasi, struktur padat DeepSeek membolehkannya secara aktif dan berkesan melaksanakan inovasi AI.

Deepseek Imej: ensigame.com

Contoh DeepSeek menunjukkan bahawa syarikat AI bebas yang dibiayai dengan baik dapat bersaing dengan pemimpin industri. Walau bagaimanapun, pakar menekankan bahawa kejayaan syarikat itu sebahagian besarnya disebabkan oleh berbilion -bilion dalam pelaburan, penemuan teknikal, dan pasukan yang kuat, sementara tuntutan tentang "anggaran revolusioner" untuk membangunkan model AI agak dibesar -besarkan.

Namun, kos pesaing kekal lebih tinggi. Sebagai contoh, bandingkan kos latihan model: DeepSeek membelanjakan $ 5 juta pada R1, manakala CHATGPT4O berharga $ 100 juta.

Temui
  • Infinite Cultivation
    Infinite Cultivation
    Melangkah ke dunia yang mempesonakan penanaman tak terhingga, permainan terbiar sosial yang membawa permaidani yang kaya dengan kesusasteraan fantasi timur (Wuxia/Xianxia). Permainan ini bukan sekadar lumpur lain (Dungeon Multi-User) atau MMORPG yang mudah; ia kembali ke hati apa yang menjadikan genre ini begitu menarik
  • Wordscapes In Bloom
    Wordscapes In Bloom
    Menyelam ke dalam permainan perkataan otak yang mencabar baru yang anda akan mendapati diri anda bermain selama berjam-jam di akhir: ** wordscapes dalam mekar **! Permainan ini bukan hanya menyeronokkan; Ia adalah senaman mental yang terletak di taman botani yang tenang yang penuh dengan latar belakang teka -teki yang menakjubkan. Ia direka untuk menguji kata pintar anda, membantu y
  • Word Connect - Word Games
    Word Connect - Word Games
    Menyelam ke dalam permainan perkataan yang paling popular di dunia dengan Cabaran Word Connect Ultimate! Mengalami keseronokan aplikasi #1 Hit Word Connect, yang dikenali sebagai permainan perkataan yang paling ketagihan yang pernah dibuat! Muat turun permainan teka -teki perkataan terkini secara percuma dan tenggelamkan diri anda dalam reka bentuk pengembaraan teka -teki yang menarik
  • Word Garden : Crosswords
    Word Garden : Crosswords
    Garden of Words adalah permainan teka -teki kata yang memikat yang bukan sahaja mencabar perbendaharaan kata anda tetapi juga merangsang otak anda. Dengan koleksi yang luas lebih dari seratus kata silang dan penambahan tahap baru secara teratur, permainan ini menjanjikan hiburan yang tidak berkesudahan. Objektif teras Taman
  • Pro des Mots
    Pro des Mots
    Adakah anda bersedia untuk mencabar logik anda dan mengembangkan leksikon anda? Lihatlah "Word Pro" yang lebih jauh untuk pengalaman yang mencurigakan otak percuma! Permainan ini mudah tetapi menawan: Seret blok surat untuk membina kata -kata dan mengumpul duit syiling. Mulakan perjalanan cerebral anda n
  • كلمة السر الذكية بريك
    كلمة السر الذكية بريك
    Permainan Break Kata Laluan Pintar adalah versi baru yang menarik dari permainan kata laluan klasik, yang terkenal dengan cabaran kecerdasan dan teka-teki. Edisi 2022-2023 yang dikemas kini menjanjikan jam keseronokan dan hiburan sambil meningkatkan kemahiran intuisi dan pemerhatian anda. Permainan kata laluan pintar break b