Trang chủ > Tin tức > DeepSeek AI: Không giá cả phải chăng, chi phí 1,6 tỷ đô la để phát triển

DeepSeek AI: Không giá cả phải chăng, chi phí 1,6 tỷ đô la để phát triển

Apr 07,25(2 tháng trước)
DeepSeek AI: Không giá cả phải chăng, chi phí 1,6 tỷ đô la để phát triển

Tuy nhiên, nó vẫn rẻ hơn so với các đối thủ cạnh tranh.

Chatbot mới từ Deepseek đã giới thiệu với tôi với mô tả hấp dẫn này:

Xin chào, tôi đã được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên.

Ngày nay, trí tuệ nhân tạo được phát triển bởi Deepseek đã nổi lên như một đối thủ cạnh tranh đáng gờm trên thị trường, đáng chú ý là đóng góp cho một trong những mức giá cổ phiếu lớn nhất của Nvidia.

DeepSeek Test Hình ảnh: Ensigame.com

Điều khiến mô hình này khác biệt là kiến ​​trúc và phương pháp đào tạo sáng tạo của nó. Nó sử dụng một số công nghệ tiên tiến:

Dự đoán đa điểm (MTP): Thay vì dự đoán một từ tại một thời điểm, mô hình dự báo nhiều từ đồng thời bằng cách phân tích các phần khác nhau của một câu. Cách tiếp cận này tăng cường đáng kể cả độ chính xác và hiệu quả của mô hình.

Hỗn hợp các chuyên gia (MOE): Kiến trúc này sử dụng các mạng thần kinh khác nhau để xử lý dữ liệu đầu vào. Công nghệ tăng tốc đào tạo AI và cải thiện hiệu suất. Trong DeepSeek V3, 256 mạng thần kinh được sử dụng, với tám mạng được kích hoạt cho mỗi nhiệm vụ xử lý mã thông báo.

Sự chú ý tiềm ẩn đa đầu (MLA): Cơ chế này giúp tập trung vào các phần quan trọng nhất của câu. MLA trích xuất các chi tiết chính từ các đoạn văn bản nhiều lần thay vì chỉ một lần, giảm khả năng thiếu thông tin quan trọng. Nhờ điều này, AI có nhiều khả năng nắm bắt các sắc thái quan trọng trong dữ liệu đầu vào.

Deepseek, khởi nghiệp nổi tiếng của Trung Quốc tuyên bố đã tạo ra một mô hình AI cạnh tranh với chi phí tối thiểu, nói rằng họ chỉ chi 6 triệu đô la cho việc đào tạo mạng lưới thần kinh mạnh mẽ Deepseek V3 và chỉ sử dụng 2048 bộ xử lý đồ họa.

Deepseek v3 Hình ảnh: Ensigame.com

Tuy nhiên, các nhà phân tích từ Semianalysis đã phát hiện ra rằng Deepseek vận hành một cơ sở hạ tầng tính toán lớn bao gồm khoảng 50.000 GPU phễu NVIDIA. Điều này bao gồm 10.000 đơn vị H800, 10.000 H100 nâng cao hơn và các lô GPU H20 bổ sung. Các tài nguyên này được phân phối trên một số trung tâm dữ liệu và được sử dụng để đào tạo, nghiên cứu và mô hình tài chính của AI.

Tổng đầu tư của công ty vào máy chủ lên tới khoảng 1,6 tỷ đô la, với chi phí hoạt động ước tính là 944 triệu đô la.

Deepseek là một công ty con của FLEGER FLEGER của Quỹ phòng hộ Trung Quốc, giúp khởi động như một bộ phận riêng biệt tập trung vào AI Technologies vào năm 2023. Không giống như hầu hết các công ty khởi nghiệp cho thuê sức mạnh điện toán từ các nhà cung cấp đám mây, DeepSeek sở hữu các trung tâm dữ liệu riêng của mình, giúp nó hoàn toàn kiểm soát tối ưu hóa mô hình AI. Công ty vẫn tự tài trợ, tác động tích cực đến tính linh hoạt và tốc độ ra quyết định của nó.

Deepseek Hình ảnh: Ensigame.com

Hơn nữa, một số nhà nghiên cứu tại Deepseek kiếm được hơn 1,3 triệu đô la hàng năm, thu hút tài năng hàng đầu từ các trường đại học hàng đầu Trung Quốc (công ty không thuê các chuyên gia nước ngoài).

Ngay cả khi xem xét điều này, yêu cầu đào tạo gần đây của Deepseek về mô hình mới nhất của mình chỉ với 6 triệu đô la có vẻ không thực tế. Con số này chỉ đề cập đến chi phí sử dụng GPU trong quá trình đào tạo trước và không chiếm chi phí nghiên cứu, sàng lọc mô hình, xử lý dữ liệu hoặc chi phí cơ sở hạ tầng tổng thể.

Kể từ khi thành lập, Deepseek đã đầu tư hơn 500 triệu đô la vào phát triển AI. Tuy nhiên, không giống như các công ty lớn hơn bị gánh nặng bởi quan liêu, cấu trúc nhỏ gọn của Deepseek cho phép nó thực hiện tích cực và hiệu quả các đổi mới AI.

Deepseek Hình ảnh: Ensigame.com

Ví dụ về DeepSeek chứng minh rằng một công ty AI độc lập được tài trợ tốt có thể cạnh tranh với các nhà lãnh đạo ngành công nghiệp. Tuy nhiên, các chuyên gia nhấn mạnh rằng thành công của công ty chủ yếu là do hàng tỷ khoản đầu tư, đột phá kỹ thuật và một nhóm mạnh mẽ, trong khi tuyên bố về "ngân sách cách mạng" để phát triển các mô hình AI có phần phóng đại.

Tuy nhiên, chi phí của đối thủ vẫn cao hơn đáng kể. Chẳng hạn, so sánh chi phí đào tạo mô hình: Deepseek đã chi 5 triệu đô la cho R1, trong khi TATGPT4O có giá 100 triệu đô la.

Phát hiện
  • Infinite Cultivation
    Infinite Cultivation
    Bước vào thế giới đầy mê hoặc của sự trồng trọt vô hạn, một trò chơi nhàn rỗi xã hội đưa tấm thảm phong phú của văn học tưởng tượng phương Đông (Wuxia/Xianxia) vào cuộc sống. Trò chơi này không chỉ là một bùn khác (ngục tối nhiều người dùng) hoặc một mmorpg đơn giản; Đó là sự trở lại trung tâm của những gì làm cho các thể loại này trở nên captivat
  • Wordscapes In Bloom
    Wordscapes In Bloom
    Đi sâu vào trò chơi văn bản thách thức não hoàn toàn mới mà bạn sẽ thấy mình chơi hàng giờ liền: ** Wordscapes in Bloom **! Trò chơi này không chỉ là niềm vui; Đó là một tập luyện tinh thần được đặt trong một khu vườn thực vật thanh thản chứa đầy những hình nền câu đố tuyệt đẹp. Nó được thiết kế để kiểm tra từ thông minh của bạn, giúp bạn
  • Word Connect - Word Games
    Word Connect - Word Games
    Đi sâu vào các trò chơi chữ phổ biến nhất thế giới với thử thách Word kết nối cuối cùng! Trải nghiệm sự hồi hộp của ứng dụng Word kết nối số 1, được gọi là trò chơi Word gây nghiện nhất từng được tạo ra! Tải xuống trò chơi câu đố từ mới nhất miễn phí và đắm mình trong một thiết kế phiêu lưu câu đố thú vị
  • Word Garden : Crosswords
    Word Garden : Crosswords
    Garden of Words là một trò chơi câu đố từ đầy mê hoặc không chỉ thách thức từ vựng của bạn mà còn kích thích bộ não của bạn. Với một bộ sưu tập rộng lớn hơn một trăm ô chữ và bổ sung các cấp độ mới một cách thường xuyên, trò chơi này hứa hẹn giải trí vô tận. Mục tiêu cốt lõi của khu vườn của
  • Pro des Mots
    Pro des Mots
    Bạn đã sẵn sàng để thách thức logic của mình và mở rộng từ vựng của mình chưa? Nhìn thêm nữa, tải xuống "Word Pro" cho một trải nghiệm trêu chọc não, tiếp thêm sinh lực! Trò chơi rất đơn giản nhưng lại quyến rũ: chỉ cần kéo các khối chữ để xây dựng các từ và tích lũy tiền. Bắt đầu hành trình não của bạn n
  • كلمة السر الذكية بريك
    كلمة السر الذكية بريك
    Trò chơi phá vỡ mật khẩu thông minh là một phiên bản mới thú vị của trò chơi mật khẩu cổ điển, nổi tiếng với những thách thức giải quyết thông minh và giải quyết. Phiên bản cập nhật 2022-2023 này hứa hẹn hàng giờ vui vẻ và giải trí trong khi tăng cường kỹ năng trực giác và quan sát của bạn. Trò chơi mật khẩu thông minh Break