> 소식 > DeepSeek AI : 저렴하지 않으며 개발 비용이 16 억 달러입니다

DeepSeek AI : 저렴하지 않으며 개발 비용이 16 억 달러입니다

Apr 07,25(21시간 전)
DeepSeek AI : 저렴하지 않으며 개발 비용이 16 억 달러입니다

그러나 경쟁사보다 여전히 저렴합니다.

DeepSeek의 새로운 챗봇은이 흥미로운 설명을 통해 나에게 소개했습니다.

안녕하세요, 나는 당신이 무엇이든 물어보고 당신을 놀라게 할 수있는 대답을 얻을 수 있도록 만들어졌습니다.

오늘날 DeepSeek가 개발 한 인공 지능은 시장에서 강력한 경쟁자로 부상하여 Nvidia의 최대 주가 하락 중 하나에 기여했습니다.

Deepseek 테스트 이미지 : ensigame.com

이 모델을 차별화하는 것은 혁신적인 아키텍처 및 교육 방법입니다. 몇 가지 최첨단 기술을 사용합니다.

MTP ( Multi-Token Prediction ) : 한 번에 한 단어를 예측하는 대신 모델은 문장의 다른 부분을 분석하여 여러 단어를 동시에 예측합니다. 이 접근법은 모델의 정확도와 효율성을 크게 향상시킵니다.

전문가 (MOE)의 혼합 :이 아키텍처는 다양한 신경망을 사용하여 입력 데이터를 처리합니다. 이 기술은 AI 교육을 가속화하고 성능을 향상시킵니다. DeepSeek V3에서는 256 개의 신경망이 사용되며 각 토큰 처리 작업마다 8 개가 활성화됩니다.

다중 헤드 잠재주의 (MLA) :이 메커니즘은 문장의 가장 중요한 부분에 집중하는 데 도움이됩니다. MLA는 한 번보다 반복적으로 텍스트 조각에서 주요 세부 사항을 추출하여 중요한 정보가 누락 될 가능성을 줄입니다. 이 덕분에 AI는 입력 데이터에서 중요한 뉘앙스를 캡처 할 가능성이 높습니다.

저명한 중국의 스타트 업 DeepSeek은 최소한의 비용으로 경쟁력있는 AI 모델을 만들었다고 주장하면서 강력한 신경 네트워크 DeepSeek V3를 훈련시키는 데 6 백만 달러를 소비했으며 2048 개의 그래픽 프로세서를 사용했다고 진술했습니다.

Deepseek V3 이미지 : ensigame.com

그러나 Semianalysis의 분석가들은 DeepSeek이 약 50,000 NVIDIA HOPPER GPU를 포함하는 대규모 계산 인프라를 운영한다는 것을 발견했습니다. 여기에는 10,000 H800 단위, 10,000 개 더 고급 H100 및 추가 배치의 H20 GPU가 포함됩니다. 이러한 리소스는 여러 데이터 센터에 배포되며 AI 교육, 연구 및 재무 모델링에 사용됩니다.

이 회사의 서버에 대한 총 투자는 약 16 억 달러에 달하며 운영비는 9 억 9,400 만 달러로 추정됩니다.

DeepSeek은 중국 헤지 펀드 하이 플라이어의 자회사로, 2023 년 AI 기술에 중점을 둔 별도의 부문으로 스타트 업을 시작했습니다. 클라우드 제공 업체의 컴퓨팅 전력을 임대하는 대부분의 스타트 업과 달리 자체 데이터 센터를 소유하고있어 AI 모델 최적화를 완전히 제어하고 더 빠른 혁신 구현을 가능하게합니다. 회사는 자체 자금을 유지하고 있으며 유연성과 의사 결정 속도에 긍정적 인 영향을 미칩니다.

Deepseek 이미지 : ensigame.com

또한 Deepseek의 일부 연구원들은 매년 130 만 달러 이상을 벌어 중국 대학에서 최고의 인재를 유치합니다 (회사는 외국 전문가를 고용하지 않습니다).

이를 고려해도 DeepSeek의 최근 최신 모델을 6 백만 달러에 훈련 한 주장은 비현실적으로 보입니다. 이 수치는 사전 훈련 중 GPU 사용 비용만을 의미하며 연구 비용, 모델 개선, 데이터 처리 또는 전체 인프라 비용을 설명하지 않습니다.

DeepSeek은 처음부터 AI 개발에 5 억 달러 이상을 투자했습니다. 그러나 관료주의에 의해 부담이되는 대기업과 달리 DeepSeek의 소형 구조는 AI 혁신을 적극적으로 효과적으로 구현할 수있게합니다.

Deepseek 이미지 : ensigame.com

DeepSeek의 예는 잘 자금을 지원하는 독립 AI 회사가 업계 리더와 경쟁 할 수 있음을 보여줍니다. 그럼에도 불구하고 전문가들은 회사의 성공이 수십억의 투자, 기술 혁신 및 강력한 팀으로 인한 반면, AI 모델 개발을위한 "혁명 예산"에 대한 주장은 다소 과장되어 있다고 강조합니다.

그럼에도 불구하고 경쟁 업체의 비용은 상당히 높아집니다. 예를 들어, 모델 교육 비용 비교 : DeepSeek은 R1에 5 백만 달러를 소비 한 반면 ChatGpt4o는 1 억 달러가 들었습니다.

발견하다
  • تعارف واتسآب
    تعارف واتسآب
    새로운 사람들을 만나고 아마도 사랑을 찾기를 간절히 원하십니까? Ç 지능 والس Â잭은 수천 명의 정통 사용자가 채팅을 위해 모여 새로운 우정을 쌓고 로맨스를 발견하는 플랫폼입니다. 새로운 회원이 지속적으로 유입되면 Indiv와 연결할 수있는 끝없는 기회가 있습니다.
  • Quick Flirt 18+
    Quick Flirt 18+
    당신은 당신의 소셜 서클을 확장하고 로맨스를 찾기를 간절히 원하십니까? 빠른 바람둥이 18+ 앱은 멋진 파트너를 만날 수있는 멋진 싱글과 매일 채팅하는 게이트웨이입니다. 낭만적 인 산책을 꿈꾸거나 단순히 온라인 채팅에서 매력적인 대화를 추구하든
  • Anime Dragon Serie en Latino
    Anime Dragon Serie en Latino
    애니메이션 용 드래곤 세리 엔 라틴 앱으로 매혹적인 애니메이션의 우주로 뛰어 들면, 고품질 라틴 오디오로 애니메이션 드래곤 시리즈의 모든 에피소드에 액세스 할 수 있습니다. 당신의 상상력을 불러 일으키는 짜릿한 순간을 재현하십시오.
  • Mercedes me connect (USA)
    Mercedes me connect (USA)
    Model 2019 또는 새로운 차량 소유자를 위해 맞춤형 Mercedes-Benz (USA/CA) 앱을 통해 메르세데스-벤츠 차량과의 비교할 수없는 연결을 경험하십시오. 이 앱은 마일리지, 연료 수준 및 맵에서 차량 위치를 정확히 찾아 낼 수있는 필수 세부 사항을 모니터링 할 수 있습니다.
  • Textgram -Text on Photo,Story
    Textgram -Text on Photo,Story
    TextGram- 사진, 스토리의 텍스트를 사용하면 사진에 텍스트를 추가하고 독특한 디자인을 제작하고 친구 및 추종자와 창의성을 공유하여 메시지를 매혹적인 시각적으로 변환 할 수 있습니다. 시선을 사로 잡는 소셜 미디어 게시물을 만들려고하든 전문 비행을 설계하십시오.
  • Nova tv movies and tv shows
    Nova tv movies and tv shows
    완벽한 영화 나 TV 쇼를 찾기 위해 다양한 스트리밍 서비스를 통해 끝없이 스크롤하는 데 지쳤습니까? Nova TV 영화 및 TV 쇼 앱을 더 이상 보지 마십시오! 이 무료 무제한 영화 앱은 시대를 초월한 클래식부터 최신 TV 시리즈에 이르기까지 다양한 콘텐츠에 액세스 할 수 있습니다. t와 함께