Deepseek AI: Uygun fiyatlı değil, geliştirmek için 1,6 milyar dolara mal oldu

Ancak, hala rakiplerinden daha ucuz.
Deepseek'ten yeni sohbet botu, bu ilgi çekici açıklama ile kendisini bana tanıttı:
Merhaba, yaratıldım, böylece herhangi bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz.
Bugün, Deepseek tarafından geliştirilen yapay zeka, piyasada zorlu bir rakip olarak ortaya çıktı ve özellikle Nvidia'nın en büyük hisse senedi fiyat düşüşlerinden birine katkıda bulundu.
Resim: ensigame.com
Bu modeli birbirinden ayıran şey, yenilikçi mimarisi ve eğitim yöntemleridir. Birkaç son teknoloji kullanıyor:
Çoklu Tahmini Tahmin (MTP): Model, bir seferde bir kelimeyi tahmin etmek yerine, bir cümlenin farklı bölümlerini analiz ederek aynı anda birden fazla kelimeyi tahmin eder. Bu yaklaşım, modelin hem doğruluğunu hem de verimliliğini önemli ölçüde artırır.
Uzmanların Karışımı (MOE): Bu mimari, girdi verilerini işlemek için çeşitli sinir ağlarını kullanır. Teknoloji AI eğitimini hızlandırır ve performansı artırır. Deepseek V3'te 256 sinir ağı kullanılır, sekizi her bir jeton işleme görevi için etkinleştirilir.
Çok Baş Gizli Dikkat (MLA): Bu mekanizma, bir cümlenin en önemli kısımlarına odaklanmaya yardımcı olur. MLA, metin parçalarından önemli ayrıntıları sadece bir kez yerine tekrar tekrar çıkarır ve önemli bilgilerin eksik olma olasılığını azaltır. Bu sayede, AI'nın giriş verilerindeki önemli nüansları yakalama olasılığı daha yüksektir.
Tanınmış Çinli girişim Deepseek, minimum maliyetlerle rekabetçi bir AI modeli oluşturduğunu iddia etti ve güçlü sinir ağı Deepseek V3'ü eğitmek için sadece 6 milyon dolar harcadıklarını ve sadece 2048 grafik işlemcisi kullandıklarını belirtti.
Resim: ensigame.com
Bununla birlikte, Semianaliz analistleri Deepseek'in yaklaşık 50.000 NVIDIA Hopper GPU'ları içeren büyük bir hesaplama altyapısı işlettiğini keşfetti. Buna 10.000 H800 birim, 10.000 daha gelişmiş H100 ve ek grup H20 GPU'lar dahildir. Bu kaynaklar çeşitli veri merkezlerine dağıtılır ve AI eğitim, araştırma ve finansal modelleme için kullanılır.
Şirketin sunuculara toplam yatırımı yaklaşık 1,6 milyar dolar, operasyonel giderlerin 944 milyon dolar olduğu tahmin ediliyor.
Deepseek, 2023'te AI teknolojilerine odaklanan ayrı bir bölüm olarak başlatılan Çin Hedge Fonu High-Flyer'in bir yan kuruluşudur. Bulut sağlayıcılarından bilgi işlem gücünü kiralayan çoğu girişimin aksine, Deepseek kendi veri merkezlerine sahiptir ve AI model optimizasyonu üzerinde tam kontrol sağlar ve inovasyonların daha hızlı uygulanması. Şirket, esnekliğini ve karar verme hızını olumlu yönde etkileyen kendi kendini finanse ediyor.
Resim: ensigame.com
Dahası, Deepseek'teki bazı araştırmacılar yılda 1.3 milyon doların üzerinde para kazanıyor ve önde gelen Çin üniversitelerinden en iyi yetenekleri çekiyor (şirket yabancı uzmanları işe almıyor).
Bunu göz önünde bulundurarak, Deepseek'in son modelini sadece 6 milyon dolarlık eğitme iddiası gerçekçi görünmüyor. Bu rakam sadece eğitim öncesi GPU kullanımının maliyetini ifade eder ve araştırma giderleri, model iyileştirme, veri işleme veya genel altyapı maliyetlerini açıklamaz.
Deepseek, kuruluşundan bu yana AI gelişimine 500 milyon doların üzerinde yatırım yaptı. Bununla birlikte, bürokrasi ile yüklenen daha büyük şirketlerin aksine, Deepseek'in kompakt yapısı AI yeniliklerini aktif ve etkili bir şekilde uygulamasını sağlar.
Resim: ensigame.com
Deepseek örneği, iyi finanse edilen bağımsız bir AI şirketinin endüstri liderleriyle rekabet edebileceğini göstermektedir. Bununla birlikte, uzmanlar şirketin başarısının büyük ölçüde milyarlarca yatırım, teknik atılımlar ve güçlü bir ekipten kaynaklandığını vurgularken, AI modelleri geliştirmek için "devrimci bir bütçe" iddiaları biraz abartılıdır.
Yine de, rakiplerin maliyetleri önemli ölçüde daha yüksek. Örneğin, model antrenman maliyetini karşılaştırın: Deepseek R1'e 5 milyon dolar harcadı, ChatGpt4o ise 100 milyon dolara mal oldu.
-
free Girls chatSosyal çevrenizi genişletmek ve çevrimiçi yeni arkadaşlıklar kurmak ister misiniz? Ücretsiz Kızlar Sohbet Uygulaması Gitme Çözümünüzdür! Bu uygulama, Hindistan, Pakistan ve Bangladeş dahil olmak üzere çeşitli ülkelerden kızlarla etkileşime girebileceğiniz çeşitli sohbet odaları sunmaktadır. M'de olsanız da
-
luvdy - Anonymous Dating Among FriendsHassas dostluk ve romantizm dengesinde gezinmek zor olabilir, özellikle de bir arkadaşa aşık olduğunuzda, ancak duygularından emin olmadığınızda. Bu duyguları gizli ve güvenli bir şekilde keşfetmenize yardımcı olmak için tasarlanmış yenilikçi çözüm olan ** LUVDY - ANONYMOUS arkadaşları ** arasında. İle
-
ALGERIA DATING CHATCezayir'den bekar erkek ve kadınlarla tanışmaya istekli misiniz? Cezayir Dating sohbet uygulamasıyla mükemmel bir çözümü keşfedin! Bu platform, geniş bir Cezayir single topluluğuyla bağlantı kurmanıza yardımcı olmak için tasarlanmış güvenli ve kullanımı kolay bir ortam sunar. Profilinizi ayarlamak tamamen ücretsiz ve S
-
Alimentaria & HOSTELCOResmi mobil uygulama ile yaklaşan Alimentaria & Hostelco ticaret fuarlarındaki deneyiminizi geliştirmeye hazır olun. Bu güçlü araç, katılımcı şirketler, sergilenen ürünleri ve TH hakkında ayrıntılı bilgi bulabileceğiniz katılımcıların kataloğunda zahmetsizce gezinmenizi sağlar.
-
Fruzo Chat, Flirt & Dating AppGeleneksel tanışma uygulamalarında sonsuz kaydırma ve monoton metin konuşmalarından bıktınız mı? Fruzo Chat, Flirt & Dating uygulamasıyla yeni insanlarla tanışma yaklaşımınızda devrim yaratmanın zamanı geldi! Bu son teknoloji sosyal platform, sizi canlı görüntülü sohbetin Forma için Anahtar olduğu bir dünyaya tanıtır
-
Teething CalendarDışarıdaki tüm özenli ebeveynler için, diş çıkarma takvimi, küçük çocuğunuzun birincil diş patlamasını takip etmek için mükemmel bir arkadaştır. Bu kullanıcı dostu takvim, her diş görünümünün zamanlamasını kolayca belgelemenize ve izlemenize, patlama sırasını izlemenize ve