Дом > Новости > DeepSeek AI: Не доступно, стоит 1,6 миллиарда долларов на разработку

DeepSeek AI: Не доступно, стоит 1,6 миллиарда долларов на разработку

Apr 07,25(21 часов назад)
DeepSeek AI: Не доступно, стоит 1,6 миллиарда долларов на разработку

Тем не менее, это все еще дешевле, чем его конкуренты.

Новый чат -бот из DeepSeek предстал перед мне с этим интригующим описанием:

Привет, я был создан, чтобы вы могли спросить что угодно и получить ответ, который может даже удивить вас.

Сегодня искусственный интеллект, разработанный DeepSeek, стал грозным конкурентом на рынке, в частности, способствуя одному из крупнейших падений цен на акции Nvidia.

Тест DeepSeek Изображение: Ensigame.com

Что отличает эту модель, так это его инновационная архитектура и методы обучения. Использует несколько передовых технологий:

Multi-Token Preglice (MTP): вместо прогнозирования одного слова за раз модель прогнозирует несколько слов одновременно, анализируя различные части предложения. Этот подход значительно повышает как точность, так и эффективность модели.

Смесь экспертов (MOE): эта архитектура использует различные нейронные сети для обработки входных данных. Технология ускоряет обучение ИИ и повышает производительность. В Deepseek V3 используются 256 нейронных сетей, причем восемь активируются для каждой задачи обработки токенов.

Многопользовательское скрытое внимание (MLA): этот механизм помогает сосредоточиться на наиболее значимых частях предложения. MLA извлекает ключевые детали из фрагментов текста неоднократно, а не один раз, снижая вероятность отсутствия важной информации. Благодаря этому ИИ с большей вероятностью захватит важные нюансы во входных данных.

Выдающийся китайский стартап Deepseek утверждал, что создал конкурентную модель ИИ с минимальными затратами, заявив, что они потратили всего 6 миллионов долларов на обучение мощной нейронной сети Deepseek V3 и использовали только 2048 графических процессоров.

DeepSeek v3 Изображение: Ensigame.com

Тем не менее, аналитики полуанализа обнаружили, что DeepSeek управляет большой вычислительной инфраструктурой, содержащей приблизительно 50 000 графических процессоров Nvidia Hopper. Это включает в себя 10 000 единиц H800, более 10 000 продвинутых H100 и дополнительные партии графических процессоров H20. Эти ресурсы распределены по нескольким центрам обработки данных и используются для обучения, исследований и финансового моделирования искусственного интеллекта.

Общая инвестиция компании в серверы составляет около 1,6 млрд. Долл. США, а эксплуатационные расходы оцениваются в 944 млн. Долл. США.

DeepSeek является дочерней компанией китайского хедж-фонда High-Flyer, который отключился от стартапа как отдельное подразделение, ориентированное на технологии искусственного интеллекта в 2023 году. В отличие от большинства стартапов, которые арендуют вычислительную власть от облачных провайдеров, Deepseek владеет своими собственными центрами обработки обработки данных, предоставляя ему полный контроль над оптимизацией модели ИИ и обеспечивая более быстрое реализацию инноваций. Компания остается самофинансированной, что положительно влияет на его гибкость и скорость принятия решений.

DeepSeek Изображение: Ensigame.com

Более того, некоторые исследователи в DeepSeek зарабатывают более 1,3 миллиона долларов в год, привлекая лучших талантов от ведущих китайских университетов (компания не нанимает иностранных специалистов).

Даже учитывая это, недавняя претензия Deepseek о обучении своей последней модели всего за 6 миллионов долларов кажется нереальным. Эта цифра относится только к стоимости использования графических процессоров во время предварительного обучения и не учитывает расходы на исследования, уточнение модели, обработку данных или общие затраты на инфраструктуру.

С момента своего создания DeepSeek инвестировала более 500 миллионов долларов в разработку ИИ. Однако, в отличие от более крупных компаний, обремененных бюрократией, компактная структура Deepseek позволяет ей активно и эффективно внедрять инновации в области ИИ.

DeepSeek Изображение: Ensigame.com

Пример DeepSeek демонстрирует, что хорошо финансируемая независимая компания ИИ может конкурировать с лидерами отрасли. Тем не менее, эксперты подчеркивают, что успех компании в значительной степени связан с миллиардами инвестиций, технических прорывов и сильной командой, в то время как заявления о «революционном бюджете» для разработки моделей ИИ несколько преувеличены.

Тем не менее, затраты конкурентов остаются значительно выше. Например, сравните стоимость модельного обучения: Deepseek потратил 5 миллионов долларов на R1, а Chatgpt4o стоила 100 миллионов долларов.

Обнаружить
  • Mercedes me connect (USA)
    Mercedes me connect (USA)
    Опыт беспрепятственный подключение с вашим автомобилем Mercedes-Benz через приложение Mercedes-Benz (США/CA), адаптированное для владельцев модельного года 2019 года или новых транспортных средств. Это приложение дает вам возможность контролировать основные детали, такие как пробег, уровни топлива и даже определять местоположение вашего автомобиля на карте,
  • Textgram -Text on Photo,Story
    Textgram -Text on Photo,Story
    С Textgram - Text on Photo, Story, вы можете преобразовать свои сообщения в увлекательные визуальные эффекты, добавив текст к своим фотографиям, создавая уникальные дизайны и поделившись своим творчеством с друзьями и последователями. Стремитесь ли вы создать привлекательный пост в социальных сетях, спроектируйте профессиональную муху
  • Nova tv movies and tv shows
    Nova tv movies and tv shows
    Вы устали бесконечно прокручивать различные потоковые услуги, чтобы найти идеальный фильм или телешоу? Посмотрите не дальше, чем приложение Nova TV и телешоу! Это бесплатное, неограниченное приложение фильмов предлагает вам доступ к обширному спектру контента, от вечной классики до последних сериалов. С т
  • PolishHearts Tindo version
    PolishHearts Tindo version
    Хотите связаться с польскими людьми за границей? Посмотрите не дальше, чем самое популярное в мире приложение для встречи с другими полюсами - Plackhearts Tindo версия! Если вы ищете отношения, дружбу или случайную дату, это приложение заставило вас покрыть вас. С множеством матчей, доступных каждый
  • Мой Beeline (Казахстан)
    Мой Beeline (Казахстан)
    Без особых усилий управлять и контролировать свои сервисы Beeline с помощью приложения Momotй Beeline (kaзaхpanan). Этот мощный инструмент позволяет вам переключать тарифы, отслеживать свои расходы, переводить средства и легко выплачивать непосредственно из вашего баланса. С безопасными и быстрыми параметрами входа в систему, оставаться подключенным - это просто
  • My Movies 3 - Movie & TV List
    My Movies 3 - Movie & TV List
    Организация вашей коллекции фильмов и сериалов никогда не была более упрощенной, чем в приложении My Movies 3 - Movie & TV. Прощайтесь с утомительным вводом данных и охватите эффективность партийного сканирования, что позволяет вам быстро индексировать всю свою коллекцию. С обширной базой данных продолжение