В январе 2025 года китайская компания DeepSeek выпустила на рынок третью версию своей языковой модели. Через неделю после запуска новый чат-бот обогнал ChatGPT по количеству загрузок из AppStore в США, Англии и Китае. Также, по мнению многих авторитетных изданий, выход столь дешевой и в то же время конкурентной языковой модели мог стать причиной резкого падения акций некоторых технологических компаний.
- История создания DeepSeek
- Отличия DeepSeek от других ИИ
- Что умеет DeepSeek
- Как пользоваться DeepSeek в России
- Заключение
История создания DeepSeek
В 2015 году несколько китайских инженеров основали компанию HighFlyer. Она специализировалась на использовании машинного обучения для торговли акциями. Через 4 года была создана дочерняя компания HighFlyer-AI, которая занималась исследованием работы алгоритмов ИИ. В 2023 году сооснователь HighFlyer Лян Вэньфэн решил полностью сменить вектор развития и сосредоточиться на создании систем общего ИИ, что привело к появлению на рынке компании DeepSeek. В ноябре 2023 года компания представила первую языковую модель — DeepSeek Coder. Она предназначалась для написания кода и не воспринимала естественные языки.
Летом 2024 года на рынок вышла DeepSeek-V2. Эта нейросеть была основана на архитектуре Mixture-of-Experts, что позволило существенно сократить расходы на ее обучение. Выпуск модели спровоцировал начало гонки по удешевлению стоимости разработки ИИ в Китае. Технологические гиганты, такие как Baidu и Alibaba, на этом фоне снизили цены на свои нейросети. В ноябре 2024 года компания запустила DeepSeek-V3. По оценкам независимых экспертов, новая версия чат-бота превзошла по многим параметрам Qwen 2.5 и Llama 3.1.
Наконец, в январе 2025 года китайская компания представила свою самую технологичную разработку — DeepSeek R1.
Главная причина, почему гиганты индустрии подняли шумиху вокруг новой нейросети, — низкая стоимость разработки. Создатели DeepSeek заявили, что на ее создание было потрачено всего около $6 млн. Для сравнения, новая версия ChatGPT-4 обошлась компании OpenAI более чем в $100 млн. По оценкам экспертов, примерная стоимость обработки одного миллиона токенов в DeepSeek обходится в $2, тогда как расходы OpenAI составляют около $60. Именно совокупность этих факторов привела к обвалу акций компаний, которые так или иначе связаны с индустрией искусственного интеллекта. Так, 27 января акции корпорации Nvidia упали за сутки на 15%, что привело к потере около $600 млрд капитализации. Это также коснулось одного из крупнейших производителей чипов ASML Holding NV — падение более чем на 10%, и Nasdaq 100, который потерял триллион долларов.
Даже Дональд Трамп отреагировал на эти события и назвал DeepSeek тревожным звонком для многих крупных американских технокомпаний.
Отличия DeepSeek от других ИИ
Новая ИИ-модель от DeepSeek с легкостью выполняет различные типы задач: от генерации и перевода простых текстов до программирования и создания сложных аналитических материалов. Согласно результатам исследования разработчиков, модель по многим параметрам превзошла своих главных конкурентов — GPT-4 и Claude-3.5.
Одна из главных особенностей DeepSeek — открытый исходный код. Мастодонты индустрии — OpenAI, GoodleDeep, Meta — держат в секрете свои наработки, в то время как DeepSeek сделала внутреннее устройство нейросети общественным достоянием. Любой пользователь может адаптировать под себя и даже улучшить алгоритм работы нейросети.
Однако главные особенности новой нейросети выделяются тремя технологиями, которые использовались для ее обучения:
- MTP — система, которая помогает ИИ предсказывать сразу несколько слов вместо одного, что позволяет увеличить скорость и точность ответов.
- MOE — технология, позволяющая увеличить производительность и снизить потребность в вычислительных ресурсах. Суть архитектуры в использовании сразу нескольких заранее адаптированных нейросетей для обучения и анализа входных данных. На момент выхода статьи в базе DeepSeek более 200 таких нейронок.
- MLA — механизм, который помогает нейросети вычленять самые важные части предложения. Его главная особенность в том, что он извлекает ключевые слова не один, а несколько раз. Такой подход позволяет повысить вероятность, что ИИ поймет основной смысл текста.
Из явных недостатков можно выделить цензурирование некоторых ответов, которые напрямую связаны с действующей властью в Китае. Один из журналистов New York Times задал чат-боту несколько неудобных вопросов о действиях китайского правительства, на которые так и не смог получить внятного ответа.
Разберем преимущества DeepSeek перед основными конкурентами:
- Более совершенные поисковые алгоритмы. Нейросеть быстрее и качественнее справляется с задачами по поиску информации в открытых источниках.
- Полноценная бесплатная версия. DeepSeek доступен бесплатно для всех желающих. В то же время большинство главных конкурентов предоставляют пробный период с урезанными функциями, как, например, ChatGPT.
- Качественная обработка PDF-файлов. Чат-бот способен глубоко анализировать документы в формате PDF, извлекать ключевые моменты и делать на их основе выводы.
- Мультимодальность. Пожалуй, это одна из самых главных фишек нейросети. DeepSeek поддерживает множество разных типов данных и медиа, что делает ее почти универсальным инструментом.
Что умеет DeepSeek
Новейшая ИИ-модель от DeepSeek может выполнить следующий ряд задач:
- расшифровывать диаграммы, схемы и изображения;
- искать актуальную информацию в открытых источниках;
- решать сложные вычислительные задачи;
- писать код и анализировать его на наличие ошибок;
- генерировать изображения исходя из промптов.
В DeepSeek, помимо обычного режима, есть также два дополнительных:
- DeepThink. Нужен для решения сложных вычислительных или логических задач, а также при анализе огромного объема информации или создании длинных текстов. DeepSeek в этом режиме активирует более глубокий анализ входных данных.
- Search. Нейросеть обучена на данных, актуальных на лето 2024 года, поэтому, если вам нужна более свежая информация, лучше использовать этот режим. При активации этой функции DeepSeek проверит открытые источники и выдаст подходящий ответ. Также каждое утверждение он снабдит ссылкой на первоисточник и даже по запросу предоставит отчет о посещенных сайтах.
Анализ файлов и документов. DeepSeek умеет распознавать разные форматы текстовых документов общим объемом до 100 МБ. Пользоваться этой функцией просто: загружаете файл и задаете вопрос, исходя из его содержимого.
Как пользоваться DeepSeek в России
Чтобы начать пользоваться чат-ботом, переходим на официальный сайт и жмем на кнопку Start Now.
Далее проходим регистрацию по электронной почте или номеру телефона и подтверждаем аккаунт. Никаких дополнительных манипуляций проводить не нужно — полный функционал чат-бота доступен бесплатно для всех пользователей.
У DeepSeek также есть мобильное приложение. Для быстрого перехода на страницу скачивания наведите курсор на блок Get DeepSeek App и отсканируйте QR-код.
Теперь протестируем возможности нового чат-бота. Чтобы получить максимально точный ответ на ваш вопрос или задачу, нужно однозначно сформулировать промпт. Промпт — это запрос или набор инструкций, которые юзер передает нейросети для выполнения определенной задачи. Попробуем дать DeepSeek задачу из мира арбитража. Запрос: «Напиши скрипт для уникализации видео на основе FFMPEG. Сделай так, чтобы скрипт чистил метаданные и генерировал случайные параметры, добавлял шум на видео, изменял раскадровку на случайное значение и отзеркаливал ролик».
На выходе мы получили полноценный скрипт. Чат-бот учел все составляющие запроса и даже пошагово объяснил, какая конкретная строка кода отвечает за изменение каждого параметра.
Заключение
Выход новой версии языковой модели от DeepSeek встряхнул индустрию ИИ. Главной причиной всех событий послужил тот факт, что китайская компания разработала весьма серьезного конкурента ChatGPT, потратив при этом сущие копейки по меркам традиционной разработки.
Многие инвесторы задумались о том, стоит ли вкладывать в Кремниевую долину сотни миллионов долларов, когда есть Китай, который в условиях ограничений и санкций может с низкими затратами выпускать столь технологичные продукты.