1. Главная
  2. Руководства

Бесплатны даже платные нейросети: обзор сервиса LMArena.ai


Нейросети активно развиваются, и многие пользователи применяют их ежедневно для различных целей: от поиска нужной информации до выполнения рабочих задач. Особенно популярны языковые модели, но с некоторыми из них могут возникнуть проблемы, особенно для российских пользователей. Например, ChatGPT и Claude.ai недоступны для пользователей с российскими IP-адресами, а для регистрации необходимы иностранные номера. 

В материале разберем платформу LMArena.ai, которая открывает доступ практически ко всем современным языковым моделям совершенно бесплатно. 

Что такое LMArena.ai 

LMArena.ai — это открытая платформа для краудсорсингового тестирования и сравнения больших языковых моделей (LLM), созданная исследователями из UC Berkeley SkyLab. Пользователи могут взаимодействовать с различными AI-моделями, сравнивать их ответы и вносить свой вклад в формирование рейтинга моделей на основе собранных голосов.

Простыми словами: благодаря LMArena.ai можно воспользоваться даже старыми версиями нейросетей, а также моделями, которые доступны лишь для подписчиков платных тарифов.

Как пользоваться LMArena

На платформе доступны следующие разделы: ⚔️ Arena (battle), ⚔️ Arena (side-by-side), 💬 Direct Chat, 🏆 Leaderboard, 🎯 Prompt-to-Leaderboard, 🔍 Arena Explorer. Рассмотрим каждый из них более подробно.

⚔️ Arena (battle)

Здесь на ваш запрос одновременно формируют ответ сразу две нейросети. Причем вы заранее не знаете, какие именно чат-боты используются. Уже после ответа система предложит выбрать наиболее подходящий вариант, и потом вы узнаете названия нейросетей.

LMArena AI Arena (battle)

Для запуска новой случайной пары нейросетей необходимо нажать на кнопку 🎲 New Round.

New round

Также есть возможность перейти к генерации изображений, где две случайные ИИ-модели одновременно создают картинки. Для перехода в этот режим нажмите на 🎨 Text2Image в нижней части экрана.

режим Text2Image

Вы можете выбрать понравившийся вариант изображения и тогда узнаете названия нейросетей. Для повторной генерации запроса нажмите 🔄 Regenerate, для сохранения — 📷 Share. Для генерации случайного изображения доступна кнопка 🔮 Surprise me.

Еще один режим в Arena — это 🐙 RepoChat. Здесь вы можете добавить ссылку на репозиторий нейросети на GitHub и запустить ее, чтобы сравнить ответ с другой случайно выбранной нейросетью.

режим RepoChat

⚔️ Arena (side-by-side)

В этом режиме пользователи не ограничены одним сообщением: диалог не прерывается. Вы можете выбрать две модели нейросетей, которые одновременно будут генерировать ответы. Для выбора чат-ботов нажмите на стрелочки выше форм с ответами. На данный момент доступно около 100 моделей.

режим Arena (side-by-side)

Для очистки диалогов выбранных моделей нажмите на кнопку 🗑️ Clear history. 🎲 Random Example — случайный промпт.

Random Example

💬 Direct Chat

Direct Chat подходит для выполнения различных задач, связанных с текстом. Функционал работы с изображениями недоступен, поскольку он пока появился только в Arena (battle).

Direct Chat

🏆 Leaderboard

🏆 Leaderboard — раздел с пользовательскими рейтингами нейросетей. Здесь сформированы таблицы по разным признакам, включая язык, категорию задач, лицензии моделей и их разработчиков.

Таблица содержит следующие столбцы:

  • Rank (UB) — место модели в рейтинге;
  • Delta — изменение позиции модели в сравнении с предыдущим обновлением;
  • Model — название модели;
  • Arena Score — итоговый балл, рассчитанный на основе пользовательских голосов;
  • 95% CI — доверительный интервал оценки;
  • Votes — количество голосов, полученных моделью;
  • Organization — компания-разработчик модели;
  • License — тип лицензии (Proprietary — закрытая, MIT — открытая и т. д.).

Рейтинг обновляется динамически на основе пользовательского голосования.

🎯 Prompt-to-Leaderboard (P2L)

Этот раздел представляет собой интерфейс для генерации рейтинговых таблиц на основе введенных запросов.

Доступные режимы: 

  • Prompt-specific Leaderboard — генерация рейтинговой таблицы на основе конкретного запроса;
  • P2L Explorer — исследование возможностей P2L;
  • P2L Router Chat — чат для взаимодействия с P2L.

Prompt-to-Leaderboard

🔍 Arena Explorer

🔍 Arena Explorer — интерфейс с интерактивными диаграммами, который визуализирует различные категории запросов, сгруппированных по темам. Вы можете переключаться между статистикой языковых моделей, моделей для генерации изображений и написанием кода.

Arena Explorer

Parameters

При работе с текстовыми моделями ниже формы с ответами есть блок Parameters. Настройки, которые вы видите на изображении, относятся к параметрам генерации текста для чат-бота. Эти параметры позволяют контролировать поведение модели при генерации ответов.

  1. Temperature определяет степень случайности в генерации текста. Чем выше значение температуры, тем более разнообразными и неожиданными будут сгенерированные ответы. При низкой температуре модель будет выбирать наиболее вероятные слова, что может привести к предсказуемым и менее творческим ответам.
  2. Top P позволяет управлять балансом между разнообразием и качеством генерируемого текста. Когда Top P равен 1 — это означает, что все возможные варианты слов рассматриваются, что аналогично использованию всех вероятностей без ограничений.
  3. Max output tokens определяет максимальное количество токенов (слов или частей слов) в сгенерированном ответе. Установка этого значения помогает контролировать длину ответа, чтобы он не был слишком длинным или слишком коротким.

Возможные проблемы и их решения

Иногда система вместо генерации ответа сообщает, что превышено количество запросов за час. В таком случае нужно подождать или переключиться к другим моделям.

Также система может сообщить, что превышен суточный лимит запросов от одного пользователя. В этом случае нужно переключиться на другую модель или сменить IP-адрес (браузер менять не обязательно, просто смените IP и обновите страницу).

Итоги

LMArena.ai — полезная платформа, которая предоставляет доступ ко всем популярным моделям нейросетей. С недавнего времени появилась возможность работать с моделями для генерации изображений, но пока такой функционал доступен лишь в разделе Arena (battle). Вы можете использовать чат-боты для рабочих задач или чтобы протестировать модель и купить платный тариф в дальнейшем.


Комментарии