Яндекс обучил нейросеть на базе YandexGPT самостоятельно проверять сгенерированные тексты на наличие галлюцинаций. Благодаря новому подходу удалось в шесть раз сократить количество неточностей в созданных нейросетью кратких описаниях мест и достопримечательностей в Картах. Кроме того, переход на обновлённую модель позволил использовать меньше вычислительных мощностей и удешевить её работу.
Как нейросеть готовит краткие описания локаций
YandexGPT пишет краткие описания в несколько этапов. Сначала модель анализирует большое количество отзывов на локацию, а также заполненную владельцем карточку организации в Картах. Она объединяет важное для посетителей (то, о чём они пишут чаще всего) и особенности места в несколько предложений. Затем модель убирает из текста лишнее, например, слишком общие формулировки, и форматирует описание в заданной стилистике и структуре.
Журнал «ТЕХНО» — о том, почему случаются галлюцинации у языковых моделей
Иногда при подготовке описаний нейросеть может добавить несуществующие детали — это называется галлюцинации. Поэтому на финальном этапе она оценивает написанное на правдивость — сравнивает свои ответы с отзывами, на которые опиралась, и удаляет «выдуманное».
Ранее за создание кратких описаний в Картах отвечали пять различных моделей — каждая из них выполняла определённую функцию, например, расставляла запятые или фильтровала отзывы по полезности. Теперь со всеми этими задачами справляется одна обновлённая модель, поэтому для её работы требуется меньше вычислительных мощностей. Переход на новую версию позволил повысить правдивость, точность и качество кратких описаний на 90%. Это решение может быть полезно и другим сервисам компании, которые используют языковую модель для кратких пересказов больших объёмов текстов.
Компании удалось повысить качество работы нейросети в том числе и благодаря дообучению. Яндекс расширил датасет эталонными примерами генераций предыдущих моделей — так модель на базе YandexGPT научилась создавать более полезные описания. Например, теперь при подготовке текстов она реже использует общие фразы, такие как «вкусная еда» или «приятная атмосфера».
Изучить краткие описания достопримечательностей и заведений и, например, выбрать место для встречи с друзьями, можно в карточке организации в блоке «Коротко о месте» и в разделе «Поток» режима персональных рекомендаций «Идеи». В Картах доступно уже несколько сотен тысяч карточек с кратким описанием.
Больше изображений — на Яндекс Диске.
О YandexGPT
YandexGPT — нейросеть, которая умеет создавать и перерабатывать тексты, предлагать новые идеи и учитывает контекст беседы с пользователем. Она доступна в режиме Алисы «Давай придумаем». Также YandexGPT кратко пересказывает тексты статей из интернета в Яндекс Браузере и на 300.ya.ru, обобщает информацию из отзывов о товарах в Поиске и на Маркете, помогает создавать описания товаров продавцам Маркета и не только. Нейросеть можно протестировать в собственном бизнесе — для этого нужно оставить заявку на доступ к API.
О Яндекс Картах
Яндекс Карты — персональное приложение к городу, с помощью которого можно находить места и строить до них маршруты на любом транспорте или пешком. В Картах всегда можно узнать актуальное расписание общественного транспорта и посмотреть онлайн, где едет нужный трамвай, автобус или троллейбус. А прямо в приложении можно записываться в салоны красоты, бронировать столики и решать другие повседневные задачи. Каждый месяц веб-версией и мобильным приложением сервиса пользуются 90 миллионов человек.
Пресс-служба компании «Яндекс»
Евгений Привалов
Тел.: +7 495 739-70-00
Электронная почта: pr@yandex-team.ru