Яндекс

Яндекс открывает исходный код YTsaurus — своей главной платформы для работы с большими данными

Яндекс опубликовал исходный код YTsaurus. Это платформа для хранения и обработки больших данных, с которой работает большинство сервисов Яндекса.

Платформа подходит для широкого круга задач, от аналитики до обучения сложных моделей с миллиардами параметров. Например, Поиск строит с помощью YTsaurus поисковый индекс, а беспилотные автомобили используют платформу, чтобы обрабатывать данные о поездках и улучшать свои алгоритмы. YTsaurus управляет суперкомпьютерами Яндекса, распределяя нагрузку так, чтобы их вычислительные мощности использовались наиболее эффективно.

Максим Бабенко,
руководитель отдела технологий распределённых вычислений

Яндекс ведёт разработку YTsaurus — или YT, как мы называем её внутри — с 2010 года. Мы начали строить собственную экосистему для больших данных, потому что ни одно из имевшихся на рынке решений не удовлетворяло всем нашим требованиям. Сейчас YTsaurus — один из ключевых элементов внутренней инфраструктуры Яндекса. Над платформой работают десятки разработчиков, и её возможности постоянно расширяются.

YTsaurus — отказоустойчивая и легко масштабируемая платформа. В Яндексе она развёрнута на десятках тысяч серверов и обрабатывает эксабайты данных; с ней работает каждый второй сотрудник компании. YTsaurus можно использовать как классическую MapReduce-систему, при этом она поддерживает и другие популярные подходы к обработке данных. Например, у неё есть интеграции с ClickHouse и Apache Spark. Подробнее о возможностях YTsaurus — на Хабре.

Алексей Башкеев,
руководитель Yandex Cloud

Платформа YTsaurus отлично зарекомендовала себя в Яндексе. Теперь мы сделали её доступной и за его пределами. Наибольшую пользу YTsaurus может принести крупным компаниям, которые обрабатывают гигантские объёмы данных на тысячах серверов в условиях постоянно возрастающей нагрузки. Мы уверены, что публикация кода выведет платформу на новый виток развития, как это уже было с другими нашими продуктами.

Исходный код и документация YTsaurus доступны на GitHub. Код распространяется под лицензией Apache 2.0. Использовать платформу или доработать её под себя может любой желающий.

Контакты:

Пресс-служба компании «Яндекс»
Елизавета Ивтушок
Тел.: +7 495 739-70-00
Электронная почта: pr@yandex-team.ru 

МКПАО «Яндекс»

Основной офис в России: Москва

Основной офис
119021, Москва, ул. Льва Толстого, 16
Коммерческий отдел
Отдел по связям с инвесторами
Отдел по связям с общественностью
Корпоративный секретарь
Отдел устойчивого развития