«Яндекс» выложил в открытый доступ датасет для развития рекомендательных систем
«Яндекс» разработал и выложил в открытый доступ датасет для развития рекомендательных систем. С помощью Yambda исследователи и вузы со всего мира смогут тестировать и улучшать рекомендательные алгоритмы, отметили в «Яндексе»
Ученые «Яндекса» разработали и выложили в открытый доступ один из крупнейших в мире датасетов для развития рекомендательных систем, сообщила Forbes пресс-служба компании.
С помощью Yambda (YAndex Music Billion-interactions DAtaset) исследователи и вузы со всего мира смогут тестировать и улучшать рекомендательные алгоритмы, отметили в «Яндексе».
Датасет Yambda доступен в трех вариантах. Полная версия содержит 5 млрд данных, две уменьшенных — 500 млн и 50 млн. Это позволяет разработчикам и исследователям выбрать вариант, отвечающий их задачам и имеющимся вычислительным ресурсам.
Найти данные датасета можно на HuggingFace, а код для оценки замеров — на GitHub.
Yambda создан на основе обезличенных данных «Яндекс Музыки», но использовать его можно для оценки качества любых рекомендательных систем, так как в их основе лежат общие алгоритмы, отметили в «Яндексе». Yambda включает агрегированные прослушивания, лайки, дизлайки и некоторые характеристики треков, при этом все исключительно числовые, что обеспечивает конфиденциальность.
Рекомендательные алгоритмы помогают людям находить нужные товары, фильмы, музыку и многое другое, напомнил руководитель направления по развитию качества персонализации в «Яндексе» Александр Плошкин. «Доступ к качественным большим данным открывает новые возможности для научных исследований и привлекает к области внимание молодых ученых, заинтересованных в применении машинного обучения для решения актуальных задач», — подчеркнул он.
Ранее представитель «Яндекса» рассказал Forbes о тестировании новой кнопки чекаута в «Поиске». Она позволяет пользователям оформлять заказы на товары в магазинах партнеров прямо из поисковой выдачи без перехода на сторонние сайты. При выборе товара система перенаправит пользователя в предзаполненную форму с данными для доставки, ПВЗ, платежной информацией и с возможностью оформить рассрочку. Пользовательские данные, включая банковские карты, защищены в «Яндекс ID».