Появилась единая платформа обработки данных для бизнеса, причем любого объема
В 2025 году Yandex B2B Tech запускает единую платформу обработки данных любого объема для бизнеса.
Yandex B2B Tech открывает бизнесу доступ к платформе собственной разработки для хранения и обработки больших данных YTsaurus. С ее помощью можно анализировать эксабайты данных в компаниях и обучать сложные модели машинного обучения с миллиардами параметров.
Сообщается, что YTsaurus можно использовать как в облаке, так и на инфраструктуре заказчика — в формате on-premises. В облаке решение доступно как управляемый сервис: то есть поддержкой платформы будут полностью заниматься специалисты Яндекса. Для раннего доступа к YTsaurus необходимо подать заявку.
В Яндексе YTsaurus разрабатывают с 2010 года. Сейчас платформу используют для хранения данных большинства сервисов, обучения YandexGPT и других нейросетей, задач поискового индекса.
Например, Яндекс Маркет с помощью платформы разрабатывает систему промоакций, а автономный транспорт обрабатывает данные о поездках и улучшает алгоритмы.
Платформа также доступна в опенсорсе — ее уже применяют большие технологические компании в России и за рубежом.
YTsaurus подходит как для обработки небольшого количества данных, так и для вычислений с миллионом CPU и десятками тысяч GPU. Платформу можно использовать и как классическую MapReduce-систему, и применять внутри не другие популярные решения для обработки данных, в том числе ClickHouse и Apache Spark.
C помощью YTsaurus можно строить корпоративные хранилища данных, ETL-системы, обрабатывать как структурированные, так и неструктурированные или полуструктурированные данные, в том числе логи или финансовые транзакции.
«Для нас важно, чтобы у компаний были сервисы и инструменты для работы с данными под любой сценарий. Для этого мы, с одной стороны, создаем и развиваем сервисы для облачной платформы на базе открытых решений, а с другой — тестируем и адаптируем для бизнеса собственные наработки, такие как платформы YTsaurus и YDB и BI-решение DataLens, которые успешно применяются во внутренней инфраструктуре компании», — заявил Иван Пузыревский, технический директор платформы Yandex Cloud.
Он добавил, что на конференции Data& ML2Business компания не только представила YTsaurus для бизнеса, но и объявила об обновлении других решений для работы с данными. Для компаний стали доступны новые управляемые сервисы на базе решений с открытым исходным кодом: Yandex Managed Service for Spark и сервис управления распределенным аналитическим массивно-параллельным движком обработки больших данных Trino в облачной инфраструктуре. В Yandex DataLens стал доступен Editor — редактор для кастомизации графиков и таблиц с помощью JavaScript, а также появилась публичная витрина готовых примеров дашбордов, чартов и кастомизаций для аналитики данных.
Эксклюзивные материалы, актуальные комментарии и ответы экспертов в Telegram-канале Клерк.Премиум.
Читать далее https://www.klerk.ru/buh/news/649419/
Мы в социальных сетях