Нейросети Яндекс Драйва проверяют машины вместо людей
Нейросети берут управление качеством автопарка в свои руки
В Яндекс Драйве произошёл технологический прорыв: сервис полностью обновил систему фотоконтроля автомобилей, передав ключевые процессы комплексу нейросетей. Теперь именно искусственный интеллект принимает решения о том, когда машина должна отправиться на мойку или нуждается в ремонте.
Ежедневно система обрабатывает более 150 тысяч фотографий автомобилей — в два с половиной раза больше, чем удавалось прежнему алгоритму. Такой объём позволяет сервису реагировать на состояние автопарка в режиме реального времени, обеспечивая пользователям чистые и исправные машины.
«Мы стремимся к тому, чтобы каждая поездка начиналась с ощущения нового автомобиля», — отмечают в команде Яндекс Драйва. Новая архитектура фотоконтроля стала ключевым шагом в этом направлении.
От ML-фильтрации к полноценной автоматизации
Ранее решения о ремонте и мойке принимались гибридной системой: классический ML-фильтр отсеивал проблемы, а модераторы вручную проверяли спорные случаи. Такой подход требовал времени и создавал нагрузку на специалистов.
Теперь за контроль отвечает связка нейросетевых моделей — визуального трансформера (ViT) и визуально-языковой модели (VLM). Они вместе анализируют состояние 12 тысяч автомобилей ежедневно, обеспечивая непрерывный мониторинг автопарка.
Современные модели обработки изображений способны выявлять мельчайшие дефекты, которые человеческому глазу порой сложно заметить. ViT фиксирует визуальные изменения, а VLM интерпретирует их, подсказывая системе, насколько серьёзно повреждение или загрязнение.
Как работает фотоконтроль: от снимка до решения
Процесс начинается в момент аренды: приложение просит пользователя сфотографировать автомобиль и отметить возможные повреждения. Далее вступают в работу обученные нейросети.
Яндекс Драйв создал собственные размеченные датасеты, включающие тысячи примеров царапин, вмятин, сколов и иных дефектов, а также множество вариантов загрязнений. Благодаря этому нейросети не просто выявляют проблему, но и оценивают её значение.
Для уровня загрязнения введена шкала от 1 до 100. Чем выше балл, тем выше вероятность, что автомобиль скоро отправят на мойку. На показатель влияют сезон, стиль предыдущих поездок и общее состояние автомобиля. Такой подход исключает субъективность — решение принимает математически обоснованный алгоритм.
VLM повышает точность до 99,9%
Ключевым элементом стала визуально-языковая модель (VLM). Она не только подтверждает результаты ViT, но и уточняет их. Модель анализирует контекст изображения, понимает описания и корректно классифицирует каждый вид дефекта.
Если визуальный трансформер распознаёт царапину, то VLM определяет её глубину, протяженность и потенциальную опасность для эксплуатации. Благодаря этой «двухэтажной» архитектуре точность фиксации повреждений достигла впечатляющих 99,9%.
Фактически система работает как опытный эксперт-техник, способный просматривать тысячи снимков без утомления и ошибок.
Смещение фокуса: нейросети — на рутину, люди — на сложные кейсы
Благодаря новой технологии рутинные операции теперь полностью берут на себя нейросети. Модераторы подключаются лишь в тех ситуациях, где требуется нестандартная оценка или человеческая экспертиза.
Такое перераспределение ресурсов ускорило рабочие процессы и снизило нагрузку на сотрудников.
Результаты заметны уже сейчас: количество негативного фидбека на чистоту автомобилей сократилось на 17%. Пользователи чаще получают машины в отличном состоянии, а сервис — стабильность качества автопарка.
Новый этап развития каршеринга
Интеграция нейросетей в фотоконтроль — это шаг к каршерингу будущего, где большинство процессов будет автоматизировано, а качество — предсказуемым и стабильным.
Яндекс Драйв демонстрирует, что технологии компьютерного зрения способны не просто улучшать сервис, но и менять саму модель управления автопарком.
«Мы делаем так, чтобы умный алгоритм работал на комфорт пользователя», — подчёркивают в компании. И новый фотоконтроль — яркое подтверждение того, что эта стратегия уже приносит результаты.

