Технология, разработанная международным коллективом с участием МФТИ, не требует дорогих лидаров или ручной разметки. Она использует модель Depth Anything V2, которая оценивает относительную глубину по одному изображению, учитывая тени, перспективу и перекрытия. Алгоритм обучается, сопоставляя предсказания стереосистемы с подсказками «наставника».
Продвинутое машинное зрение работает в три этапа: проверка пикселей, поиск «маяков» для коррекции ошибок и сглаживание для построения контуров. Un-ViTAStereo показала превосходство над аналогами, снизив грубые ошибки на бенчмарке KITTI 2015 до 5%.
В будущем планируется создание самообучающейся нейросети, адаптирующейся к различным средам, и использование лидарных измерений для повышения точности технологии.















