BitcoinWorld Грязная работа по обучению роботов: XDOF привлекает $70M для создания конвейеров данных, которые так необходимы лабораториям ИИ Две недели назад OpenAI объявила, что будетBitcoinWorld Грязная работа по обучению роботов: XDOF привлекает $70M для создания конвейеров данных, которые так необходимы лабораториям ИИ Две недели назад OpenAI объявила, что будет

Грязная работа по обучению роботов: XDOF привлекает $70 млн для создания конвейеров данных, которые так нужны ИИ-лабораториям

2026/06/18 00:05
6м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

BitcoinWorld

Грязная работа по обучению роботов: XDOF привлекает 70 млн $ для создания конвейеров данных, которые так нужны лабораториям ИИ

Две недели назад OpenAI объявила о перезапуске своей программы робототехники, закрытой в 2021 году, — очередной сигнал того, что крупнейшие лаборатории ИИ наперегонки учат машины действовать в физическом мире. Но создание способных роботов требует того, чего у индустрии ИИ пока нет в необходимом масштабе: обучающих данных, сопоставимых с теми, что питают языковые модели. Этот пробел порождает новый вид инфраструктурного бизнеса.

В отличие от больших языковых моделей, обученных на огромном массиве общедоступных текстов, роботам нужны данные, фиксирующие физическое взаимодействие, — а таких данных почти не существует. Видео с YouTube и съёмки фрилансеров отличаются низким качеством и плохо согласуются с физическим миром. На сцену выходит XDOF (произносится «экс-дофф») — стартап, сегодня покидающий режим стелс, который делает ставку на то, что следующим главным узким местом в ИИ станут не модели и не чипы, а петля обратной связи данных, необходимая для обучения роботов взаимодействию с физическим миром.

Создание экосистемы данных для физического ИИ

XDOF стремится создать конвейеры данных, инструменты сбора и системы аннотирования, которые передовые лаборатории и компании в области робототехники не могут легко построить самостоятельно. Компания привлекла 70 млн $ от Thrive Capital, Spark Capital, a16z, Lux и WndrCo. Сооснователь и генеральный директор Филипп Ву говорит, что XDOF, насчитывающий около 60 сотрудников, уже работает с 20 клиентами, включая несколько передовых лабораторий ИИ, хотя он не может их назвать.

«Все ведущие лаборатории стремятся заниматься робототехникой, — сказал Ву в интервью. — Мы уже видели, к чему приводит небольшое отставание в гонке языковых моделей… вы не хотите оказаться в ситуации, когда слишком поздно беретесь за эту технологию, а все вокруг понимают, что физический ИИ — это следующий рубеж».

Сам Ву столкнулся с этой проблемой, будучи аспирантом Калифорнийского университета в Беркли, где он занимался обучением роботов навыкам на основе крупномасштабных наборов данных. Была лишь одна проблема. «У нас не было крупномасштабных данных для работы, — сказал он. — Возникла проблема курицы и яйца: сначала нам нужно было собрать данные, прежде чем мы вообще могли задаться вопросом, как обучить базовую модель для робототехники».

Ву и его будущий сооснователь XDOF и Руководитель технологического отдела(CTO) Фред Шэнту работали над проектом GELLO — недорогой системой телеуправления, позволяющей оператору-человеку управлять роботизированной рукой для генерации обучающих данных. «В итоге это стало очень влиятельной работой в области робототехники, потому что у многих людей были схожие потребности и узкие места, и многие начали использовать подобные устройства для сбора данных», — сказал Ву.

Увидев возможность, Ву, Шэнту и третий сооснователь и главный операционный директор Немо Цзинь запустили XDOF в октябре 2024 года, чтобы обеспечить экосистему данных для компаний, разрабатывающих модели робототехники. Понимая, что предоставление данных само по себе может быть тупиковым бизнесом, компания также сосредоточена на очистке данных, инструментарии и аннотировании — создавая самоусиливающуюся петлю обратной связи для тренеров роботов.

Датасет ABC: новый эталон для исследований в области робототехники

В качестве отправной точки компания сотрудничает с исследовательской лабораторией ИИ Калифорнийского университета в Беркли для выпуска того, что, по её мнению, является крупнейшей коллекцией высококачественных обучающих данных для роботов из когда-либо собранных, — под названием ABC. Она включает 130 000 траекторий данных манипуляций робота, 300 часов симуляции и 100 часов оценок. Такие масштабные данные предобучения никогда прежде не были доступны академическому сообществу.

«В области языка, генерации изображений и других сферах мы видели, что когда модели и данные публикуются, сообщество достигает результатов, которых вы не обязательно ожидали бы», — рассказал Bitcoin World Дэвид Макаллистер, аспирант Беркли, помогавший организовать выпуск. Команда уже использовала данные для обучения роботов эталонным задачам, таким как складывание футболок, выравнивание коробок и загрузка AirPods в футляры.

Три уровня сбора данных

Компания планирует работать на трёх уровнях пирамиды данных. Наиболее ценный уровень — данные телеуправления, собранные непосредственно на развёртываемом роботе; следующий — роботы с телеуправлением, собирающие более общие данные, как в случае с GELLO; и наконец «эгоцентрические» данные, собираемые людьми при выполнении повседневных задач, для которых XDOF планирует создать собственные носимые датчики.

«Выбор камеры влияет на качество ваших данных, а это влияет на то, как работает ваш алгоритм отслеживания движений рук, — сказал Ву. — Если с самого начала не продумать аппаратное обеспечение, собранные данные могут иметь очень специфические проблемы, которых вы не предвидели».

Компания планирует нанять и обучить армии телеоператоров и эгоцентрических операторов данных по всему миру — трудоёмкая модель, которая ставит очевидный вопрос: почему крупные лаборатории сами не занимаются этой работой по производству данных?

«Вам нужен склад площадью сотни тысяч квадратных футов с сотнями роботов, — сказал Ву. — Вам нужно обслуживать этих роботов, калибровать их физические параметры и должным образом обучать операторов». Это строительство, требующее сосредоточенности, капитала и операционного масштаба, которые большинство лабораторий ИИ предпочтут передать на аутсорсинг, — именно на этот рынок и делает ставку XDOF.

Почему это важно для индустрии ИИ

Появление XDOF сигнализирует о более широком сдвиге в ландшафте ИИ. По мере того как передовые лаборатории устремляются к физическому ИИ — роботам, способным действовать в неструктурированной человеческой среде, — узкое место в данных становится столь же критическим, как вычислительная мощность или архитектура моделей. Компании, способные предоставить надёжные высококачественные обучающие данные для физического взаимодействия, позиционируют себя как ключевые поставщики инфраструктуры.

Название XDOF — игра слов с робототехническим термином «степени свободы», который описывает количество независимых движений, которые может выполнять робот. Ваша рука — от плеча до запястья — имеет семь степеней свободы. Последний робот компании по производству гуманоидных роботов Figure.AI имеет 30. Буква X в названии компании отражает её амбиции: «Произвольные степени свободы, неограниченное предложение степеней свободы», — говорит Ву.

Заключение

Привлечение 70 млн $ компанией XDOF и объявление о выходе из режима стелс подчёркивают растущее осознание в индустрии ИИ: путь к дееспособному физическому ИИ пролегает через инфраструктуру данных, а не только через улучшение моделей. По мере того как всё больше лабораторий следуют примеру OpenAI в перезапуске программ робототехники, спрос на высококачественные, физически обоснованные обучающие данные будет только усиливаться. XDOF позиционирует себя в центре этого спроса, выстраивая конвейеры, которые могут определить, какие компании преуспеют в гонке за создание роботов, способных по-настоящему работать в реальном мире.

Часто задаваемые вопросы

В1: Что такое XDOF и чем он занимается?
XDOF — это стартап, создающий конвейеры данных, инструменты сбора и системы аннотирования для обучения роботов. Он предоставляет обучающие данные о физическом мире, необходимые лабораториям ИИ для обучения роботов взаимодействию с окружающей средой.

В2: Чем обучающие данные для роботов отличаются от обучающих данных для языковых моделей?
Языковые модели можно обучать на огромных объёмах текста, доступного в интернете. Обучающие данные для роботов должны фиксировать физические взаимодействия — например, захват предметов или складывание одежды, — что требует специализированных методов сбора, таких как телеуправление или носимые датчики.

В3: Сколько финансирования привлёк XDOF и кто инвесторы?
XDOF привлёк 70 млн $ от Thrive Capital, Spark Capital, a16z, Lux и WndrCo. В компании работает около 60 сотрудников, и она уже сотрудничает с 20 клиентами, включая несколько передовых лабораторий ИИ.

Этот материал «Грязная работа по обучению роботов: XDOF привлекает 70 млн $ для создания конвейеров данных, которые так нужны лабораториям ИИ» впервые опубликован на BitcoinWorld.

Возможности рынка
Логотип Gensyn
Gensyn Курс (AI)
$0.02424
$0.02424$0.02424
-1.70%
USD
График цены Gensyn (AI) в реальном времени

Комбо Кубка мира: Цель на 200x

Комбо Кубка мира: Цель на 200xКомбо Кубка мира: Цель на 200x

До 20 комбо в матчах Кубка мира за 1 ордер

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Заработайте долю из 50 000 USDT

Заработайте долю из 50 000 USDTЗаработайте долю из 50 000 USDT

Делайте задания DEX+ и откройте «Колесо чемпионов»