Início Tecnologia Startups apostam em infraestrutura de dados para acelerar desenvolvimento de robôs
Tecnologia

Startups apostam em infraestrutura de dados para acelerar desenvolvimento de robôs

Share
Image Credits:XDOF — Fonte: TechCrunch
Share

Há duas semanas, a OpenAI anunciou o relançamento do programa de robótica que havia encerrado em 2021 — o mais recente sinal de que os maiores laboratórios de inteligência artificial estão em uma corrida para ensinar máquinas a operar no mundo físico. No entanto, construir robôs capazes exige algo que a indústria de IA ainda não possui: dados de treinamento equivalentes aos usados para modelos de linguagem. Essa lacuna está gerando um novo tipo de negócio de infraestrutura.

Diferentemente dos modelos de linguagem grandes que foram treinados em um vasto oceano de textos disponíveis publicamente, os robôs precisam de dados que capturem a interação física, e esse tipo de dados praticamente não existe. Vídeos do YouTube e gravações capturadas por trabalhadores autônomos são de baixa fidelidade e difíceis de conciliar com o mundo físico.

A empresa XDOF (pronunciada "ecks-doff"), que emerge do modo stealth nesta terça-feira, aposta que o próximo grande gargalo na inteligência artificial não são os modelos ou os chips, mas o ciclo de feedback de dados necessário para ensinar robôs a interagir com o mundo físico. A startup aims construir os pipelines de dados, ferramentas de coleta e sistemas de anotação que os laboratórios pioneiros e empresas de robótica não conseguem construir facilmente por conta própria — e levantou 70 milhões de dólares dos fundos Thrive Capital, Spark Capital, a16z, Lux e WndrCo para isso.

O cofundador e diretor executivo Philipp Wu afirma que a XDOF, que possui cerca de 60 funcionários, já trabalha com 20 clientes, incluindo vários laboratórios pioneiros de IA, mas não pode revelar seus nomes. "Todos os principais laboratórios estão tentando buscar a robótica", disse Wu. "Já vimos alguns fracassos de ficar um pouco atrás na corrida dos modelos de linguagem… você não quer estar nessa situação de perseguir essa tecnologia tarde demais, quando todos estão no mesmo barco onde a IA física é a próxima fronteira."

Wu encontrou esse problema pessoalmente durante seu doutorado na UC Berkeley. Sua focus era permitir que robôs aprendessem habilidades a partir de conjuntos de dados em grande escala. Havia apenas um problema. "Não tínhamos dados em grande escala para trabalhar", contou ele à TechCrunch. "Havia esse problema de ovo e galinha — primeiro precisávamos realmente coletar os dados antes de podíamos até perguntar como treinar um modelo fundamental para robótica."

Wu e seu futuro cofundador e diretor de tecnologia da XDOF, Fred Shentu, trabalharam em um projeto chamado GELLO, um sistema de teleoperação de baixo custo que permite a um operador humano controlar um braço robótico para gerar dados de treinamento. "Acabou se tornando um artigo muito influente na robótica, porque muitas pessoas tinham necessidades e gargalos semelhantes, e muitos começaram a aproveitar esse tipo de dispositivo para coleta de dados", explicou Wu.

Percebendo a oportunidade, Wu, Shentu e o terceiro cofundador e diretor operacional Nemo Jin lançaram a XDOF em outubro de 2024 para fornecer um ecossistema de dados para empresas que buscam modelos de robótica. Consciente de que a simples provisão de dados pode ser um beco sem saída, a empresa também está focada em limpeza de dados, ferramentas e anotação — criando um ciclo de feedback autorreforçante para treinadores de robôs.

Como ponto de partida, a empresa está parcerias com o laboratório de IA Research da UC Berkeley para lançar o que acredita ser a maior coleção de dados de treinamento robótico de alta qualidade já reunida, chamada ABC. Inclui 130.000 trajetórias de dados de manipulação robótica, 300 horas de simulação e 100 horas de avaliações. Esse tipo de dados de pré-treinamento em escala nunca esteve disponível para a academia antes.

"Vimos na linguagem, na geração de imagens e em outros campos, que quando modelos e dados são lançados, a comunidade alcança coisas que você não necessariamente esperaria", disse David McAllister, estudante de doutorado na Berkeley que ajudou a organizar o lançamento, em entrevista à TechCrunch.

A equipe já usou os dados para treinar robôs em tarefas de referência como dobrar camisetas e achatar caixas, ou colocar AirPods em suas caixas.

A empresa planeja trabalhar em três níveis de uma pirâmide de dados. O nível mais valioso são dados de teleoperação coletados no robô real que está sendo implantado; vem a seguir robôs teleoperados coletando dados mais gerais, como com o GELLO; e finalmente dados "egocêntricos" coletados por humanos realizando tarefas cotidianas, para os quais a XDOF planeja construir seus próprios sensores vestíveis.

"A escolha da sua câmera vai afetar a qualidade dos seus dados — que vai afetar como seu algoritmo de rastreamento de mãos funciona", disse Wu. "Se você não projetar o hardware bem desde o início, os dados que coletar podem ter problemas muito específicos que você não antecipou."

A empresa planeja contratar e treinar exércitos de operadores de teleoperação e operadores de dados egocêntricos ao redor do mundo — um modelo intensivo em trabalho que levanta uma pergunta óbvia: por que os grandes laboratórios não fazem esse trabalho de produção de dados eles mesmos?

"Você precisa de um armazém de centenas de milhares de pés quadrados com centenas de robôs", explicou Wu. "Você precisa manter esses robôs, calibrar seus parâmetros físicos e treinar operadores adequadamente." É uma construção que requer foco, capital e escala operacional que a maioria dos laboratórios de IA prefere terceirizar — e é exatamente esse o mercado que a XDOF está apostado.

O nome XDOF é um jogo com o termo robótico "graus de liberdade", que descreve o número de movimentos independentes que um robô pode realizar. Seu braço, do ombro ao pulso, tem sete graus de liberdade. A empresa de robótica humanóide Figure AI tem o mais recente robô com 30. O X no nome da empresa captura sua ambição: "graus de liberdade arbitrários, graus de liberdade ilimitados", afirma Wu.

Fonte: TechCrunch

Share
Artigos relacionados
Tecnologia

Netflix perguntando ‘Você ainda está assistindo?’: guia para desativar a mensagem

Quem nunca se sentiu julgado por uma tela? O momento é típico:...

Tecnologia

Lego apresenta sua primeira máquina de pinball funcional

A Lego acaba de revelar um novo conjunto que marca uma novidade...

Tecnologia

Todos os jogos que experimentamos no Summer Game Fest 2026

O Summer Game Fest 2026 não decepcionou os aficionados por jogos eletrônicos....

Tecnologia

SanDisk lança SSD de 8TB para PS5 com preço que supera três vezes o do console Pro

Está pensando em expandir o armazenamento do seu PlayStation 5? Prepare o...