Início Tecnologia Startups apostam em infraestrutura de dados para acelerar desenvolvimento de robôs

Tecnologia

Startups apostam em infraestrutura de dados para acelerar desenvolvimento de robôs

Atualizado 2 meses Atrás4 Min leitura42 Views

Image Credits:XDOF — Fonte: TechCrunch

Há duas semanas, a OpenAI anunciou o relançamento do programa de robótica que havia encerrado em 2021 — o mais recente sinal de que os maiores laboratórios de inteligência artificial estão em uma corrida para ensinar máquinas a operar no mundo físico. No entanto, construir robôs capazes exige algo que a indústria de IA ainda não possui: dados de treinamento equivalentes aos usados para modelos de linguagem. Essa lacuna está gerando um novo tipo de negócio de infraestrutura.

Diferentemente dos modelos de linguagem grandes que foram treinados em um vasto oceano de textos disponíveis publicamente, os robôs precisam de dados que capturem a interação física, e esse tipo de dados praticamente não existe. Vídeos do YouTube e gravações capturadas por trabalhadores autônomos são de baixa fidelidade e difíceis de conciliar com o mundo físico.

A empresa XDOF (pronunciada "ecks-doff"), que emerge do modo stealth nesta terça-feira, aposta que o próximo grande gargalo na inteligência artificial não são os modelos ou os chips, mas o ciclo de feedback de dados necessário para ensinar robôs a interagir com o mundo físico. A startup aims construir os pipelines de dados, ferramentas de coleta e sistemas de anotação que os laboratórios pioneiros e empresas de robótica não conseguem construir facilmente por conta própria — e levantou 70 milhões de dólares dos fundos Thrive Capital, Spark Capital, a16z, Lux e WndrCo para isso.

O cofundador e diretor executivo Philipp Wu afirma que a XDOF, que possui cerca de 60 funcionários, já trabalha com 20 clientes, incluindo vários laboratórios pioneiros de IA, mas não pode revelar seus nomes. "Todos os principais laboratórios estão tentando buscar a robótica", disse Wu. "Já vimos alguns fracassos de ficar um pouco atrás na corrida dos modelos de linguagem… você não quer estar nessa situação de perseguir essa tecnologia tarde demais, quando todos estão no mesmo barco onde a IA física é a próxima fronteira."

Wu encontrou esse problema pessoalmente durante seu doutorado na UC Berkeley. Sua focus era permitir que robôs aprendessem habilidades a partir de conjuntos de dados em grande escala. Havia apenas um problema. "Não tínhamos dados em grande escala para trabalhar", contou ele à TechCrunch. "Havia esse problema de ovo e galinha — primeiro precisávamos realmente coletar os dados antes de podíamos até perguntar como treinar um modelo fundamental para robótica."

Wu e seu futuro cofundador e diretor de tecnologia da XDOF, Fred Shentu, trabalharam em um projeto chamado GELLO, um sistema de teleoperação de baixo custo que permite a um operador humano controlar um braço robótico para gerar dados de treinamento. "Acabou se tornando um artigo muito influente na robótica, porque muitas pessoas tinham necessidades e gargalos semelhantes, e muitos começaram a aproveitar esse tipo de dispositivo para coleta de dados", explicou Wu.

Percebendo a oportunidade, Wu, Shentu e o terceiro cofundador e diretor operacional Nemo Jin lançaram a XDOF em outubro de 2024 para fornecer um ecossistema de dados para empresas que buscam modelos de robótica. Consciente de que a simples provisão de dados pode ser um beco sem saída, a empresa também está focada em limpeza de dados, ferramentas e anotação — criando um ciclo de feedback autorreforçante para treinadores de robôs.

Como ponto de partida, a empresa está parcerias com o laboratório de IA Research da UC Berkeley para lançar o que acredita ser a maior coleção de dados de treinamento robótico de alta qualidade já reunida, chamada ABC. Inclui 130.000 trajetórias de dados de manipulação robótica, 300 horas de simulação e 100 horas de avaliações. Esse tipo de dados de pré-treinamento em escala nunca esteve disponível para a academia antes.

"Vimos na linguagem, na geração de imagens e em outros campos, que quando modelos e dados são lançados, a comunidade alcança coisas que você não necessariamente esperaria", disse David McAllister, estudante de doutorado na Berkeley que ajudou a organizar o lançamento, em entrevista à TechCrunch.

A equipe já usou os dados para treinar robôs em tarefas de referência como dobrar camisetas e achatar caixas, ou colocar AirPods em suas caixas.

A empresa planeja trabalhar em três níveis de uma pirâmide de dados. O nível mais valioso são dados de teleoperação coletados no robô real que está sendo implantado; vem a seguir robôs teleoperados coletando dados mais gerais, como com o GELLO; e finalmente dados "egocêntricos" coletados por humanos realizando tarefas cotidianas, para os quais a XDOF planeja construir seus próprios sensores vestíveis.

"A escolha da sua câmera vai afetar a qualidade dos seus dados — que vai afetar como seu algoritmo de rastreamento de mãos funciona", disse Wu. "Se você não projetar o hardware bem desde o início, os dados que coletar podem ter problemas muito específicos que você não antecipou."

A empresa planeja contratar e treinar exércitos de operadores de teleoperação e operadores de dados egocêntricos ao redor do mundo — um modelo intensivo em trabalho que levanta uma pergunta óbvia: por que os grandes laboratórios não fazem esse trabalho de produção de dados eles mesmos?

"Você precisa de um armazém de centenas de milhares de pés quadrados com centenas de robôs", explicou Wu. "Você precisa manter esses robôs, calibrar seus parâmetros físicos e treinar operadores adequadamente." É uma construção que requer foco, capital e escala operacional que a maioria dos laboratórios de IA prefere terceirizar — e é exatamente esse o mercado que a XDOF está apostado.

O nome XDOF é um jogo com o termo robótico "graus de liberdade", que descreve o número de movimentos independentes que um robô pode realizar. Seu braço, do ombro ao pulso, tem sete graus de liberdade. A empresa de robótica humanóide Figure AI tem o mais recente robô com 30. O X no nome da empresa captura sua ambição: "graus de liberdade arbitrários, graus de liberdade ilimitados", afirma Wu.

Fonte: TechCrunch

Post anterior PayPal encerra unidade de investimentos corporativos em meio a reestruturação da empresa

Próximo post SanDisk lança SSD de 8TB para PS5 com preço que supera três vezes o do console Pro

Sony mantém decisão de encerrar produção de discos físicos para PlayStation apesar de críticas de jogadores

A gigante japonesa do entretenimento Sony decidiu manter o plano de suspender...

1 Min leitura

Tecnologia

LinkedIn cria botão para denunciar conteúdo de baixa qualidade gerado por inteligência artificial

A rede social profissional LinkedIn decidiu atacar de frente o problema do...

2 Min leitura

Tecnologia

Flórida redireciona 200 milhões de dólares de carregadores elétricos para construir pistas de táxis aéreos

O estado da Flórida surpreendeu ao anunciar que vai redirecionar cerca de...

1 Min leitura

Tecnologia

Desaceleração nos jogos mobile e alterações na App Store derrubam receita de serviços da Apple

A Apple anunciou que ultrapassou a marca de 1,5 bilhão de assinantes...

2 Min leitura

Startups apostam em infraestrutura de dados para acelerar desenvolvimento de robôs

Últimos Posts

Investidores reportam rombo de R$ 190 milhões em Bitcoin após supostos ataques a carteiras de hardware

O DELL XPS VOLTOU! E tá com uma BAITA PLACA DE VÍDEO INTEGRADA!

Spotify lança recurso que permite ao usuário deixar recados nas músicas de suas playlists

CEO do Reddit critica visões gerais de IA do Google em carta a acionistas

Quatro equívocos comuns sobre a tecnologia de baterias de níquel-zinco

CyrusOne promove John Hatem, veterano da própria empresa, ao cargo de presidente executivo

Aliança de Código Aberto da Nvidia Deixa de Lado OpenAI e Anthropic em Movimento Estratégico

Funcionários de Laboratórios de IA Pedem Ritmo Mais Lento no Desenvolvimento Tecnológico

Sony mantém decisão de encerrar produção de discos físicos para PlayStation apesar de críticas de jogadores

LinkedIn cria botão para denunciar conteúdo de baixa qualidade gerado por inteligência artificial

Flórida redireciona 200 milhões de dólares de carregadores elétricos para construir pistas de táxis aéreos

Desaceleração nos jogos mobile e alterações na App Store derrubam receita de serviços da Apple