Pela primeira vez na história, um satélite de observação terrestre conseguiu identificar alvos específicos de forma independente, sem a necessidade de analistas humanos no planeta. O marco occurred in April, representando a primeira aplicação registrada de um modelo de linguagem visual em órbita e oferecendo um vislumbre de como a inteligência artificial pode transformar fundamentalmente as capacidades dos sensores espaciais.
Geralmente, os satélites transmitem grandes volumes de dados para analistas na Terra, que utilizam algoritmos de aprendizado de máquina ou análise humana para interpretar as informações. No entanto, a bordo do YAM-9, uma espaçonave construída pela empresa de infraestrutura espacial Loft Orbital, um pacote de software desenvolvido pelo Laboratório de Propulsão a Jato da NASA conseguiu identificar áreas de interesse em resposta a consultas em linguagem natural.
O modelo utilizado foi o Gemma 3 do Google DeepMind, uma ferramenta de linguagem visual projetada especificamente para aplicações de borda, ou seja, capaz de funcionar em hardware limitado longe de centros de dados. Os pesquisadores solicitaram que o modelo classificasse dados de sensores onde o ambiente natural encontra o desenvolvimento humano, ou identificasse infraestrutura ao redor de terminais ferroviários, e ele conseguiu executar as tarefas com precisão.
A demonstração é significativa por duas razões principais. No curto prazo, ela pode tornar os sensores espaciais muito mais úteis ao realizar a triagem inicial dos dados em órbita, reduzindo a avalanche de informações brutas que os analistas atualmente precisam processar. A longo prazo, representa uma prova de conceito para a execução de infraestrutura de IA em maior escala no espaço.
"Isso abre a porta para camadas de patrulha always-on no espaço", afirmou Paul Lasserre, chefe de inteligência artificial da Loft Orbital, em entrevista. "Se você tem um modelo de linguagem visual, pode ter lógica como 'monitorar esta fronteira para mim e me avisar quando algo suspeito aparecer', interagindo diretamente com os satélites."
As espaçonaves da Loft Orbital são projetadas como plataformas para clientes de terceiros, num modelo de negócio mais próximo de infraestrutura como serviço do que da fabricação tradicional de satélites. Um acordo recente resultou na construção, lançamento e operação de seis novos satélites para a EarthDaily, que analisará e comercializará os dados coletados pelas espaçonaves.
O YAM-9 foi lançado no outono de 2025 como um projeto pioneiro para os projetos de IA orbital da empresa e inclui um processador Nvidia Jetson Orin AGX GPU, um dos chips mais utilizados em computação espacial. Juan Delfa Victoria, líder técnico do grupo de inteligência artificial da NASA JPL, liderou o desenvolvimento do NAVI-Orbital, o pacote de software que serviu como base para o modelo Gemma 3.
Embora o Gemma 3 seja um produto disponível comercialmente, os engenheiros de software tiveram que otimizar o pacote para reduzir a quantidade de bibliotecas e memória necessária. Embora esta seja a primeira utilização registrada de um modelo de linguagem visual em órbita, podemos esperar que outras empresas sigam o mesmo caminho.
A Planet Labs opera satélites com processadores Jetson Orin, utilizando-os atualmente para tarefas mais simples de detecção de objetos, mas uma porta-voz indicou que pesquisas estão em andamento para outras aplicações de IA, incluindo modelos de linguagem visual. A Kepler Communications, que opera o maior conjunto de GPUs no espaço, preferiu não confirmar se implantou modelos de linguagem visual devido a acordos de confidencialidade com parceiros.
"Agora que provamos o conceito, essa é realmente a direção que estamos seguindo", afirmou Lasserre. O objetivo é expandir a constelação para garantir cobertura em tempo real de qualquer lugar na Terra, o que, segundo ele, exigiria entre 50 e 100 satélites semelhantes ao YAM-9. A empresa atualmente opera 12 espaçonaves em órbita.
As lições aprendidas ao implementar esses modelos menores em órbita informarão como as empresas tentarão implantas infraestrutura de computação em maior escala no espaço, especialmente nas áreas fundamentais, porém prosaicas, de gerenciamento de energia e memória. Elas também podem abrir caminho para novas ferramentas científicas.
A ideia para o NAVI-Space começou quando Delfa Victoria e o pesquisador da JPL Taran Cyriac John estavam pensando em assistentes digitais para astronautas explorando a Lua ou Marte. "Estamos pensando, você tem astronautas com roupas pressurizadas e eles não podem digitar em um teclado, qualquer coisa que queiram fazer é complexa", explicou Delfa Victoria. "Então, que tal fornecer um assistente, como em videogames e filmes, onde você vê uma IA interativa?"
Fonte: TechCrunch
