Início Tecnologia O glossário de inteligência artificial que você precisa conhecer neste ano
Tecnologia

O glossário de inteligência artificial que você precisa conhecer neste ano

Share
Image Credits:Getty Images AI Generator / Getty Images — Fonte: TechCrunch
Share

A inteligência artificial está transformando o mundo e, ao mesmo tempo, inventing uma completamente nova linguagem para descrever como isso está acontecendo. Sente-se em qualquer reunião de produto, apresentação ou painel nowadays e você ouvirá pessoas usando LLMs, RAG, RLHF e uma dúzia de outros termos que podem fazer até pessoas muito inteligentes no mundo de tecnologia se sentirem um pouco inseguras. Este glossário é nossa tentativa de corrigir isso: definições em linguagem simples dos termos de IA que você provavelmente encontrará, seja construindo com essa tecnologia, investindo nela ou apenas tentando acompanhar lendo matérias ou ouvindo podcasts relacionados. Atualizamos regularmente conforme o campo evolui, então considere-o um documento vivo, muito como os sistemas de IA que descreve.

Inteligência artificial geral, ou AGI, é um termo nebuloso. Mas geralmente refere-se a uma IA que é mais capaz do que o humano médio em muitas tarefas, se não na maioria. O CEO da OpenAI, Sam Altman, uma vez descreveu AGI como o equivalente a um humano mediano que você poderia contratar como colega de trabalho. Enquanto isso, a carta da OpenAI define AGI como sistemas altamente autônomos que superam os humanos na maioria dos trabalhos economicamente valiosos. O entendimento do Google DeepMind difere ligeramente dessas duas definições; o laboratório vê AGI como uma IA que é pelo menos tão capaz quanto os humanos na maioria das tarefas cognitivas. Confuso? Não se preocupe – especialistas na fronteira da pesquisa de IA também estão.

Um agente de IA refere-se a uma ferramenta que usa tecnologias de IA para realizar uma série de tarefas em seu nome – além do que um chatbot de IA mais básico poderia fazer – como preencher despesas, reservar passagens ou uma mesa em um restaurante, ou até escrever e manter código. No entanto, como já explicamos, há muitas peças móveis neste espaço emergente, então agente de IA pode significar coisas diferentes para pessoas diferentes. A infraestrutura também ainda está sendo desenvolvida para entregar as capacidades imaginadas. Mas o conceito básico implica um sistema autônomo que pode combinar múltiplos sistemas de IA para realizar tarefas de múltiplas etapas.

Pense nos endpoints de API como botões na parte de trás de um pedaço de software que outros programas podem pressionar para fazer coisas. Desenvolvedores usam essas interfaces para construir integrações – por exemplo, permitindo que um aplicativo puxe dados de outro, ou permitindo que um agente de IA controle serviços de terceiros diretamente sem um humano operando manualmente cada interface. A maioria dos dispositivos de casa inteligente e plataformas conectadas têm esses botões ocultos disponíveis, mesmo que usuários comuns nunca vejam ou interajam com eles. À medida que os agentes de IA se tornam mais capazes, eles são cada vez mais capazes de encontrar e usar esses endpoints por conta própria, abrindo possibilidades poderosas – e às vezes inesperadas – para automação.

Dada uma pergunta simples, um cérebro humano pode responder sem pensar muito sobre ela – coisas como qual animal é mais alto, uma girafa ou um gato? Mas em muitos casos, você frequentemente precisa de caneta e papel para chegar à resposta correta porque há etapas intermediárias. Por exemplo, se um fazendeiro tem galinhas e vacas, e juntos eles têm 40 cabeças e 120 pernas, você pode precisar escrever uma equação simples para chegar à resposta. Em um contexto de IA, raciocínio de cadeia de pensamento para modelos de linguagem grandes significa quebrar um problema em etapas menores e intermediárias para melhorar a qualidade do resultado final. Geralmente leva mais tempo para obter uma resposta, mas a resposta tem mais probabilidade de estar correta, especialmente em um contexto de lógica ou codificação.

Este é um conceito mais específico do que um agente de IA, o que significa um programa que pode tomar ações por conta própria, etapa por etapa, para completar uma meta. Um agente de codificação é uma versão especializada aplicada ao desenvolvimento de software. Em vez de simplesmente sugerir código para um humano revisar e colar, um agente de codificação pode escrever, testar e depurar código autonomamente, lidando com o tipo de trabalho iterativo de tentativa e erro que normalmente consome o dia de um desenvolvedor. Esses agentes podem operar em bases de código inteiras, identificando bugs, executando testes e implementando correções com supervisão humana mínima.

Embora seja um termo um tanto multivalente, compute geralmente refere-se ao poder computacional vital que permite que os modelos de IA operem. Este tipo de processamento impulsiona a indústria de IA, dando a ela a capacidade de treinar e implementar seus modelos poderosos. O termo é frequentemente uma abreviação para os tipos de hardware que fornecem o poder computacional – coisas como GPUs, CPUs, TPUs e outras formas de infraestrutura que formam a base da indústria de IA moderna.

Um subconjunto de aprendizado de máquina autoaperfeiçoante no qual algoritmos de IA são projetados com uma estrutura de rede neural artificial multicamada. Isso permite que eles façam correlações mais complexas em comparação com sistemas de aprendizado de máquina mais simples, como modelos lineares ou árvores de decisão. A estrutura dos algoritmos de aprendizado profundo se inspira nas vias interconectadas de neurônios no cérebro humano. Modelos de IA de aprendizado profundo são capazes de identificar características importantes nos dados por conta própria, em vez de exigir que engenheiros humanos definam essas características.

Diffusão é a tecnologia no coração de muitos modelos de IA geradores de arte, música e texto. Inspirada na física, os sistemas de difusão lentamente destroem a estrutura dos dados adicionando ruído até não sobrar nada. Na física, a difusão é espontânea e irreversível – açúcar diffundido no café não pode ser restaurado à forma de cubo. Mas os sistemas de difusão em IA visam aprender uma espécie de processo de difusão reversa para restaurar os dados destruídos, gaining a capacidade de recuperar os dados do ruído.

Destilação é uma técnica usada para extrair conhecimento de um grande modelo de IA com um modelo professor-aluno. Desenvolvedores enviam solicitações a um modelo professor e registram as saídas. As respostas às vezes são comparadas com um conjunto de dados para ver quão precisas são. Essas saídas são então usadas para treinar o modelo aluno, que é treinado para aproximar o comportamento do professor. A destilação pode ser usada para criar um modelo menor e mais eficiente baseado em um modelo maior com perda mínima de destilação.

Isso refere-se ao treinamento adicional de um modelo de IA para otimizar o desempenho para uma tarefa ou área mais específica do que foi anteriormente o foco de seu treinamento – tipicamente alimentando novos dados especializados. Muitas startups de IA estão usando modelos de linguagem grandes como ponto de partida para construir um produto comercial, mas estão lutando para aumentar a utilidade para um setor ou tarefa alvo complementando ciclos de treinamento anteriores com ajuste fino baseado em seu próprio conhecimento e expertise específicos do domínio.

Um GAN, ou Rede Adversarial Generativa, é um tipo de estrutura de aprendizado de máquina que sustenta alguns desenvolvimentos importantes em IA generativa quando se trata de produzir dados realistas – incluindo, mas não apenas, ferramentas de deepfake. GANs envolvem o uso de um par de redes neurais, uma das quais drawing de seus dados de treinamento para gerar uma saída que é passada para o outro modelo avaliar. Os dois modelos são essencialmente programados para tentar superar um ao outro.

Alucinação é o termo preferido da indústria de IA para modelos de IA inventando coisas – literalmente gerando informações incorretas. Obviamente, é um enorme problema para a qualidade da IA. Alucinações produzem saídas de IA generativa que podem ser enganosas e podem até levar a riscos da vida real – com consequências potencialmente perigosas. O problema de IAs fabricando informações é pensado para surgir como consequência de lacunas nos dados de treinamento.

Inferência é o processo de executar um modelo de IA. É soltar um modelo para fazer previsões ou tirar conclusões de dados vistos anteriormente. Para ser claro, a inferência não pode acontecer sem treinamento; um modelo deve aprender padrões em um conjunto de dados antes que ele possa efetivamente extrapolar a partir desses dados de treinamento.

Grandes modelos de linguagem, ou LLMs, são os modelos de IA usados por assistentes de IA populares, como ChatGPT, Claude, Google Gemini, Meta AI Llama, Microsoft Copilot ou Mistral Le Chat. Quando você conversa com um assistente de IA, você interage com um grande modelo de linguagem que processa sua solicitação diretamente ou com a ajuda de diferentes ferramentas disponíveis, como navegação na web ou interpretadores de código.

Cache de memória refere-se a um processo importante que impulsiona a inferência. Em essência, cache é uma técnica de otimização projetada para tornar a inferência mais eficiente. A IA é claramente impulsionada por cálculos matemáticos de alta octanagem e cada vez que esses cálculos são feitos, eles usam mais energia. O cache foi projetado para reduzir o número de cálculos que um modelo pode ter que executar salvando cálculos particulares para futuras consultas e operações dos usuários.

O Protocolo de Contexto de Modelo, ou MCP, é um padrão aberto que permite que modelos de IA se conectem a ferramentas e dados externos – seus arquivos, bancos de dados ou aplicativos como Slack e Google Drive – sem um desenvolvedor construir um conector personalizado para cada pareamento. Pense nisso como uma porta USB-C para IA.

Mistura de Especialistas é uma arquitetura de modelo que divide uma rede neural em muitas sub-redes especializadas menores, ou especialistas, e ativa apenas algumas delas para qualquer tarefa específica. Em vez de rotear cada solicitação através do modelo inteiro, um modelo MoE tem um roteador integrado que escolhe apenas os especialistas certos para o trabalho.

Uma rede neural refere-se à estrutura algorítmica multicamada que sustenta o aprendizado profundo – e, mais amplamente, todo o boom em ferramentas de IA generativa após o surgimentos de grandes modelos de linguagem. Embora a ideia de se inspirar nas vias densamente interconectadas do cérebro humano como uma estrutura de design para algoritmos de processamento de dados date de volta aos anos 1940, foi a ascensão muito mais recente de hardware de processamento gráfico que realmente desbloqueou o poder dessa teoria.

Código aberto refere-se a software – ou, cada vez mais, modelos de IA – onde o código subjacente é disponibilizado publicamente para qualquer pessoa usar, inspecionar ou modificar. Na mundo da IA, a família de modelos Llama da Meta é um exemplo proeminente. Abordagens de código aberto permitem que pesquisadores, desenvolvedores e empresas ao redor do mundo construam sobre o trabalho uns dos outros, acelerando o progresso e possibilitando auditorias de segurança independentes que sistemas fechados não podem facilmente fornecer.

Paralelização significa fazer muitas coisas ao mesmo tempo em vez de uma após outra – como ter 10 funcionários trabalhando em diferentes partes de um projeto ao mesmo tempo em vez de um funcionário fazendo tudo sequencialmente. Na IA, a paralelização é fundamental tanto para treinamento quanto para inferência.

RAMageddon é o termo divertido para uma tendência não tão divertida que está varrendo a indústria de tecnologia: uma crescente escassez de chips de memória de acesso aleatório, que alimentam praticamente todos os produtos de tecnologia que usamos em nossas vidas diárias.

Como a AGI, melhoria recursiva automática é um limite para quão inteligente a IA pode ficar e quão pouco ela pode depender dos humanos. No cenário de RSI, modelos de IA começam a se melhorar sem intervenção humana, levando a uma enorme aceleração em capacidades e autonomia.

Aprendizado por reforço é uma forma de treinar IA onde um sistema aprende tentando coisas e recebendo recompensas por respostas corretas – como treinar seu amado animal de estimação com petiscos, exceto que o animal de estimário neste cenário é uma rede neural e o petisco é um sinal matemático indicando sucesso.

Quando se trata de comunicação humano-máquina, há alguns desafios óbvios – pessoas comunicam usando linguagem humana, enquanto programas de IA executam tarefas através de processos algorítmicos complexos informados por dados. Tokens preenchem essa lacuna: são os blocos de construção básicos da comunicação humano-IA, representando segmentos discretos de dados que foram processados ou produzidos por um LLM.

Tokens são os pequenos pedaços de texto – frequentemente partes de palavras em vez de inteiras – que modelos de linguagem de IA dividem o idioma antes de processá-lo; eles são aproximadamente análogos a palavras para os propósitos de entender cargas de trabalho de IA. Throughput refere-se a quanto pode ser processado em um determinado período de tempo, então throughput de token é essencialmente uma medida de quanto trabalho de IA um sistema pode lidar de uma vez.

Desenvolver IAs de aprendizado de máquina envolve um processo conhecido como treinamento. Em termos simples, isso refere-se a dados sendo inseridos para que o modelo possa aprender com padrões e gerar saídas úteis. Essencialmente, é o processo do sistema respondendo a características nos dados que permite adaptar saídas em direção a um objetivo procurado.

Uma técnica onde um modelo de IA previamente treinado é usado como ponto de partida para desenvolver um novo modelo para uma tarefa diferente mas tipicamente relacionada – permitindo que o conhecimento ganho em ciclos de treinamento anteriores seja reaplicado. O aprendizado por transferência pode conduzir economias de eficiência shortcutting o desenvolvimento do modelo.

Perda de validação é um número que diz quão bem um modelo de IA está aprendendo durante o treinamento – e menor é melhor. Pesquisadores acompanham de perto como uma espécie de relatório em tempo real, usando-o para decidir quando parar o treinamento, quando ajustar hiperparâmetros ou se investigar um problema potencial.

Os pesos são fundamentais para o treinamento de IA, pois determinam quanta importância é dada a diferentes características nas dados usados para treinar o sistema – moldando assim a saída do modelo de IA. Put de outra forma, pesos são parâmetros numéricos que definem o que é mais saliente em um conjunto de dados para a tarefa de treinamento dada.

Este artigo é atualizado regularmente com novas informações.

Fonte: TechCrunch

Share
Artigos relacionados
Tecnologia

Apenas estes modelos de iPhone receberão o novo Siri com inteligência artificial neste ano

A Apple revelou durante a WWDC 2026 uma versão significativamente aprimorada do...

Tecnologia

Tesla leva serviço de robotáxi para região limitada de Miami

Os moradores de Miami agora têm uma nova opção de transporte autônomo...

Tecnologia

Alibaba proíbe funcionários de usarem ferramenta de programação da Anthropic

O grupo chinês Alibaba anunciou que vai proibir seus funcionários de utilizarem...

Tecnologia

FIFA apresenta FIFA Heroes: novo jogo gratuito de futebol para celulares traz personagens icônicos e partidas rápidas

A FIFA apresentou nesta semana sua mais nova aposta para o mercado...