Home / Glossary
AI Coding Glossary
Key terms in AI-assisted development, explained clearly with practical context.
Codificação Agêntica
Codificação agêntica é uma abordagem de desenvolvimento de software onde um agente de IA lê autonomamente sua base de código, escreve código, executa comandos e itera sobre resultados sem copiar e colar manualmente. Diferente da IA baseada em chat, o agente age diretamente no seu ambiente de desenvolvimento para completar tarefas de múltiplas etapas.
Claude Code
Claude Code é o agente de codificação de IA baseado em terminal da Anthropic que opera diretamente no seu ambiente de desenvolvimento. Ele lê todo o seu projeto, escreve código em múltiplos arquivos, executa comandos shell, gerencia fluxos de trabalho git e itera sobre erros autonomamente—tudo pela linha de comando.
Model Context Protocol (MCP)
O Model Context Protocol (MCP) é um padrão aberto criado pela Anthropic que fornece uma maneira universal de conectar modelos de IA a ferramentas externas, fontes de dados e APIs. Ele funciona como uma interface padronizada—como USB para IA—para que qualquer ferramenta compatível com MCP funcione com qualquer agente de IA compatível com MCP.
CLAUDE.md
CLAUDE.md é um arquivo de configuração em markdown colocado na raiz do seu projeto que fornece ao Claude Code instruções persistentes e específicas do projeto. Ele informa o agente sobre suas convenções de codificação, arquitetura, comandos comuns e regras—funcionando como uma forma de memória de longo prazo que se aplica a cada sessão naquele projeto.
Programação em Par com IA
Programação em par com IA é um fluxo de trabalho de desenvolvimento onde um desenvolvedor humano trabalha junto com uma ferramenta de IA para escrever código colaborativamente em tempo real. O desenvolvedor fornece direção, contexto e julgamento enquanto a IA contribui com sugestões de código, detecta bugs e lida com tarefas de implementação repetitivas.
Janela de Contexto
Uma janela de contexto é o número máximo de tokens (palavras, caracteres de código e símbolos) que um modelo de IA pode processar em uma única interação. Ela define o limite superior de quanta informação—incluindo seu prompt, código e a resposta do modelo—a IA pode manter na memória de uma vez.
Agente de Codificação
Um agente de codificação é uma ferramenta alimentada por IA que pode autonomamente ler arquivos, escrever código, executar comandos no terminal e iterar sobre resultados para completar tarefas de programação. Diferente de ferramentas passivas de sugestão de código, um agente de codificação age independentemente no seu ambiente de desenvolvimento para alcançar um objetivo declarado.
Vibe Coding
Vibe coding é uma abordagem informal de desenvolvimento de software onde um desenvolvedor descreve o que quer em linguagem natural e deixa uma ferramenta de IA cuidar dos detalhes de implementação. Em vez de escrever especificações precisas, o desenvolvedor comunica a intenção através de conversa casual e itera com base nos resultados.
Revisão de Código com IA
Revisão de código com IA é o processo de usar inteligência artificial para analisar automaticamente código-fonte em busca de bugs, vulnerabilidades de segurança, inconsistências de estilo e problemas de qualidade. Revisores de IA podem examinar pull requests, sugerir melhorias e detectar problemas que revisores humanos podem perder devido à fadiga ou pressão de tempo.
Engenharia de Prompt para Código
Engenharia de prompt para código é a prática de elaborar instruções claras e específicas que ajudam ferramentas de codificação com IA a produzir saídas precisas e relevantes. Envolve estruturar seus pedidos com o nível certo de contexto, restrições e exemplos para que a IA entenda tanto o que você quer quanto como você quer que seja feito.
Agente de IA Headless
Um agente de IA headless é um agente de codificação que roda sem uma interface voltada ao usuário ou interação em tempo real. Ele executa tarefas autonomamente em processos em segundo plano, pipelines CI/CD ou jobs agendados—lendo código, fazendo mudanças, executando testes e reportando resultados sem esperar por entrada humana em nenhuma etapa.
Sub-Agentes
Sub-agentes são processos filhos paralelos gerados por um agente de codificação de IA principal para lidar com partes independentes de uma tarefa complexa simultaneamente. Em vez de processar tudo sequencialmente, o agente principal delega subtarefas a agentes filhos especializados que rodam em paralelo e reportam resultados ao agente pai.
AI Code Completion
AI code completion is a feature in development tools that uses machine learning models to predict and suggest code as you type. It ranges from single-line autocomplete to multi-line function generation, analyzing the surrounding code context to offer relevant suggestions that match your intent and coding style.
Large Language Model (LLM)
A large language model (LLM) is a deep learning system with billions of parameters, trained on vast datasets of text and code to understand, generate, and reason about natural language and programming languages. LLMs like Claude, GPT-4, and Gemini are the foundation of modern AI coding tools.
Retrieval-Augmented Generation (RAG)
Retrieval-augmented generation (RAG) is an AI architecture that improves the accuracy of language model responses by retrieving relevant information from external knowledge sources before generating an answer. Instead of relying solely on what the model memorized during training, RAG fetches up-to-date, domain-specific data and includes it in the model's context.
Tool Use
Tool use (also called tool calling) is the capability of a large language model to invoke external functions, APIs, or system commands as part of generating a response. Instead of being limited to producing text, a model with tool use can read files, run code, query databases, and interact with services—making it the foundation of agentic AI systems.
Function Calling
Function calling is an AI model capability where the model generates structured JSON arguments to invoke external functions instead of producing plain text. This enables LLMs to interact with APIs, databases, file systems, and other tools in a reliable, programmatic way—turning a conversational model into one that can take real-world actions.
System Prompt
A system prompt is a set of instructions provided to an AI model before the user's message that defines the model's behavior, persona, constraints, and capabilities. It acts as a configuration layer that shapes every response the model produces, without the user needing to repeat these instructions in each message.
Temperature
Temperature is a parameter in large language models that controls the randomness of the output. A temperature of 0 makes the model deterministic, always choosing the most probable next token. Higher temperatures (up to 1.0 or 2.0) increase randomness, making less probable tokens more likely to be selected. For coding tasks, lower temperatures generally produce more reliable, consistent code.
Token
A token is the fundamental unit of text that a large language model processes. Tokenization splits text into chunks—sometimes whole words, sometimes subwords, sometimes individual characters—that the model can work with. In English text, one token is roughly 3-4 characters or 0.75 words. In code, tokens map to keywords, operators, variable names, and whitespace.
Fine-Tuning
Fine-tuning is the process of further training a pre-trained large language model on a smaller, task-specific dataset to adapt its behavior for a particular use case. The model's weights are updated to specialize in a domain—such as a specific programming language, codebase, or output format—while retaining its general capabilities from pre-training.
Code Generation
AI code generation is the process of using artificial intelligence to produce source code from natural language descriptions, specifications, or existing code context. Modern code generation powered by LLMs can write entire functions, classes, tests, and even full applications from high-level instructions, across virtually any programming language.
AI Refactoring
AI refactoring is the use of artificial intelligence to automatically restructure, simplify, and improve existing source code without changing its external behavior. AI refactoring tools analyze code for complexity, duplication, poor naming, and anti-patterns, then apply transformations that make the code cleaner, more maintainable, and easier to understand.
AI Testing
AI testing is the application of artificial intelligence to software testing workflows—including generating unit tests, integration tests, and end-to-end tests from source code; identifying untested edge cases; analyzing test failures; and suggesting fixes. AI testing tools understand code semantics to write meaningful tests that go beyond basic coverage.
Multi-Modal AI
Multi-modal AI refers to artificial intelligence systems that can process, understand, and generate multiple types of data—text, images, audio, video, and code—within a single model. Unlike single-modal models that only handle text, multi-modal models can analyze a screenshot of a UI, read the associated code, and generate modifications based on both visual and textual understanding.
Chain-of-Thought
Chain-of-thought (CoT) prompting is a technique that encourages a large language model to break down complex problems into intermediate reasoning steps before producing a final answer. Instead of jumping to a conclusion, the model "thinks out loud," explaining each step of its logic. This significantly improves accuracy on tasks that require multi-step reasoning, including debugging, algorithm design, and code architecture decisions.
Few-Shot Prompting
Few-shot prompting is a technique where you include a small number of example input-output pairs in your prompt to demonstrate the pattern you want the AI to follow. By showing the model 2-5 examples of the desired behavior, it learns the format, style, and logic you expect—without any model training or fine-tuning. This is one of the most effective techniques for getting consistent, formatted output from LLMs.
Zero-Shot Prompting
Zero-shot prompting is a technique where you instruct an AI model to perform a task without providing any examples of the desired input-output format. You describe what you want in natural language, and the model relies entirely on its pre-trained knowledge to produce the output. It is the most natural way to interact with AI—just tell it what to do.
Embeddings
Embeddings are dense numerical vectors (arrays of floating-point numbers) that represent text, code, or other data in a high-dimensional space where semantically similar items are positioned close together. They enable AI systems to measure similarity between pieces of code, search codebases by meaning rather than keywords, and power retrieval-augmented generation (RAG) systems.
Vector Database
A vector database is a specialized database designed to store, index, and search high-dimensional embedding vectors efficiently. Unlike traditional databases that match exact values or keywords, vector databases find the most similar vectors to a query vector—enabling semantic search, recommendation systems, and the retrieval component of RAG (retrieval-augmented generation) architectures.
Technical Debt
Technical debt is the implied cost of future rework caused by choosing a quick, expedient solution now instead of a better approach that would take longer. Like financial debt, it accumulates interest: the longer it remains unaddressed, the more time and effort future changes require. Common sources include rushed features, skipped tests, outdated dependencies, and inconsistent architecture.