Módulo 1.2 — Quando usar AIOS

💼 Casos de uso — Multi-agent, computer-use, research

AIOS não vale a pena para qualquer projeto. Ele brilha quando o problema tem características de SO: múltiplos agentes concorrentes, ciclo de vida longo, ou interação com ambiente externo (GUI, sistema de arquivos, ferramentas) que precisa de isolamento.

💡 As três frentes onde AIOS faz diferença

•Multi-agent — 5+ agentes de diferentes frameworks (AutoGen, OpenAGI) coexistindo no mesmo processo, compartilhando LLM e memória.
•Computer-use — agente que opera GUI dentro de uma VM sandbox via LiteCUA + MCP Server.
•Research long-running — pesquisa profunda que dura horas, com memória persistente via Storage Manager.

📊 Sinais de que AIOS faz sentido

Você roda 2+ agentes em paralelo e precisa que um não trave o outro
Você quer trocar de modelo por tarefa sem reescrever lógica
Você precisa de memória persistente entre execuções
Você quer auditar quem chamou qual tool e quando
Você pensa em computer-use com sandbox real

💡 Sinal contrário

Se seu uso é "uma chamada de LLM com um prompt", AIOS é overkill puro. Use o SDK do provider direto. AIOS começa a pagar quando há concorrência, isolamento ou orquestração.

🔌 Multi-modelo nativo — 6+ providers em uma config

Um dos diferenciais práticos: o config.yaml central aceita keys de todos os providers principais. O agente declara apenas qual modelo quer; o LLM Core resolve o provider e despacha. Trocar de Claude Sonnet para Gemini Flash é uma string no agente, não rewrite.

# aios/config/config.yaml
api_keys:
  openai: "sk-..."
  anthropic: "sk-ant-..."
  gemini: "AIza..."
  groq: "gsk_..."
  novita: "..."
  huggingface:
    auth_token: "hf_..."
    cache_dir: "/data/hf-cache"

📊 Providers suportados de fábrica

OpenAI — GPT-4o, GPT-4.1, o3
Anthropic — Claude Sonnet/Opus 4.x
Google — Gemini 2.5 família
Groq — Llama, Mixtral em hardware acelerado
HuggingFace — modelos locais com cache configurável
Novita — proxy para modelos open-source

💡 Dica de custo

Use Groq ou Gemini Flash para classificação e roteamento (rápido e barato). Use Claude/GPT-4 para raciocínio profundo. Use HuggingFace local para tarefas sensíveis ou offline. AIOS permite essa mistura sem refactor.

⚖️ Gerenciamento de recursos — Scheduling FIFO / RR

O Scheduler é o coração da fairness em AIOS. Sem ele, um agente que faz request longo a Claude trava todos os outros que querem chamar GPT. Com ele, syscalls são enfileiradas e despachadas por política — FIFO simples ou Round-Robin entre agentes.

✓ FIFO (First-In, First-Out)

✓Mais simples de raciocinar
✓Bom para workloads homogêneos
✓Baixo overhead de bookkeeping
✓Ideal para 1-2 agentes

⟳ Round-Robin

✓Garante fairness entre agentes
✓Ideal para multi-agente
✓Evita starvation
✓Custo: pouco mais overhead

💡 Quando trocar

Comece com FIFO. Migre para Round-Robin no momento em que perceber que um agente está dominando o LLM Core e travando outros. AIOS permite trocar via config — não precisa parar o kernel.

🌐 Local vs Remote kernel — Onde o kernel roda

Decisão arquitetural de dia 1: o kernel pode estar na mesma máquina do agente (Local Kernel) ou em uma máquina separada que vários agentes consomem remotamente (Remote Kernel / Agent Hub).

Modo	Quando usar	Instalação
Local Kernel	Dev solo, prototipagem	AIOS + Cerebrum na mesma máquina
Remote Kernel	Equipe ou produção, agent hub	AIOS+Cerebrum no servidor; Cerebrum sozinho no cliente
Híbrido	Dev local + deploy remoto	Mesmo código, só muda o endpoint

📊 Agent Hub no modo remoto

Agent users baixam agentes do hub e rodam local
Agent developers testam local, publicam no hub
Operadores mantêm o kernel rodando 24/7 em servidor central
Auditoria centralizada de quais syscalls cada agente executa

🚫 Quando NÃO usar — Limites honestos

A regra é simples: se o problema não exige concorrência, isolamento ou orquestração de recursos compartilhados, AIOS é overkill. Existem ferramentas melhores para 80% dos casos de uso comuns de LLM.

✗ Não use AIOS para

✗Chamada única de LLM em script CLI
✗Chatbot simples num único canal
✗RAG básico sobre um PDF
✗Automação de IDE (use Claude Code/Cursor)
✗Workflow low-code (use n8n/Make)

✓ Use AIOS quando

✓5+ agentes concorrendo no mesmo recurso
✓Computer-use com sandbox real
✓Pesquisa multi-step que dura horas
✓Agent hub multi-tenant
✓Integração de frameworks heterogêneos

💡 Custo de adoção real

Curva de aprendizado: ~1 dia para subir o kernel, ~3 dias para o primeiro agente Cerebrum útil, ~1 semana para entender scheduling. Se seu projeto não vai usar essas capacidades em 30 dias, comece com framework direto e migre depois.

🛣️ Roadmap pessoal — Por onde começar

A trilha mais curta entre "nunca ouvi falar" e "rodando agente útil" leva ~4 semanas de fim de semana. Não tente fazer tudo no primeiro dia — o overhead conceitual é real.

Plano de 4 semanas

Semana 1 — Setup mínimo

Kernel rodando, primeira query

Clone AIOS + Cerebrum, pip install, configure 1 provider (OpenAI ou Anthropic), rode scripts/run_terminal.py e mande "olá".

Semana 2 — Primeiro agente Cerebrum

Sair do terminal default

Escrever agente próprio que recebe query, chama 1 tool (busca web) e retorna resposta. Entender como Cerebrum monta o syscall.

Semana 3 — Framework externo

AutoGen ou OpenAGI no kernel

Plugar AutoGen rodando sobre AIOS. Observar como Scheduler arbitra entre seu agente Cerebrum e o agente AutoGen.

Semana 4 — Computer-use

LiteCUA + MCP em sandbox

Subir ambiente virtualizado (OSWorld), conectar LiteCUA, deixar o agente operar uma GUI simples. Aqui o "wow factor" do AIOS aparece.

💡 Atalho

Se você só quer testar rápido, faça apenas semanas 1 e 2. Já dá pra decidir se o resto vale o investimento. Mas pule semanas 3 e 4 antes de decidir — é onde o diferencial real aparece.

✅ Resumo do Módulo

✓

AIOS brilha em 3 frentes: multi-agent, computer-use e research long-running.

✓

Multi-modelo nativo via config.yaml. OpenAI, Anthropic, Gemini, Groq, HF, Novita em uma config.

✓

Scheduler garante fairness. FIFO para começar, RR quando vários agentes brigam.

✓

Local x Remote são modos legítimos. Dev local, produção remota — sem rewrite.

✓

Roadmap de 4 semanas funciona. Setup, agente, framework externo, computer-use.

Próxima trilha:

Trilha 2 — 🏗️ Arquitetura do Kernel. LLM Core, Memory, Storage, Tool Manager, Scheduler e Context Manager por dentro.

← Anterior: 1.1 Próxima: Trilha 2 →