💼 Casos de uso — Multi-agent, computer-use, research
AIOS não vale a pena para qualquer projeto. Ele brilha quando o problema tem características de SO: múltiplos agentes concorrentes, ciclo de vida longo, ou interação com ambiente externo (GUI, sistema de arquivos, ferramentas) que precisa de isolamento.
💡 As três frentes onde AIOS faz diferença
- •Multi-agent — 5+ agentes de diferentes frameworks (AutoGen, OpenAGI) coexistindo no mesmo processo, compartilhando LLM e memória.
- •Computer-use — agente que opera GUI dentro de uma VM sandbox via LiteCUA + MCP Server.
- •Research long-running — pesquisa profunda que dura horas, com memória persistente via Storage Manager.
📊 Sinais de que AIOS faz sentido
- Você roda 2+ agentes em paralelo e precisa que um não trave o outro
- Você quer trocar de modelo por tarefa sem reescrever lógica
- Você precisa de memória persistente entre execuções
- Você quer auditar quem chamou qual tool e quando
- Você pensa em computer-use com sandbox real
💡 Sinal contrário
Se seu uso é "uma chamada de LLM com um prompt", AIOS é overkill puro. Use o SDK do provider direto. AIOS começa a pagar quando há concorrência, isolamento ou orquestração.
🔌 Multi-modelo nativo — 6+ providers em uma config
Um dos diferenciais práticos: o config.yaml central aceita keys de todos os providers principais. O agente declara apenas qual modelo quer; o LLM Core resolve o provider e despacha. Trocar de Claude Sonnet para Gemini Flash é uma string no agente, não rewrite.
# aios/config/config.yaml
api_keys:
openai: "sk-..."
anthropic: "sk-ant-..."
gemini: "AIza..."
groq: "gsk_..."
novita: "..."
huggingface:
auth_token: "hf_..."
cache_dir: "/data/hf-cache"
📊 Providers suportados de fábrica
- OpenAI — GPT-4o, GPT-4.1, o3
- Anthropic — Claude Sonnet/Opus 4.x
- Google — Gemini 2.5 família
- Groq — Llama, Mixtral em hardware acelerado
- HuggingFace — modelos locais com cache configurável
- Novita — proxy para modelos open-source
💡 Dica de custo
Use Groq ou Gemini Flash para classificação e roteamento (rápido e barato). Use Claude/GPT-4 para raciocínio profundo. Use HuggingFace local para tarefas sensíveis ou offline. AIOS permite essa mistura sem refactor.
⚖️ Gerenciamento de recursos — Scheduling FIFO / RR
O Scheduler é o coração da fairness em AIOS. Sem ele, um agente que faz request longo a Claude trava todos os outros que querem chamar GPT. Com ele, syscalls são enfileiradas e despachadas por política — FIFO simples ou Round-Robin entre agentes.
✓ FIFO (First-In, First-Out)
- ✓Mais simples de raciocinar
- ✓Bom para workloads homogêneos
- ✓Baixo overhead de bookkeeping
- ✓Ideal para 1-2 agentes
⟳ Round-Robin
- ✓Garante fairness entre agentes
- ✓Ideal para multi-agente
- ✓Evita starvation
- ✓Custo: pouco mais overhead
💡 Quando trocar
Comece com FIFO. Migre para Round-Robin no momento em que perceber que um agente está dominando o LLM Core e travando outros. AIOS permite trocar via config — não precisa parar o kernel.
🌐 Local vs Remote kernel — Onde o kernel roda
Decisão arquitetural de dia 1: o kernel pode estar na mesma máquina do agente (Local Kernel) ou em uma máquina separada que vários agentes consomem remotamente (Remote Kernel / Agent Hub).
| Modo | Quando usar | Instalação |
|---|---|---|
| Local Kernel | Dev solo, prototipagem | AIOS + Cerebrum na mesma máquina |
| Remote Kernel | Equipe ou produção, agent hub | AIOS+Cerebrum no servidor; Cerebrum sozinho no cliente |
| Híbrido | Dev local + deploy remoto | Mesmo código, só muda o endpoint |
📊 Agent Hub no modo remoto
- Agent users baixam agentes do hub e rodam local
- Agent developers testam local, publicam no hub
- Operadores mantêm o kernel rodando 24/7 em servidor central
- Auditoria centralizada de quais syscalls cada agente executa
🚫 Quando NÃO usar — Limites honestos
A regra é simples: se o problema não exige concorrência, isolamento ou orquestração de recursos compartilhados, AIOS é overkill. Existem ferramentas melhores para 80% dos casos de uso comuns de LLM.
✗ Não use AIOS para
- ✗Chamada única de LLM em script CLI
- ✗Chatbot simples num único canal
- ✗RAG básico sobre um PDF
- ✗Automação de IDE (use Claude Code/Cursor)
- ✗Workflow low-code (use n8n/Make)
✓ Use AIOS quando
- ✓5+ agentes concorrendo no mesmo recurso
- ✓Computer-use com sandbox real
- ✓Pesquisa multi-step que dura horas
- ✓Agent hub multi-tenant
- ✓Integração de frameworks heterogêneos
💡 Custo de adoção real
Curva de aprendizado: ~1 dia para subir o kernel, ~3 dias para o primeiro agente Cerebrum útil, ~1 semana para entender scheduling. Se seu projeto não vai usar essas capacidades em 30 dias, comece com framework direto e migre depois.
🛣️ Roadmap pessoal — Por onde começar
A trilha mais curta entre "nunca ouvi falar" e "rodando agente útil" leva ~4 semanas de fim de semana. Não tente fazer tudo no primeiro dia — o overhead conceitual é real.
Plano de 4 semanas
Semana 1 — Setup mínimo
Kernel rodando, primeira query
Clone AIOS + Cerebrum, pip install, configure 1 provider (OpenAI ou Anthropic), rode scripts/run_terminal.py e mande "olá".
Semana 2 — Primeiro agente Cerebrum
Sair do terminal default
Escrever agente próprio que recebe query, chama 1 tool (busca web) e retorna resposta. Entender como Cerebrum monta o syscall.
Semana 3 — Framework externo
AutoGen ou OpenAGI no kernel
Plugar AutoGen rodando sobre AIOS. Observar como Scheduler arbitra entre seu agente Cerebrum e o agente AutoGen.
Semana 4 — Computer-use
LiteCUA + MCP em sandbox
Subir ambiente virtualizado (OSWorld), conectar LiteCUA, deixar o agente operar uma GUI simples. Aqui o "wow factor" do AIOS aparece.
💡 Atalho
Se você só quer testar rápido, faça apenas semanas 1 e 2. Já dá pra decidir se o resto vale o investimento. Mas pule semanas 3 e 4 antes de decidir — é onde o diferencial real aparece.
✅ Resumo do Módulo
Próxima trilha:
Trilha 2 — 🏗️ Arquitetura do Kernel. LLM Core, Memory, Storage, Tool Manager, Scheduler e Context Manager por dentro.