Mapa da trilha
Conteúdo detalhado
🖥️ LiteCUA e computer-use
Arquitetura especializada para computer-use: VM Controller + MCP Server, ambiente OSWorld, fluxo de execução e casos de uso GUI.
Para computer-use, o Tool Manager é redesenhado para incluir VM Controller + MCP Server. Restante (LLM Core, Memory, Context) é igual.
Sem essa especialização, agente que opera GUI vira pesadelo de segurança.
Computer-Use · sandbox · GUI · isolamento.
Componente que controla VM (KVM/QEMU/Firecracker) onde o agente clica, digita e captura tela.
VM é a única barreira eficaz contra "agente clica em algo que apaga seu disco".
VM · KVM · Firecracker · snapshot · rollback.
Servidor MCP (Model Context Protocol) que expõe ações da VM (click, type, screenshot) como tools padronizadas.
MCP é padrão da indústria — qualquer agente que entende MCP fala com a VM.
MCP · click · type · screenshot · OCR.
Stack open (xlang-ai/OSWorld) que provê VMs prontas (Ubuntu+GUI) para agentes computer-use.
Setup de VM do zero é trabalhoso. OSWorld é a forma rápida de começar.
VM pronta · benchmark padrão · imagem reproduzível.
Agente vê screenshot via MCP → LLM Core decide ação → emite ToolCall (click x,y) → VM Controller executa na VM.
Entender o loop é entender computer-use no AIOS.
Loop perceive-decide-act · screenshot · ação atômica.
Apps legados sem API, suites pesadas (Excel, PowerPoint), fluxos web que rejeitam scraping.
Computer-use é caro e lento — só use onde API não existe.
Legacy · sem API · captcha · trade-off custo/benefício.
🚀 Roadmap e ecossistema
A-MEM, LSFS, agent hub, rewrite experimental em Rust, AgentX MOOC e como contribuir com a comunidade.
Paper 2025 (arxiv 2502.12110) propõe memória que o próprio agente cura, comprime e indexa.
É a evolução natural do Memory Manager. Reduz o "context bloat" típico de agente long-running.
Memória curada · compressão · indexação semântica.
Paper ICLR 2025 (arxiv 2410.11843). LLM-based Semantic File System onde arquivos são buscáveis por significado.
É o futuro do Storage Manager. Em vez de path, você consulta em linguagem natural.
Semantic FS · embeddings · busca natural · indexação.
Registry público para publicar/discover agentes. Tendência: catalogação por tag, rating, benchmark automático.
Quanto mais agentes públicos, menos você reinventa.
Registry · semver · tag · rating · trust.
Scaffold experimental em aios-rs/. Traits e implementações placeholder de context, memory, storage, tool, scheduler, llm.
Não é feature-parity ainda. Mas indica a direção de longo prazo: módulos críticos em Rust para performance.
Rust · porting incremental · performance · trait definitions.
LLM Agents MOOC de Berkeley RDI, onde AIOS foi finalista AgentX 2025. Currículo aberto, vídeos no YouTube.
Material conceitual profundo, com instrutores que escreveram os papers.
MOOC · Berkeley · papers · benchmarks abertos.
Reporte bugs com log completo, publique agentes no hub, escreva tutorial, traduza docs, abra issue com proposta clara.
Comunidade ainda é pequena. Toda contribuição visível pesa muito.
Open source · low-barrier contribution · documentação · tutoriais.