MoFA 架构文档

概述

MoFA (Model-based Framework for Agents) 是一个生产级 AI 智能体框架，采用微内核 + 双层插件系统架构设计。本文档描述 MoFA 的层次架构、职责划分和设计原则。

微内核架构原则

MoFA 严格遵循以下微内核架构设计原则：

核心最小化：内核只提供最基本的抽象和能力
插件化扩展：所有非核心功能通过插件机制提供
清晰的层次：每一层有明确的职责边界
统一接口：同类组件使用统一的抽象接口
正确的依赖方向：上层依赖下层，下层不依赖上层

层次架构

┌─────────────────────────────────────────────────────────────────────────┐
│                        用户层 (User Code)                                │
│                                                                          │
│  用户代码：直接使用高级 API 构建 Agent                                   │
│  - 用户实现 MoFAAgent trait                                            │
│  - 使用 AgentBuilder 构建 Agent                                         │
│  - 使用 Runtime 管理 Agent 生命周期                                     │
└─────────────────────────────────────────────────────────────────────────┘
                                  ↓
┌─────────────────────────────────────────────────────────────────────────┐
│                    SDK层 (mofa-sdk)                                      │
│  统一API入口：重新导出各层类型，提供跨语言绑定                            │
│                                                                          │
│  模块组织：                                                              │
│  - kernel: 核心抽象层 (MoFAAgent, AgentContext, etc.)                        │
│  - runtime: 运行时层 (AgentBuilder, SimpleRuntime, etc.)                │
│  - foundation: 业务层 (llm, secretary, react, etc.)                    │
│  - 顶层便捷导出：常用类型直接导入                                         │
│                                                                          │
│  特性：                                                                  │
│  - 模块化入口 (use mofa_sdk::kernel::*, runtime::*, etc.)             │
│  - Feature flags 控制可选能力                                           │
│  - 跨语言绑定 (UniFFI, PyO3)                                            │
│  - 模块化命名空间                                                       │
└─────────────────────────────────────────────────────────────────────────┘
                                  ↓
┌─────────────────────────────────────────────────────────────────────────┐
│                 业务层 (mofa-foundation)                                 │
│  业务功能和具体实现                                                      │
│                                                                          │
│  核心模块：                                                              │
│  - llm: LLM 集成 (OpenAI provider)                                      │
│  - secretary: 秘书 Agent 模式                                           │
│  - react: ReAct 模式实现                                                │
│  - workflow: 工作流编排                                                 │
│  - coordination: 多 Agent 协调                                          │
│  - collaboration: 自适应协作协议                                         │
│  - persistence: 持久化层                                                │
│  - prompt: 提示词工程                                                   │
│                                                                          │
│  职责：                                                                  │
│  - 提供生产就绪的 Agent 实现                                            │
│  - 实现业务逻辑和协作模式                                                │
│  - 集成外部服务 (LLM, 数据库等)                                         │
└─────────────────────────────────────────────────────────────────────────┘
                                  ↓
┌─────────────────────────────────────────────────────────────────────────┐
│                运行时层 (mofa-runtime)                                    │
│  Agent 生命周期和执行管理                                                 │
│                                                                          │
│  核心组件：                                                              │
│  - AgentBuilder: 构建器模式                                             │
│  - AgentRunner: 执行器                                                  │
│  - SimpleRuntime: 多 Agent 协调 (非 dora 模式)                           │
│  - AgentRuntime: Dora-rs 集成 (可选)                                    │
│  - 消息总线和事件路由                                                   │
│                                                                          │
│  职责：                                                                  │
│  - 管理 Agent 生命周期 (初始化、启动、停止、销毁)                        │
│  - 提供 Agent 执行环境                                                  │
│  - 处理 Agent 间通信                                                    │
│  - 支持插件系统                                                         │
│                                                                          │
│  依赖：                                                                  │
│  - mofa-kernel: 核心抽象                                                │
│  - mofa-plugins: 插件系统                                               │
│  - (可选) mofa-monitoring: 监控功能                                     │
└─────────────────────────────────────────────────────────────────────────┘
                                  ↓
┌─────────────────────────────────────────────────────────────────────────┐
│              抽象层 (mofa-kernel/agent/)                                  │
│  核心抽象和扩展                                                           │
│                                                                          │
│  核心 Trait：                                                            │
│  - MoFAAgent: 核心 trait (id, name, capabilities, execute, etc.)        │
│                                                                          │
│  扩展 Trait (可选)：                                                     │
│  - AgentLifecycle: pause, resume, interrupt                            │
│  - AgentMessaging: handle_message, handle_event                         │
│  - AgentPluginSupport: 插件管理                                         │
│                                                                          │
│  核心类型：                                                              │
│  - AgentContext: 执行上下文                                                  │
│  - AgentInput/AgentOutput: 输入输出                                      │
│  - AgentState: Agent 状态                                               │
│  - AgentCapabilities: 能力描述                                          │
│  - AgentMetadata: 元数据                                                │
│  - AgentError/AgentResult: 错误处理                                     │
│                                                                          │
│  职责：                                                                  │
│  - 定义统一的 Agent 接口                                                 │
│  - 提供核心类型和抽象                                                    │
│  - 支持通过 trait 组合扩展功能                                           │
└─────────────────────────────────────────────────────────────────────────┘
                                  ↓
┌─────────────────────────────────────────────────────────────────────────┐
│              核心层 (mofa-kernel)                                         │
│  最小化核心基础设施 - 无业务逻辑                                         │
│                                                                          │
│  核心模块：                                                              │
│  - context: 上下文管理                                                  │
│  - plugin: 插件系统接口                                                 │
│  - bus: 事件总线                                                        │
│  - message: 消息类型                                                    │
│  - core: 核心类型                                                       │
│  - logging: 日志系统                                                    │
│                                                                          │
│  职责：                                                                  │
│  - 提供最基础的数据结构                                                 │
│  - 实现事件总线和消息传递                                               │
│  - 定义插件接口                                                         │
│  - 无任何业务逻辑                                                       │
└─────────────────────────────────────────────────────────────────────────┘
                                  ↓
┌─────────────────────────────────────────────────────────────────────────┐
│              插件系统 (mofa-plugins)                                      │
│  双层插件架构                                                            │
│                                                                          │
│  编译时插件：                                                            │
│  - Rust/WASM 插件                                                       │
│  - 零成本抽象                                                           │
│  - 性能关键路径                                                         │
│                                                                          │
│  运行时插件：                                                            │
│  - Rhai 脚本引擎                                                        │
│  - 热重载支持                                                           │
│  - 业务逻辑扩展                                                         │
└─────────────────────────────────────────────────────────────────────────┘
                                  ↓
┌─────────────────────────────────────────────────────────────────────────┐
│              监控层 (mofa-monitoring) [可选]                              │
│  可观测性和指标                                                          │
│  - Web 仪表板                                                           │
│  - 指标收集                                                             │
│  - 分布式追踪                                                           │
└─────────────────────────────────────────────────────────────────────────┘

依赖关系

用户代码
    ↓
SDK层 (mofa-sdk)
    ↓
├──→ 业务层 (mofa-foundation)
│        ↓
│   ├──→ 运行时层 (mofa-runtime)
│   │        ↓
│   │    └──→ 抽象层 (mofa-kernel/agent/)
│   │             ↓
│   │          └──→ 核心层 (mofa-kernel)
│   │
│   └──→ 抽象层 (mofa-kernel/agent/)
│          ↓
│       核心层 (mofa-kernel)
│
└──→ 运行时层 (mofa-runtime)
         ↓
      ├──→ 抽象层 (mofa-kernel/agent/)
      │        ↓
      │     核心层 (mofa-kernel)
      │
      └──→ 插件系统 (mofa-plugins)
               ↓
            核心层 (mofa-kernel)

关键规则：上层依赖下层，下层不依赖上层。

各层职责

用户层

实现 Agent 业务逻辑
使用 SDK 提供的 API

SDK层

统一 API 入口
重新导出各层功能
提供跨语言绑定
模块化命名空间

业务层

LLM 集成
Agent 模式实现 (ReAct, Secretary, etc.)
工作流编排
协作协议
持久化

运行时层

Agent 生命周期管理
执行环境
事件路由
插件支持

抽象层

MoFAAgent 核心接口
扩展 trait
核心类型定义

核心层

基础数据结构
事件总线
消息传递
插件接口

插件系统

编译时插件 (Rust/WASM)
运行时插件 (Rhai 脚本)

监控层

可观测性
指标收集
分布式追踪

渐进式披露 Skills 机制

MoFA 支持基于 SKILL.md 的技能体系，并采用渐进式披露策略以控制上下文长度与成本。

第 1 层：仅注入技能元数据摘要（名称、描述、可用性）
第 2 层：按需加载指定技能的完整内容（当任务需要时）
支持 always skills 与多目录搜索（workspace > builtin > system）

use mofa_sdk::skills::SkillsManager;

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    // 扫描 skills 目录
    let skills = SkillsManager::new("./skills")?;

    // 仅注入摘要（metadata）
    let summary = skills.build_skills_summary().await;

    // 按需加载技能内容（SKILL.md）
    let requested = vec!["pdf_processing".to_string()];
    let content = skills.load_skills_for_context(&requested).await;

    let system_prompt = format!(
        "You are a helpful assistant.\n\n# Skills Summary\n{}\n\n# Requested Skills\n{}",
        summary, content
    );
    println!("{}", system_prompt);
    Ok(())
}

使用示例

自定义 Agent（结合 Skills 与运行时）

use mofa_sdk::kernel::{
    AgentCapabilities, AgentCapabilitiesBuilder, AgentContext, AgentError, AgentInput, AgentOutput,
    AgentResult, AgentState, MoFAAgent,
};
use mofa_sdk::runtime::AgentRunner;
use mofa_sdk::llm::{LLMClient, openai_from_env};
use mofa_sdk::skills::SkillsManager;
use async_trait::async_trait;
use std::sync::Arc;

struct MyAgent {
    caps: AgentCapabilities,
    state: AgentState,
    llm: LLMClient,
    skills: SkillsManager,
}

impl MyAgent {
    fn new(llm: LLMClient, skills: SkillsManager) -> Self {
        Self {
            caps: AgentCapabilitiesBuilder::new().tag("llm").tag("skills").build(),
            state: AgentState::Created,
            llm,
            skills,
        }
    }
}

#[async_trait]
impl MoFAAgent for MyAgent {
    fn id(&self) -> &str { "my-agent" }
    fn name(&self) -> &str { "My Agent" }
    fn capabilities(&self) -> &AgentCapabilities { &self.caps }

    async fn initialize(&mut self, _ctx: &AgentContext) -> AgentResult<()> {
        self.state = AgentState::Ready;
        Ok(())
    }

    async fn execute(&mut self, input: AgentInput, ctx: &AgentContext) -> AgentResult<AgentOutput> {
        let user_input = input.to_text();
        let requested: Option<Vec<String>> = ctx.get("skill_names").await;

        let summary = self.skills.build_skills_summary().await;
        let mut system_prompt = format!("You are a helpful assistant.\n\n{}", summary);

        if let Some(names) = requested.as_ref() {
            let details = self.skills.load_skills_for_context(names).await;
            if !details.is_empty() {
                system_prompt = format!("{}\n\n# Requested Skills\n\n{}", system_prompt, details);
            }
        }

        let response = self.llm
            .chat()
            .system(system_prompt)
            .user(user_input)
            .send()
            .await
            .map_err(|e| AgentError::ExecutionFailed(e.to_string()))?;

        Ok(AgentOutput::text(response.content().unwrap_or_default()))
    }

    async fn shutdown(&mut self) -> AgentResult<()> {
        self.state = AgentState::Shutdown;
        Ok(())
    }

    fn state(&self) -> AgentState { self.state.clone() }
}

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let provider = openai_from_env()?;
    let llm = LLMClient::new(Arc::new(provider));
    let skills = SkillsManager::new("./skills")?;
    let agent = MyAgent::new(llm, skills);

    let ctx = AgentContext::with_session("exec-001", "session-001");
    ctx.set("skill_names", vec!["pdf_processing".to_string()]).await;

    let mut runner = AgentRunner::with_context(agent, ctx).await?;
    let output = runner.execute(AgentInput::text("Extract key fields from this PDF")).await?;
    runner.shutdown().await?;
    println!("{}", output.to_text());
    Ok(())
}

批量执行

use mofa_sdk::kernel::{AgentCapabilities, AgentCapabilitiesBuilder, AgentContext, AgentInput, AgentOutput, AgentResult, AgentState, MoFAAgent};
use mofa_sdk::runtime::run_agents;
use async_trait::async_trait;

struct EchoAgent {
    caps: AgentCapabilities,
    state: AgentState,
}

impl EchoAgent {
    fn new() -> Self {
        Self {
            caps: AgentCapabilitiesBuilder::new().tag("echo").build(),
            state: AgentState::Created,
        }
    }
}

#[async_trait]
impl MoFAAgent for EchoAgent {
    fn id(&self) -> &str { "echo-agent" }
    fn name(&self) -> &str { "Echo Agent" }
    fn capabilities(&self) -> &AgentCapabilities { &self.caps }

    async fn initialize(&mut self, _ctx: &AgentContext) -> AgentResult<()> {
        self.state = AgentState::Ready;
        Ok(())
    }

    async fn execute(&mut self, input: AgentInput, _ctx: &AgentContext) -> AgentResult<AgentOutput> {
        Ok(AgentOutput::text(format!("Echo: {}", input.to_text())))
    }

    async fn shutdown(&mut self) -> AgentResult<()> {
        self.state = AgentState::Shutdown;
        Ok(())
    }

    fn state(&self) -> AgentState { self.state.clone() }
}

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let inputs = vec![
        AgentInput::text("task-1"),
        AgentInput::text("task-2"),
    ];
    let outputs = run_agents(EchoAgent::new(), inputs).await?;
    for output in outputs {
        println!("{}", output.to_text());
    }
    Ok(())
}

LLMAgentBuilder（核心构建器）

LLMAgentBuilder 位于 foundation 层，负责把 LLM provider、提示词、会话、插件与持久化等能力组装为 LLMAgent。LLMAgent 实现了 MoFAAgent，因此可以被运行时执行引擎或 AgentRunner 直接运行。

端到端：从构建到运行（最佳实践）

use mofa_sdk::kernel::AgentContext;
use mofa_sdk::runtime::AgentRunner;
use mofa_sdk::llm::{LLMAgentBuilder, HotReloadableRhaiPromptPlugin};
use mofa_sdk::persistence::{PersistencePlugin, PostgresStore};
use mofa_sdk::kernel::AgentInput;
use std::sync::Arc;
use uuid::Uuid;

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    // 1) 持久化插件（可选，但推荐用于生产）
    let store = Arc::new(PostgresStore::connect("postgres://localhost/mofa").await?);
    let user_id = Uuid::now_v7();
    let tenant_id = Uuid::now_v7();
    let agent_id = Uuid::now_v7();
    let session_id = Uuid::now_v7();
    let persistence = PersistencePlugin::new(
        "persistence-plugin",
        store,
        user_id,
        tenant_id,
        agent_id,
        session_id,
    );

    // 2) 提示词模板（可热重载）
    let prompt = HotReloadableRhaiPromptPlugin::new("./prompts/template.rhai").await;

    // 3) 构建 LLM Agent（配置 + 会话 + 插件）
    let mut agent = LLMAgentBuilder::from_env()?
        .with_id("support-agent")
        .with_name("Support Agent")
        .with_system_prompt("You are a helpful assistant.")
        .with_sliding_window(10)
        .with_session_id(session_id.to_string())
        .with_hot_reload_prompt_plugin(prompt)
        .with_persistence_plugin(persistence)
        .build_async()
        .await;

    // 4) Session 管理（可在运行前创建/切换）
    let session_id = agent.create_session().await;
    agent.switch_session(&session_id).await?;

    // 5) 运行时上下文（执行态元数据）
    let ctx = AgentContext::with_session("exec-001", session_id.clone());
    ctx.set("user_id", user_id.to_string()).await;

    // 6) 通过 AgentRunner 运行（MoFAAgent 生命周期）
    let mut runner = AgentRunner::with_context(agent, ctx).await?;
    let output = runner.execute(AgentInput::text("Hello")).await?;
    println!("{}", output.to_text());
    Ok(())
}

Agent 上下文管理

use mofa_sdk::kernel::AgentContext;
use mofa_sdk::runtime::AgentRunner;
use mofa_sdk::llm::LLMAgentBuilder;
use mofa_sdk::kernel::AgentInput;

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let agent = LLMAgentBuilder::from_env()?
        .with_system_prompt("You are a helpful assistant.")
        .build();

    let ctx = AgentContext::with_session("exec-001", "session-001");
    ctx.set("user_id", "user-123").await;

    let mut runner = AgentRunner::with_context(agent, ctx).await?;
    let output = runner.execute(AgentInput::text("Hello")).await?;
    println!("{}", output.to_text());
    Ok(())
}

插件上下文与配置传递（LLM Plugin Context）

LLMAgent 初始化时会为每个 AgentPlugin 构造 PluginContext，并注入： custom_config、user_id、tenant_id、session_id。插件可在 load 阶段读取这些配置。

#![allow(unused)]
fn main() {
use mofa_sdk::plugins::{
    AgentPlugin, PluginContext, PluginMetadata, PluginResult, PluginState, PluginType,
};

struct MyPlugin;

#[async_trait::async_trait]
impl AgentPlugin for MyPlugin {
    fn metadata(&self) -> &PluginMetadata {
        static META: std::sync::OnceLock<PluginMetadata> = std::sync::OnceLock::new();
        META.get_or_init(|| {
            PluginMetadata::new("my-plugin", "My Plugin", PluginType::Custom("example".to_string()))
        })
    }
    fn state(&self) -> PluginState { PluginState::Unloaded }
    async fn load(&mut self, ctx: &PluginContext) -> PluginResult<()> {
        if let Some(model) = ctx.config.get_string("model") {
            println!("model = {}", model);
        }
        Ok(())
    }
    async fn init_plugin(&mut self) -> PluginResult<()> { Ok(()) }
    async fn start(&mut self) -> PluginResult<()> { Ok(()) }
    async fn stop(&mut self) -> PluginResult<()> { Ok(()) }
    async fn unload(&mut self) -> PluginResult<()> { Ok(()) }
    async fn execute(&mut self, input: String) -> PluginResult<String> { Ok(input) }
    fn as_any(&self) -> &dyn std::any::Any { self }
    fn as_any_mut(&mut self) -> &mut dyn std::any::Any { self }
    fn into_any(self: Box<Self>) -> Box<dyn std::any::Any> { self }
}

// 通过 LLMAgentBuilder 传递自定义配置：
// LLMAgentBuilder::new().with_config("model", "gpt-4o-mini").with_plugin(MyPlugin)
}

提示词管理（模板/热重载）

use mofa_sdk::llm::{LLMAgentBuilder, HotReloadableRhaiPromptPlugin};

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let prompt = HotReloadableRhaiPromptPlugin::new("./prompts/template.rhai").await;

    let _agent = LLMAgentBuilder::from_env()?
        .with_hot_reload_prompt_plugin(prompt)
        .build();
    Ok(())
}

Session 管理

use mofa_sdk::llm::LLMAgentBuilder;

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let agent = LLMAgentBuilder::from_env()?
        .with_session_id("user-session-001")
        .build();

    let session_id = agent.create_session().await;
    let reply = agent.chat_with_session(&session_id, "Hello").await?;
    println!("{}", reply);
    Ok(())
}

持久化管理

use mofa_sdk::llm::LLMAgentBuilder;
use mofa_sdk::persistence::{PersistencePlugin, PostgresStore};
use std::sync::Arc;
use uuid::Uuid;

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let store = Arc::new(PostgresStore::connect("postgres://localhost/mofa").await?);
    let user_id = Uuid::now_v7();
    let tenant_id = Uuid::now_v7();
    let agent_id = Uuid::now_v7();
    let session_id = Uuid::now_v7();

    let plugin = PersistencePlugin::new(
        "persistence-plugin",
        store,
        user_id,
        tenant_id,
        agent_id,
        session_id,
    );

    let _agent = LLMAgentBuilder::from_env()?
        .with_persistence_plugin(plugin)
        .build_async()
        .await;
    Ok(())
}

使用 LLM

use mofa_sdk::llm::{LLMClient, openai_from_env};

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let provider = openai_from_env()?;
    let client = LLMClient::new(std::sync::Arc::new(provider));
    let response = client.ask("What is Rust?").await?;
    println!("{}", response);
    Ok(())
}

多 Agent 协调

use mofa_sdk::runtime::{SimpleRuntime, AgentBuilder};
use mofa_sdk::kernel::MoFAAgent;

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let runtime = SimpleRuntime::new();

    // 注册多个 agent
    let agent1 = MyAgent1::new();
    let agent2 = MyAgent2::new();

    runtime.register_agent(agent1.metadata(), agent1.config(), "worker").await?;
    runtime.register_agent(agent2.metadata(), agent2.config(), "worker").await?;

    // 启动运行时
    runtime.start().await?;

    Ok(())
}

设计决策

为什么采用微内核架构？

可扩展性：通过插件系统轻松扩展功能
灵活性：用户可以只依赖需要的层
可维护性：清晰的层次边界使代码易于维护
可测试性：每层可以独立测试

为什么 SDK 不只依赖 Foundation？

虽然微内核架构强调分层，但 SDK 作为统一的 API 入口，需要：

暴露 Runtime 的运行时管理功能
暴露 Kernel 的核心抽象
暴露 Foundation 的业务功能

因此 SDK 作为 facade，重新导出各层的功能，而不是逐层依赖。

为什么 Foundation 和 Runtime 是平级关系？

Foundation 提供业务能力（LLM、持久化、模式等）
Runtime 提供执行环境（生命周期管理、事件路由等）

两者职责不同，互不依赖，都依赖 Kernel 提供的核心抽象。

未来改进

更严格的依赖检查：使用 cargo deny 等工具防止错误的依赖方向
更细粒度的 feature flags：减少编译时间
更完整的文档：每个模块都有详细的文档和示例
性能优化：优化关键路径的性能
更好的错误处理：统一的错误处理机制

参考资料

English | 简体中文

Keyboard shortcuts

MoFA 文档