杨斌
发布于 2026-04-16 / 0 阅读
0
0

OpenClaw的基础知识

OpenClaw(曾用名 Clawdbot / Moltbot)是一个 MIT 协议开源、本地优先的 AI 智能体框架。你可以把它理解为一套“给大模型装上手和脚”的数字外骨骼,让 AI 不仅能对话,更能直接操作电脑、处理文件、控制浏览器,完成现实世界中的具体任务。

它的核心理念是分层解耦本地优先,旨在打造一个安全、可扩展、能长期运行的个人 AI 助手。

🦞 核心架构:四层各司其职

你可以从两个互补的角度来理解它的架构:

  • 从功能模块看:它包含 Gateway(网关)、Agent(智能体)、Skills(技能)、Memory(记忆)四个核心组件。

  • 从抽象层级看:它的设计可分为四个逻辑层。两者紧密结合,构成一个完整的系统。

下面是这“四层”设计的详细说明:

层级 (Layer)

类比

功能

对应的核心组件

模型层

🧠 大脑

提供智力:理解自然语言指令,进行意图识别与任务规划。核心是调用GPT-4o、Claude等大模型API。

Agent (部分)

技能层

🦞 双钳

提供执行力:封装了各种具体操作,如文件读写、浏览器控制、运行脚本等,是 Agent 的“手”。

Skills

工作流层

🧬 神经系统

任务编排:负责将复杂任务拆解成多个子任务,并协调、编排技能的执行顺序。

Agent

执行层

💪 身体

物理落地:在安全沙箱环境中,真正执行来自技能层的指令,完成系统调用。

Pi-embedded, Tools & Plugins

🔧 核心组件详解

这四大核心组件(Gateway、Agent、Skills、Memory)是整个架构的具体体现,它们的协作构成了一个高效、安全的系统。

  1. Gateway (网关):系统的“大脑皮层”与交通枢纽

    • 功能:Gateway是整个系统的核心,充当统一的中央路由器。它负责连接所有外部消息渠道(如微信、飞书、Telegram等)和控制界面(Web、CLI)。

    • 关键职责

      • 统一接入:将不同平台的私有协议(如微信、钉钉)转换为系统内部的统一事件流,解决了渠道碎片化问题。

      • 集中调度:负责会话管理、生命周期管理和任务路由,将所有请求分发至对应的Agent执行。

      • 安全与鉴权:执行设备配对和访问控制,确保只有授权终端才能接入,保障系统安全。

  2. Agent (智能体):系统的“项目经理”

    • 功能:这是系统的决策和推理引擎。它接收Gateway传来的用户请求,负责理解任务、制定计划并协调资源。

    • 工作方式:Agent是独立的智能体单元。OpenClaw支持多Agent协作,可以创建多个独立的Agent(子Agent)并行处理不同子任务,实现高效的团队合作。它的思考过程遵循 ReAct (Reasoning + Acting) 模式,即“思考→行动→观察”的循环,根据执行结果不断调整策略。

  3. Skills (技能):系统的“标准工具库”

    • 功能:这是OpenClaw可无限扩展的执行能力模块。它基于社区的SKILL.md规范,通过Markdown文档来定义。任何人都可以为OpenClaw创建新技能,整个生态因此拥有了超过5700个社区贡献的技能。

    • 优势:这种设计让“技能”像乐高积木一样,可以被动态加载,极大地增强了系统的灵活性和可扩展性。

  4. Memory (记忆):系统的“持久化存储”

    • 功能:提供跨会话的上下文管理,让AI“记住”与你的过往互动,避免每次都从头开始。

    • 设计哲学:OpenClaw将所有状态(身份、规则、记忆、工具配置)都保存在本地磁盘的 Markdown (.md) 文件中。这种“一切皆文件”的设计,让状态的管理变得极其透明和简单。

    • 三级记忆架构

      • 短期记忆:负责当前任务的对话上下文。

      • 中期记忆:存储任务执行的历史,如执行步骤、失败原因等。

      • 长期记忆:记录用户偏好和组织知识,让AI越用越懂你。

⚙️ 工作流程:一条消息的完整之旅

当你在微信上对OpenClaw说“帮我整理下载文件夹”,后台会依次发生:

  1. 渠道接入:Gateway通过飞书插件接收到消息。

  2. 会话加载:系统从Memory中加载该用户的会话历史。

  3. 任务规划:Agent进行意图识别,将任务拆解为“扫描目录、按文件类型分类、移动文件”等步骤。

  4. 技能执行:Agent匹配并调用对应的“文件整理”技能。

  5. 结果反馈:执行结果返回Agent,生成“已完成整理”的回复,通过Gateway发回给用户。

✨ 关键特性与安全保障

  • 本地优先与隐私安全:所有数据本地处理、存储和运行,无需上传至云端,保障了敏感信息的安全。

  • 开箱即用的多平台支持:原生支持微信、飞书、Discord、Telegram等十余种主流聊天平台,用户可在日常IM软件中直接与AI对话。

  • 安全沙箱与权限控制:所有工具调用都在安全沙箱环境中进行,并通过白名单机制严格控制Agent的权限,防止其进行越权操作。

  • 强大的工具集成能力:不重复造轮子,直接调用系统现有的强大工具,如 ffmpeg 处理音视频、curl 发起网络请求等。

🌐 生态与部署

OpenClaw生态发展迅速,已涌现出面向不同场景的衍生版本,如轻量级 PicoClaw、高性能 MaxClaw、面向医疗的 MedClaw 等。部署方式也极其灵活,你可以:

  • 一键部署:在Windows或阿里云等平台,下载安装包一键安装。

  • 源码部署:通过GitHub克隆代码自行部署。

  • 访问官方网站openclaw.ai

🧠架构图

image-Awdl.png

💎 总结

OpenClaw并非一个普通的聊天机器人,而是一个将大模型的“智慧”与本地系统的“行动力”深度融合的AI操作系统。它通过精巧的分层架构,解决了AI从“能说”到“会做”的工程难题,代表着AI智能体技术的一个重要演进方向。


评论