AI Agent 部署实战:从本地到云端的完整指南
AI Agent 部署实战:从本地到云端的完整指南 一、为什么需要多 Agent 部署? 在 AI 创业场景中,单一 AI 助手往往难以兼顾多种角色和任务。我们的实践表明: 角色专业化:每个 Agent 负责不同职能(内容策划、技术开发、数据分析、项目管理) 并行处理:多个 Agent 可以同时执行不同任务,效率提升显著 独立记忆:每个 Agent 有独立的记忆空间,避免信息混乱
核心思路:一个 Gateway 管理多个 Agent 实例,通过通道路由或用户路由将不同请求分发给对应 Agent。
二、环境准备 2.1 服务器要求
配置项
最低要求
推荐配置
CPU
2 核
4 核+
内存
4GB
8GB+
硬盘
40GB SSD
80GB+ SSD
系统
Ubuntu 20.04+ / CentOS 8+
Ubuntu 22.04 LTS
网络
稳定外网连接
带宽 5Mbps+ 2.2 基础软件安装
1. 安装 Node.js 18+
curl -fsSL https://deb.nodesource.com/setup_18.x | sudo -E bash - sudo apt-get install -y nodejs
2. 验证安装
node -v # 应显示 v18.x 或更高 npm -v
3. 安装 OpenClaw
npm install -g openclaw
4. 验证 OpenClaw
openclaw --version
2.3 AI 模型配置 我们使用阿里云通义千问作为底层模型:
限流注意:四个 Agent 共用 1000 万 TPM,需通过心跳偏移表错开调用时间,避免同时请求触发限流。
三、OpenClaw 安装与配置 3.1 安装 OpenClaw
全局安装
npm install -g openclaw
初始化配置目录
openclaw init
3.2 配置 Gateway Gateway 是 OpenClaw 的核心守护进程,负责管理所有 Agent 实例:
~/.openclaw/config.yaml
gateway: bind: 0.0.0.0:3000
启动 Gateway: openclaw gateway start openclaw gateway status openclaw gateway restart
3.3 配置 Agent 实例 每个 Agent 需要独立的 workspace 和配置文件: ~/.openclaw/ ├── agents/ │ ├── xiaolongnv/ # 小龙女 - 内容策划 │ │ ├── config.yaml │ │ └── workspace/ │ ├── zhangxiaolong/ # 张小龙 - 技术开发 │ │ ├── config.yaml │ │ └── workspace/ │ ├── ailong/ # 艾隆 - 数据分析 │ │ ├── config.yaml │ │ └── workspace/ │ └── gais/ # 盖茨 - 项目管理 │ ├── config.yaml │ └── workspace/
四、多 Agent 路由策略 4.1 按通道路由(推荐) 每个通道绑定一个 Agent,简单直接: 飞书群 → 小龙女(内容相关) QQ 群 → 张小龙(技术相关) Web UI → 盖茨(项目管理)
4.2 按用户路由 同一通道内,不同用户对应不同 Agent。
我们的选择:按通道路由 + 群聊路由。飞书群主要由小龙女响应,QQ 群由张小龙响应,各司其职。
五、防限流调度策略 四个 Agent 共用 1000 万 TPM,调度是关键: 5.1 心跳偏移表
Agent
心跳偏移
Cron 任务时间
小龙女
:00(整点)
周一 9:00、周三 10:00、周五 17:00
张小龙
:15(15 分)
周二 9:00、周四 10:00、周六 11:00
艾隆
:30(30 分)
周一 14:00、周三 15:00、周五 10:00
盖茨
:45(45 分)
周二 14:00、周四 15:00、周日 10:00 5.2 优化策略 错开整点,使用偏移量 平滑请求速率 大批量任务拆分 准备备选模型(qwen-plus、qwen3.6-plus)
六、飞书 & QQ 通道对接 6.1 飞书机器人配置 在飞书开放平台创建应用 获取 App ID 和 App Secret 配置机器人事件订阅 在 OpenClaw config 中填入凭证 6.2 QQ 机器人配置 在 QQ 开放平台创建频道机器人 获取 App ID 和 Token 配置权限和消息接收 在 OpenClaw config 中填入凭证
七、监控与维护 7.1 健康检查 openclaw gateway status openclaw agent list openclaw logs --follow
7.2 自动监控脚本 #!/bin/bash
agent-monitor.sh - 每分钟检查 Agent 状态
AGENTS=("xiaolongnv" "zhangxiaolong" "ailong" "gais") for agent in "${AGENTS[@]}"; do status=$(openclaw agent status $agent 2>/dev/null) if [[ "$status" != "running" ]]; then echo "[$(date)] $agent 异常,正在重启..." openclaw agent restart $agent fi done
八、常见问题排查 Q1: Agent 启动失败 netstat -tlnp | grep 3000 node -v # 需要 18+ openclaw logs --level debug
Q2: 飞书消息收不到 确认事件订阅已配置 确认 App 已添加到群聊 检查 webhook URL 是否可达 Q3: 限流 429 错误 检查心跳偏移表是否正确配置 查看当前 TPM 使用量 考虑切换到备选模型
九、最佳实践总结 独立 Workspace:每个 Agent 有独立的记忆和配置文件 错开调度:通过心跳偏移避免同时请求 监控告警:自动检测 Agent 状态并重启 日志记录:保留完整日志便于排查问题 定期备份:备份 workspace 和配置文件
十、进阶方向 动态扩缩容:根据负载自动增减 Agent 实例 Agent 间协作:通过 sessions_send 实现 Agent 间通信 自定义 Skill:为特定 Agent 编写专属技能 多模型切换:根据任务类型自动选择最优模型
© 2026 AiToMoney 团队 | AI Agent 部署实战:从本地到云端的完整指南
2.3 AI 模型配置 我们使用阿里云通义千问作为底层模型:
模型配置要点
模型:qwen3.5-plus 区域:新加坡(独享 1000 万 TPM 配额) 四智能体共用同一账户,需合理分配调用
3.3 配置 Agent 实例(续) 每个 Agent 的 config.yaml 示例:
~/.openclaw/agents/xiaolongnv/config.yaml
agent: name: 小龙女 model: oneapi/qwen3.5-plus workspace: /home/admin/.openclaw/agents/xiaolongnv/workspace
心跳配置
heartbeat: enabled: true interval: 30m maxConcurrentRuns: 20
通道配置(根据路由策略)
channels: - type: feishu # 飞书机器人配置 - type: qqbot # QQ 机器人配置
5.2 优化策略(续)
各 Agent 的调度配置要点
scheduler:
错开整点,使用偏移量
heartbeatOffset: 15 # 分钟
平滑请求速率
requestSmoothing: true
大批量任务拆分
batchSize: 50 batchInterval: 5m
备选模型
fallbackModels: - qwen-plus - qwen3.6-plus
2.3 AI 模型配置 我们使用阿里云通义千问作为底层模型:
模型配置要点
模型:qwen3.5-plus 区域:新加坡(独享 1000 万 TPM 配额) 四智能体共用同一账户,需合理分配调用
限流注意:四个 Agent 共用 1000 万 TPM,需通过心跳偏移表错开调用时间,避免同时请求触发限流。
3.3 配置 Agent 实例(续) 每个 Agent 的 config.yaml 示例:
~/.openclaw/agents/xiaolongnv/config.yaml
agent: name: 小龙女 model: oneapi/qwen3.5-plus workspace: /home/admin/.openclaw/agents/xiaolongnv/workspace
心跳配置
heartbeat: enabled: true interval: 30m maxConcurrentRuns: 20
通道配置(根据路由策略)
channels: - type: feishu # 飞书机器人配置 - type: qqbot # QQ 机器人配置
5.2 优化策略(续)
各 Agent 的调度配置要点
scheduler:
错开整点,使用偏移量
heartbeatOffset: 15 # 分钟
平滑请求速率
requestSmoothing: true
大批量任务拆分
batchSize: 50 batchInterval: 5m
备选模型
fallbackModels: - qwen-plus - qwen3.6-plus
2.3 AI 模型配置 我们使用阿里云通义千问作为底层模型:
模型配置要点
模型:qwen3.5-plus 区域:新加坡(独享 1000 万 TPM 配额) 四智能体共用同一账户,需合理分配调用
限流注意:四个 Agent 共用 1000 万 TPM,需通过心跳偏移表错开调用时间,避免同时请求触发限流。
3.3 配置 Agent 实例(续) 每个 Agent 的 config.yaml 示例:
~/.openclaw/agents/xiaolongnv/config.yaml
agent: name: 小龙女 model: oneapi/qwen3.5-plus workspace: /home/admin/.openclaw/agents/xiaolongnv/workspace
心跳配置
heartbeat: enabled: true interval: 30m maxConcurrentRuns: 20
通道配置(根据路由策略)
channels: - type: feishu # 飞书机器人配置 - type: qqbot # QQ 机器人配置
5.2 优化策略(续)
各 Agent 的调度配置要点
scheduler:
错开整点,使用偏移量
heartbeatOffset: 15 # 分钟
平滑请求速率
requestSmoothing: true
大批量任务拆分
batchSize: 50 batchInterval: 5m
备选模型
fallbackModels: - qwen-plus - qwen3.6-plus
2.3 AI 模型配置 我们使用阿里云通义千问作为底层模型:
模型配置要点
模型:qwen3.5-plus 区域:新加坡(独享 1000 万 TPM 配额) 四智能体共用同一账户,需合理分配调用
限流注意:四个 Agent 共用 1000 万 TPM,需通过心跳偏移表错开调用时间,避免同时请求触发限流。
3.3 配置 Agent 实例(完整示例) 每个 Agent 的 config.yaml 示例:
~/.openclaw/agents/xiaolongnv/config.yaml
agent: name: 小龙女 model: oneapi/qwen3.5-plus workspace: /home/admin/.openclaw/agents/xiaolongnv/workspace
心跳配置
heartbeat: enabled: true interval: 30m maxConcurrentRuns: 20
通道配置(根据路由策略)
channels: - type: feishu # 飞书机器人配置 - type: qqbot # QQ 机器人配置
5.2 优化策略(完整配置)
各 Agent 的调度配置要点
scheduler:
错开整点,使用偏移量
heartbeatOffset: 15 # 分钟
平滑请求速率
requestSmoothing: true
大批量任务拆分
batchSize: 50 batchInterval: 5m
备选模型
fallbackModels: - qwen-plus - qwen3.6-plus