## 1. 技术概览与环境准备
### 1.1 核心组件说明
- **MiniMax Agent**: 提供图形化界面的桌面端 AI 智能体应用。支持 Windows、macOS 和 Web 端跨平台运行。内置 MCP（模型上下文协议）集成与特定领域的专家系统。
- **MaxClaw**: 由MiniMax发布的云端托管的OpenClaw，无需手动部署，直接上手使用，预置专家功能适用多种工作场景。
- **MiniMax M2.5**: 底层驱动大语言模型。具备强大的代码编写、工具调用以及长文本处理能力，在 SWE-Bench 等基准测试中表现出色，API 调用成本极低。
### 1.2 安装与部署步骤
1. 访问网页端 [agent.minimax.io](https://agent.minimax.io)。
2. 在右上角选择对应操作系统（Windows/macOS）的安装包下载。
3. 双击运行安装程序，完成本地客户端部署。
4. 启动桌面端应用程序，登录账号。

## 2. 界面布局与基础配置
应用界面主要分为对话区与底部功能配置区。
### 2.1 目录访问授权 (Workspace)
点击界面左下角第三个文件夹图标，为智能体指定工作目录。
- **操作逻辑**: 指定目录后，智能体能够直接读取和写入目标文件夹内的文件。
- **适配对象**: 本地 Excel 报表文件夹、Obsidian 本地笔记库目录等。
- **风险提示**: 建议仅授权特定工作目录，并提前做好文件备份，防止文件被覆盖或误删。
### 2.2 MCP 与子代理配置
点击界面左下方第二个配置图标，接入外部服务。
- **Notion 接入**: 在配置界面中找到 Notion 选项，直接填入 Notion 的集成密钥（Integration Token）就可以完成绑定。不需要编写 JSON 配置文件。
### 2.3 模型与响应模式选择
位于对话框右下方。
- **模型选择**: 推荐选择 MiniMax M2.5。
- **任务模式**: 支持在快速响应和复杂任务模式之间切换。
#### MiniMax M2.5模型
结合 2026 年最新的基准测试数据，MiniMax M2.5 在代码编写、工具调用和多轮复杂任务执行上，已经具备对标顶级闭源大模型的能力。

![[排行榜.jpg]]

*   **基准测试数据对比**：
    *   **代码工程能力**：在 SWE-Bench Verified 测试中，M2.5 得分为 80.2%，和 Claude Opus 4.6（80.8%）以及 GPT-5.2（80%）处于同一梯队。在 Multi-SWE-Bench 多库协同任务中，得分为 51.3%，超越了 Claude Opus 4.5 与 4.6。
    *   **工具与环境调用**：在 BrowseComp (w/ctx) 网页与上下文环境中得分 76.3%；在 BFCL multi-turn 多轮函数调用测试中得分 76.8%，全面领先 Claude Opus 4.5（68%）和 Gemini 3 Pro（61%），位列横向测评第一。
*   **处理速度与逻辑架构**：
    *   这个模型具备架构师级别的全局规划能力，在生成代码前会自动执行特征拆解与 UI 规划。
    *   原生推理速度最高可达 100 token/秒（Lightning 版本），执行复杂智能体任务的平均耗时比上一代 M2.1 缩短 37%，和 Claude Opus 4.6 的速度持平。
*   **极致的性价比**：
    *   API 定价约为输入 $0.30 / 1M token，输出 $1.20 / 1M token。
    *   在相同的复杂任务处理流程下，M2.5 的总调用成本仅为 Claude Opus 4.6 的 10% 左右。对于需要长时间挂机运行、产生大量上下文消耗的桌面智能体而言，使用这个模型能彻底消除高昂的 API 账单风险。
*   **社区评价：OpenClaw的最优模型**



## 3. 专家系统与应用场景实操

专家系统封装了特定领域的知识、工具链和操作逻辑，替代了传统的 Agent Skill 手动安装与 API 配置。在专家界面通过关键词搜索就可以直接调用。

### 3.1 场景一：生成结构化 PPT
调用 **AI PPT** 专家，通过子代理执行页面规划与样式设计。

**操作步骤**:
1. 进入专家界面，搜索并选择 AI PPT 专家。
2. 发送具体的主题与结构要求。
3. 智能体将自动规划大纲、分配配色方案并生成 PPT 文件。

**执行提示词 (Prompt)**:
```markdown
# 任务目标
生成一份 10 页的 PPT。

# 核心参数
- 主题：AI Agent（人工智能智能体）技术深度分析
- 视觉风格：科技风

# 内容与排版规范
- 视觉呈现：每页提炼核心要点，拒绝大段文字堆砌，多使用层级列表或对比结构。
- 执行要求：不需要向我确认大纲，直接基于这个框架逻辑和参数要求，生成最终的 PPT 文件。
```

### 3.2 场景二：本地英文文献翻译与分析
调用 **PDF 分析** 专家，处理多篇本地文献。

**操作步骤**:
1. 确保目标 PDF 文件（如从 Arxiv 下载的文献）已存放在授权的工作目录中。
2. 搜索并选择与文档分析或学术论文相关的专家。
3. 下达读取、翻译、提炼以及绘制结构图的指令。

**执行提示词 (Prompt)**:
```markdown
批量处理当前文件夹下的所有 PDF 文件。
对每一个 PDF 文件，执行以下操作：

1.  **内容读取与转化**：
    *   提取文本内容。
    *   将内容翻译并整理为中文（若原文非中文）。
    *   提炼核心观点、关键数据和结论。

2.  **生成 Obsidian 笔记 (.md)**：
    *   创建一个以PDF文章内容命名的 Markdown 文件。
    *   把提炼的核心知识点、数据与结论写入到markdown知识笔记中。

3.  **生成思维导图 (.canvas)**：
    *   创建一个与markdown笔记同名的 Obsidian JSON Canvas 文件。
    *   基于提取的内容构建思维导图（中心主题 -> 主要论点 -> 细节）。
    *   **关键要求**：请务必在生成 JSON 时计算合理的 x,y 坐标，确保节点呈树状或发散状排列，**不要**重叠在一起。

4.  **输出**：
    *   将生成的 .md 和 .canvas 文件保存在当前目录下。
```

### 3.3 场景三：生成个人网站 (代码生成)
调用 **Landing Page Builder** 专家，通过自然语言生成网站代码。

**操作步骤**:
1. 在专家界面搜索 Landing Page Builder。
2. 描述网站的用途、风格、功能需求与排版布局。
3. 智能体将自动生成代码并在浏览器中预览生成的网页。

**执行提示词 (Prompt)**:
```markdown
为我创建一个现代极简风格的个人博客网站。

风格要求：
网站采用左侧固定侧边栏 + 右侧内容画布的结构，侧边栏简洁垂直导航（Logo、首页、文章、关于我、联系方式），整体视觉偏左布局，而非居中型 landing page。
整体视觉为浅色极简风格，使用浅灰或米白背景、深灰文字与低对比灰色分隔线，避免纯黑纯白的强对比。大量留白，界面干净克制，强调阅读体验与内容优先。
排版为编辑式（Editorial Style）：大标题、宽松行距、清晰层级，通过字体大小与间距建立视觉重点，而不是依赖颜色或装饰。

首页顶部包含个人介绍区域：圆形头像、姓名标题、简短介绍文字，并配合低透明度背景图片作为氛围元素。
文章列表采用卡片或网格流布局，封面图片简洁，并带轻微 Hover 放大效果。

交互保持克制：平滑滚动、细微 hover 动效，不使用复杂动画或视觉特效。
整体气质：安静、理性、现代、像高质量个人博客或设计杂志网站，突出长期阅读体验。

```



### 3.4 场景四：自定义专家 - YouTube 视频转录与学习
如果预设专家无法满足需求，可以手动创建专属工作流。

**创建步骤**:
1. 点击专家界面右上角的创建按钮。
2. 输入专家名称（例如 YouTube 知识提取专家）。
3. 指定底层大语言模型（选择 MiniMax M2.5）。
4. 填入专家描述与系统指令。直接复制开源 YouTube-Transcript skill 的指令内容。
5. 保存并在我的专家列表中发起对话。

**执行提示词 (Prompt)**:
```markdown
当我发送一个 YouTube 视频链接时，获取视频字幕，把字幕内容保存到文件夹。
然后，执行以下流程：
1.  **内容读取与转化**：
    *   提取字幕内容。
    *   将内容翻译并整理为中文（若原文非中文）。
    *   提炼核心观点、关键数据和结论。

2.  **生成 Obsidian 笔记 (.md)**：
    *   创建一个以内容主题命名的 Markdown 文件。
    *   把提炼的核心知识点、数据与结论写入到markdown知识笔记中。

3.  **生成思维导图 (.canvas)**：
    *   创建一个与markdown笔记同名的 Obsidian JSON Canvas 文件。
    *   基于提取的内容构建思维导图。
    *   **关键要求**：请务必在生成 JSON 时计算合理的 x,y 坐标，确保节点**不要**重叠在一起。

4.  **输出**：
    *   将生成的 .md 和 .canvas 文件保存在当前目录下。

接下来，按照我的要求处理这个YouTube视频链接：[视频url]
```

#### 更多全栈开发场景尝试
- AI驱动的全栈任务管理应用（Kanban / 待办）

```markdown
你是一个高级全栈开发助手，我要构建一个完整可运行的 AI 驱动任务管理 Web 应用（类似看板/待办）。

**需求概况**
应用名称：AI 看板任务管理
核心功能：
1. 用户注册/登录/权限
2. 多看板/多任务列表
3. 拖拽排序卡片（Kanban）
4. 任务卡包含标题、描述、截止时间、标签
5. AI 自动建议任务优先级与分类
6. 后端保存用户数据并可导出为 JSON

**技术栈要求**
- 后端：Node.js + Express + 数据库（MongoDB 或 PostgreSQL）
- 前端：React（或 Vue3）+ Tailwind CSS
- 拖拽：React DnD 或 Vue Draggable
- AI部分：集成 AI 模型或 REST API 用于智能推荐

**输出要求**
1. 自动生成完整项目结构
2. 自动实现 REST API 和前后端联调
3. 自动生成前端页面（登录/看板/任务卡/统计）
4. 写好 README 和部署脚本（Docker + 启动说明）
5. 自动添加单元测试

请直接生成该项目完整代码，并解释每个主要部分用途。
```

- AI 图像生成与用户画廊系统（多人协作）

```markdown
你是全栈开发专家，我需要构建一个多人协作的 AI 图像生成与画廊 Web 平台。

**产品名称：AI 画廊协作平台**
核心功能：
1. 用户登录/注册/权限
2. 支持用户上传与生成图像
3. 集成图像生成模型 API（如 Stable Diffusion / Gemini 图像）
4. 多人协作：用户可对图像点赞/评论/变更提示词
5. 画廊展示页面支持筛选/排序
6. AI 自动生成图像标签与优化建议

**技术要求**
- 后端：Node.js + Express + 数据库（MongoDB）
- 前端：React/Vue + Vite + Tailwind CSS
- AI 接口：通过 REST 调用图像模型生成图像并保存 URL
- 文件存储：可用本地或云存储（S3/COS）

**输出要求**
1. 自动搭建完整可运行应用
2. 自动实现图像上传、生成与保存逻辑
3. 自动处理前后端 API 联调
4. 自动添加用户评论/点赞页面
5. 自动生成部署和测试脚本
6. 包含本地运行说明与部署说明

请生成该项目完整代码和部署说明。
```

- 智能数据可视化仪表盘（BI Dashboard）

```markdown
你是全栈开发助手，我要构建一个智能数据可视化仪表盘（BI Dashboard）Web 应用。

**项目名称：智能 BI 仪表盘**
核心功能：
1. 用户登录/权限管理
2. 可上传 CSV/Excel 数据
3. 自动分析数据结构与字段类型
4. 根据字段自动生成多种图表（折线/柱状/饼图等）
5. 支持实时筛选与过滤
6. AI 自动智能推荐图表类型与摘要分析
7. 用户可保存仪表盘视图配置

**技术栈**
- 后端：Node.js + Express + Python 数据分析服务（可选）
- 数据库：MongoDB / PostgreSQL
- 前端：React + Recharts / ECharts + Tailwind CSS
- AI 模型接口：通过 REST 调用分析和建议

**输出要求**
1. 自动创建完整项目目录与文件
2. 自动实现数据上传 API
3. 自动生成可交互式图表页面
4. 自动集成 AI 推荐引擎
5. 自动生成单元测试与部署说明

请直接生成完整项目代码、自动测试脚本以及 Docker 部署文档。
```

## 4. OpenClaw 自动化部署

### 4.1 一键部署OpenClaw到本地

针对 OpenClaw 终端部署报错率高的问题，MiniMax Agent 提供了图形化的一键部署功能。

**部署步骤**:
1. 在 MiniMax Agent 桌面端主界面点击一键部署 OpenClaw 按钮。
2. 在弹出的验证流程中，登录 MiniMax 账号。
3. 授权智能体自动获取 API Key 并配置环境变量。
4. 等待后台配置与安装流程结束，系统将自动打开 OpenClaw 的本地 Web 界面。
5. 在 OpenClaw 界面中发送测试指令以确认连接成功。
6. 模型选择方面，推荐在 OpenClaw 中配置 MiniMax M2.5 模型，平衡性能与 API 调用成本。

### 4.2 重磅更新：MaxClaw (云端托管模式)

MaxClaw 是 MiniMax 官方推出的 OpenClaw **云端托管版本**，旨在彻底解决本地部署的硬件门槛与 API 成本问题。

**核心特性**：
*   **一键部署：** 一键部署到云端，免除 OpenClaw 原本繁琐的命令行部署方式。
*   **免运维：** 无需本地 Docker 环境或 Python 依赖，云端环境 24/7 待命。
*   **全渠道控制：** 支持绑定 **Telegram / WhatsApp / Discord**，国内支持**飞书 / 钉钉**，实现通过手机 IM 软件远程遥控 Agent 执行任务。
*   **预置专家**：内置经过微调的垂直领域专家配置（如：爆款猎手、行业研报、热点追踪），开箱即用。

**使用逻辑**：
不再需要复杂的初始化流程，在 MiniMax Agent 界面顶部切换至 **MaxClaw** 模式，选择对应场景配置，即可直接通过自然语言驱动 OpenClaw 的全栈能力。

#### 4.2.1 连接Whatsapp与MaxClaw
直接在对话框中输入**连接Whatsapp**，AI会返回一个二维码，打开手机Whatsapp扫码即可完成链接。

#### 4.2.2 连接飞书与MaxClaw（最适合国内网络环境）
直接在对话框中输入**连接飞书**，AI会返回具体步骤，核心步骤是**创建飞书企业自建应用**。

登录 [飞书开放平台](https://open.feishu.cn/) -> 开发者后台。

1.  **创建应用**: 点击“创建企业自建应用”，填写名称（如 `MyBot`），选择图标。
2.  **添加能力**: 左侧菜单“添加应用能力” -> “机器人” -> 点击添加。
3.  **权限管理 (关键)**:
    *   进入“权限管理”。
    *   搜索并开通 `im:message` 相关权限 (收发消息)。
    *   **也可批量导入**: 点击“批量导入”，粘贴以下 JSON 配置 (参考模板):

```json
{
  "scopes": {
    "tenant": [
      "im:chat.access_event.bot_p2p_chat:read",
      "im:chat.members:bot_access",
      "im:chat:read",
      "im:message",
      "im:message.group_at_msg:readonly",
      "im:message.p2p_msg:readonly",
      "im:message:readonly",
      "im:message:send_as_bot",
      "im:resource"
    ],
    "user": [
      "contact:contact.base:readonly"
    ]
  }
}
```

4.  **版本发布**: 左侧“版本管理与发布” -> 创建版本 (v1.0.0) -> 发布。
5. **获取凭证**: 左侧“凭证与基础信息” -> 复制 `App ID` 和 `App Secret`。返回MaxClaw，把App ID和App Secret发送给AI，AI会打通链接。
6. **开启事件订阅**：返回飞书应用， 回到飞书开发者后台 -> “事件与回调”。**配置订阅方式**: 选择 **长连接**。**添加事件**: 点击“添加事件” -> 搜索 `receive` -> 勾选 `im.message.receive_v1` (接收消息) -> 确认。
7.  **重新发布**: 修改配置后，**必须**再次去“版本管理”发布一个新版本才能生效。
8. **手机APP测试**: 打开飞书 App -> 搜索机器人名称 -> 发送 "你好"。（飞书桌面APP同理）

#### 4.2.3 智能体使用案例
切换到**行业研报**模式，输入提示词，生成行业报告：

```markdown
深度调研 2026 年“ AI Agent”工具的竞争格局

请生成一份对比报告，核心分析以下 3 点：

1. **控制深度**：谁对本地文件系统（Local File System）和非 API 软件的接管能力更强？
2. **成本经济性**：对比“长链路任务”（如连续工作 4 小时）时的预估成本。
3. **生态护城河**：目前哪家的第三方“专家/插件”生态最丰富？

最后，用表格总结优劣势，并给出结论：对于“一人公司”创业者，谁是目前的性价比之选？
```

## 5. 成本核算与系统限制

操作复杂任务时需要注意云端计算积分的消耗情况。

### 5.1 典型任务积分消耗参考

| 任务类型 | 处理内容量级 | 预估积分消耗 |
| :--- | :--- | :--- |
| 一键部署 OpenClaw | 系统级环境配置 | 约 35 积分 |
| 个人网站代码生成 | 完整单页应用源码 | 约 600 积分 |
| YouTube 视频转录 | 10-20 分钟视频内容提取、翻译与绘图 | 约 700 积分 |
| 多 PDF 联合分析 | 4 篇学术论文全量读取、翻译与总结 | 约 800 积分 |

*补充说明：免费用户拥有 200 积分/日的额度；专业版订阅用户额度为 20,000 积分/月。*

### 5.2 优化建议
1. **结构化指令**: 提示词的结构越清晰，要素定义越严格，智能体生成的代码与内容质量就越高，可以有效减少反复修正带来的积分损耗。
2. **权限隔离**: 执行最小权限原则。如果需要智能体清理或重构文件，务必提前将目标文件拷贝至独立的测试文件夹中进行操作。

### 5.3 与其他Agent工具对比


| 对比维度     | MiniMax Agent            | Claude Cowork                       | Claude Code / OpenCode (命令行工具)                  |
| :------- | :----------------------- | :---------------------------------- | :---------------------------------------------- |
| **交互形态** | 图形化独立客户端，内置专家组件广场        | Claude Desktop 客户端内的独立标签页           | 纯文本终端界面 (CLI/TUI)                               |
| **平台支持** | Windows, macOS, Web, 移动端 | macOS, Windows（2026年2月10日支持Windows） | 依赖终端模拟器与系统底层的全平台                                |
| **技术门槛** | 零门槛，直接双击运行，免系统配置         | 较低门槛，依托沙盒虚拟机运行，需要基础的环境配置认知          | 极高，需要熟悉终端指令、配置环境变量以及排查代码报错                      |
| **使用成本** | 极低，每天赠送免费积分，按需消耗         | 极高，强制绑定 20 美元/月或更高阶的订阅套餐            | 隐性成本极高，需要用户自己支付底层大语言模型的 API 调用账单                |
| **限制因素** | 网络环境友好，无严格地区限制           | 地区风控极严（容易封禁 IP），强制锁定 Claude 闭源生态模型  | 缺乏图形界面的直观交互，对非程序员极度不友好；Claude Code 同样受限于严格的地区风控 |

> **专注 AI 与个人知识管理**
> 本文属于 [杰森的效率工坊](https://jasonai.me)原创。未经允许禁止商用。
> 
> **订阅杰森的频道：**
> [YouTube](https://www.youtube.com/@JasonEfficiencyLab) · [Twitter(X)](https://x.com/JasonEffiLab) · [小红书](https://www.xiaohongshu.com/user/profile/60935957000000000101fbf7) · [B站](https://space.bilibili.com/3546884870244925)