侧边栏壁纸
博主头像
MobotStone AI

行动起来,活在当下

  • 累计撰写 55 篇文章
  • 累计创建 9 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

深入剖析 Skills.md —— 不是炒冷菜,而是 Agent 的“操作手册”

Administrator
2026-01-29 / 0 评论 / 0 点赞 / 10 阅读 / 0 字

如果要选一个“2025 年底最火的概念词”,那大概率就是skills 了。

但我刚打开skill.md 的时候,老实说第一眼直接看懵:我脑子里冒出的念头是——这是不是又在“重复造轮子”?

毕竟大家早就会做Agent 工具了,用来让智能体真正去执行任务。在不同平台和生态里,这类东西只是叫法不同:有人叫tools(工具),有人叫plugins(插件),也有人叫skills(技能)。所以我一开始理所当然地以为:这不就是同一种东西换个包装、换个名字吗?

结果我继续往下研究,才发现事情没这么简单。我彻底理清了skill.md的定义,也理解了 Anthropic 推出它的战略意图。事实证明,它与传统的 Agent 工具之间,存在著关键性的差异。

核心区别:“脑子”里的想法 vs “手里”的工具

简单来说,这两者的区别就像是 “操作手册” 和 “工具箱” 的区别。

1. Agent Skills:装在脑子里的“做事套路”

Agent Skills就像给一个新来的实习生发了一本工作手册,或者说一套技能秘籍

  • 它是一份标准化的教程(通常写在skill.md文件里)。

  • 它教AI遇到某种任务时该怎么动脑子:

    第一步干啥,第二步干啥,有哪些细节要注意。

举个例子:如果这是做菜的技能,那它就是**“回锅肉的菜谱”**。

它告诉AI:先切肉、再炒青椒、最后加调料——每个步骤的节奏都列得明明白白。

  • Skill = “做事方法”,让AI知道该怎么干

2. Agent Tools:拿在手里的工具

Tools是AI手里真正能用的工具

  • 比如:电脑的命令行、读取文件的接口、联网搜索用的API……

举个例子:在厨房里,Skills是“菜谱”,而Tools就是菜刀、炒锅和燃气灶

它们不会自己炒菜,但没有它们,连锅都上不了。

  • Tool = “操作能力”,让AI能动手去干

一句话总结:

  • skills告诉智能体“怎么做”——是经验和方法;

  • tools让智能体“能动手”——是执行的能力。

    而且,一个技能往往会指导智能体用合适的工具去完成任务。

skills.md 解决了哪些问题?

既然工具已经存在,为什么还需要这种新格式?它解决了五个具体问题。

1. 把“能做”变成“会做”

  • 以前的问题:AI 工具很强,比如能发邮件、能查数据,但它不知道你们公司的“潜规则”或具体流程。就像一个有力气的员工,却不知道该先迈哪条腿。

  • 现在的方案skills.md 不仅给 AI 赋予行动能力,还把“什么时候做”以及“结合公司/团队/用户的具体情况该怎么做”的背景知识一起打包给它。

2. 不一次性塞太多信息

  • 以前的问题:为了让 AI 懂得多,把所有资料一股脑全塞进它的对话记忆里(Context),导致它运行缓慢,而且容易“消化不良”(上下文膨胀)。

  • 现在的方案:这是一种“省流模式”。刚开始只加载一个大概的“目录”(极小的内存占用),等真要用这个技能时,再加载详细的说明书,需要素材时再加载素材。

3. 一次编写,到处通用

  • 以前的问题:很多工具是“专机专用”的,换一个 AI 平台就得重写。

  • 现在的方案skills.md 就像一个通用的 USB 设备。你把技能包做好一次,就可以插到各种不同的 AI 代理(Agent)产品上直接使用,不用重复造轮子。

4. 把“老专家的经验”打包

  • 以前的问题:复杂的流程(比如法律合规、数据处理)很难传递,往往依赖人的口口相传。

  • 现在的方案:它可以把这些专业的、复杂的流程封装成一个标准的“技能包”。这个包有版本记录、可以被审计,方便在不同团队之间安全地共享专业经验。

5. 只要识字就能看懂

  • 以前的问题:很多工具的逻辑写在复杂的代码里,想搞清楚它到底怎么运行的,像读天书一样难。

  • 现在的方案skills.md本质上就是一份 Markdown 格式的文档。它不仅机器能读,人也能轻松阅读。无论是检查、修改还是优化,都像编辑普通文档一样简单直观。

案例分析: HR Skill

以下是skill.md文件的实际示例。

--- 名称:人力资源问题解答
描述:解答与人力资源相关的问题,包括政策、福利、请假、入职和员工指南。
---
# 人力资源问题处理
## 何时使用此技能
当用户询问以下问题时,请使用此技能:
- 公司政策(考勤、着装规范、远程办公)
- 福利(医疗保险、退休计划、带薪休假)
- 请假(年假、病假、育儿假)
- 入职和离职流程
- 绩效考核和反馈流程
- 薪酬和工资相关问题

## 如何解答人力资源问题
1. 根据用户的问题确定人力资源主题
2. 参考相应的公司政策文件
3. 提供清晰准确的信息
4. 对于敏感或复杂的问题,请转介给人力资源联系人

## 重要准则
- 切勿泄露员工机密信息
- 将法律或合规问题上报人力资源主管
- 始终在适用情况下引用相关政策文件 # 人力资源问题处理

它存储在以下文件夹结构中:

my-skill/
├── SKILL.md          # 必需:说明 + 元数据
├── scripts/          # 可选:可执行代码
├── references/       # 可选:文档
└── assets/           # 可选:模板、资源

image-gIHy.png

skill是怎么工作的

技能采用来高效管理上下文。

  • 发现阶段: 启动时,智能体只加载每个技能的名称和简介。信息够用来判断“这个技能可能用得上吗?”

  • 激活阶段:当任务和某个技能的描述匹配时,智能体才会把完整的SKILL.md 说明读进上下文。

  • 执行阶段: 智能体按说明操作,必要时再加载相关文件或运行打包的代码。

这样既能保持速度,又能在需要时获取更多信息。核心要点就是渐进式信息披露:省 token,减少提示词膨胀。

特性

Skills.md (Agent Skills)

Agent Tools (Capabilities)

核心概念

知识与专长: 告诉Agent如何以及何时处理复杂任务的“剧本”。

机制与动作: 允许Agent与外部世界(API、系统)交互的“双手”。

主要功能

提供上下文、工作流、规则和最佳实践。它负责编排推理过程。

执行特定的、确定性的功能,如查询数据库、写文件或发送电子邮件。

文件结构

一个包含 skill.md 文件(Markdown 指令 + YAML 元数据)和可选资源文件的文件夹。

一个架构(通常是 JSON),定义函数名称、参数、描述以及运行它们的后端代码。

上下文管理

渐进式披露: 开始时仅加载微量的元数据(约 100 个 token)。仅在相关时才加载完整指令。

预先加载: 通常需要在会话开始时将完整的工具定义和架构加载到上下文窗口中。

相互关系

一个“skill”通常会使用“tool”。它充当管理者的角色,指导使用哪些tool以及按什么顺序使用。

“工具”由Agent(或技能)使用。它们是等待被调用的原始实用程序。

可移植性

知识的高可移植性(它只是文本/Markdown),但目前的格式特定于某些Agent运行时(如 Anthropic 的运行时)。

如果使用 MCP(模型上下文协议)等标准,则具有很高的执行可移植性,允许一个工具在许多应用程序中工作。

示例用例

“教Agent如何编写代码审查”(例如:检查逻辑错误、礼貌性、使用 Git 提取代码)。

“运行 API 调用”(例如:执行从代码库中检索数据的特定命令)。

总结:给 AI 装上“方向盘”

回到一开始的问题:不,我们并不是在重复造轮子。我们只是意识到:一辆车想开得好,光有轮子不够——还得有方向盘和地图

“Agent Tools”确实释放了很强的能力:它们让 AI 能接触真实世界、查询数据库、执行代码。但有能力不等于会做事、做得对

Skills.md正是用来补上“能做”和“做得好”之间的差距。

  • Tools解决的是“怎么执行”的问题:点按钮、调接口、跑代码。

  • Skills解决的是“怎么做才对”的问题:流程、上下文、细节拿捏与判断。

当我们走向更自动化的智能体时,真正的瓶颈往往不是“它能不能做这个动作”,而是“它知不知道你们团队规定的、那个明确的 10 步标准流程,并按要求做到位”。把“怎么做(Skills,方法与规范)”和“能做什么(Tools,执行能力)”分开后,智能体就不只是强大,还会更可靠、合规、高效

如果你只是做一些简单机器人,可能工具就够用;但如果你要做的是“数字员工”,那就必须要有技能(Skills)。

0
博主关闭了所有页面的评论