skills-通用Agent的扩展包

skills-通用Agent的扩展包
jwang一个好 Skill 能发挥的智能效果,甚至能轻松等同、超越完整的 AI 产品。任何不懂技术的人,都能开发属于自己的 Skills
从概念来源到运作原理
- 2025 年 10 月中旬,Anthropic 正式发布 Claude Skills。两个月后,Agent Skills 作为开放标准被进一步发布,意在引导一个新的 AI Agent 开发生态.
- OpenAI、Github、VS Code、Cursor 均已跟进
- Agent 可通过加载不同的 Skills 包,来具备不同的专业知识、工具使用能力,稳定完成特定任务
Skills与MCP
- MCP 是一种开放标准的协议,关注的是 AI 如何以统一方式调用外部的工具、数据和服务,本身不定义任务逻辑或执行流程。
- Skill 则教 Agent 如何完整处理特定工作,它将执行方法、工具调用方式以及相关知识材料,封装为一个完整的「能力扩展包」,使 Agent 具备稳定、可复用的做事方法。
Anthropic官方Skills
- PDF:包含 PDF 合并、拆分、文本提取等代码脚本,教会 Agent 如何处理 PDF 文件 - 提取文本,创建新的 PDF、合并或拆分文档。
- Brand-guidelines:包含品牌设计规范、Logo 资源等,Agent 设计网站、海报时,可参考 Skill 内的设计资源,自动遵循企业设计规范。
- Skill-Creator:把创建 Skill 的方法打包成元 Skill,让 AI 发起 Skill 创建流程,引导用户创建出符合需求的高水准 Skill。
Skills是一种极其泛用的新范式,从垂直 Agent 到 AI 产品开发:借用通用 Agent 内核,0 难度创造具备通用 AI 智能的垂直 Agent 应用
理解Skill
Skills 是模块化的能力,扩展了 Agent 的功能。每个 Skill 都打包了 LLM 指令、元数据、可选资源(脚本、模板等),Agent 会在需要时自动使用他们。
直接解释:Skill就像给Agent准备的工作交接SOP大礼包
skill设计架构
想象你要把一项工作交给新同事。若不准口口相传,只靠文档交接(而且你想一次性交接完成,以后不被打扰), |
- 对于skill的设计架构
- 在 Skill 中,指令文档用于灵活指导,代码用于可靠性调用,资源用于事实查找与参考
当 Agent 运行某个 Skill 时,就会: |
- 当然,Skill 也可以用来扩展 Agent 的工具、MCP 使用边界,通过文档与脚本,也可以教会 Agent 连接并使用特定的外部工具、MCP 服务
官方Skills库
- 整个文件夹就是一个完整的能力包,用来支持 AI 创建、编辑和分析 PowerPoint 演示文稿。
- 核心文件是 SKILL.md,包含技能的元数据和任务指导,告诉 agent 什么时候使用这个技能、如何按步骤处理任务。特别的,独立子技能往往会被拆为子文档(如教 AI 把 html 导出为 pptx 流程的 html2pptx.md),以避免一次性加载过长的 skill 文档,节省上下文窗口
- Scripts/ 包含 Agent 可用的各类预先写好的程序脚本,比如 html 转 pptx 的一键程序脚本。这样 Agent 运行任务时就无需临时开发工具,直接调用,节省 tokens ,避免出错,提升速度
- 也有一些参考文档(此项目打包的不算规范,但根据 SKILL.md ,Agent 也能理解哪些文档可以参考),比如 ooxml.md,是对 ooxml 格式文件的解析指南
整个 Skill 以简明的形式,把技能指引文档、代码脚本、参考文档和可用资源组合,定向扩展了 Agent 完成 pptx 生成相关的工作能力







