Skills-垂直Agent的未来态

Skills 与其他 AI 应用开发方式,有底层机制的不同:

人给出专业知识与工具方法,通用 Agent 提供智能,自主理解,主动执行。说人话就是:人给指引,最终 Agent 还能根据自己的智力看着执行。
而且「Agent + 文件」的形式,足够泛用。
这就相较于它的前辈们(Workflow 和程序编写的 AI 应用)有了 3 个关键优势:
1.非技术人员可用零代码、自然语言编写
2.能突破预设限制,灵活响应用户输入,应对边缘情况
3.甚至能多个 Skill 自由联用,应用方式极其灵活

零代码、自然语言,编写真智能Agent

与之前的AI应用开发方法

不必多说程序编写的 AI 应用,必须懂程序逻辑、懂技术实现。即便是 Coze、Dify、N8N 等近年流行的 Workflow 平台,也得理解节点配置、条件分支,仍算「编程」,只是界面友好一些。
Skills 的创建门槛,完全不同:入门门槛极低,智能上限极高

Anthropic的brand-guidelines skill

最简单的skill,仅有一个 SKILL.md,纯自然语言写成。

brand-guidelines skill

元信息:什么时候用这个 Skill
正文:品牌颜色、字体等文本描述信息
足以引导Agent变成符合Anthropic品牌设计的垂直Agent可用于品牌官网、海报、PPT 设计。
  • 当你要设计一个符合 Anthropic 公司设计规范的 AI 搜索网站,Agent 就会自动运行该 Skill

  • Skill加载模式
  • Skill 有两种加载模式:显式 / 隐式。前者通过 user query 直接指定调用;后者根据任务与元信息描述的相关性,LLM 自动匹配。

  • skill使用演示,这是该skill agent 一次性开发的网站,调性接近 Claude 官网设计:


AI-Partner Skill

  • 一个 Skill 就是一个复杂 Agent:包含 SKILL 文档、向量数据库构建指南、向量数据库使用脚本、AI 伴侣与用户的 Persona 模板资源

  • SKILL.md 本体依然由自然语言写成:

  • 借此,Agent 就能理解 AI-Partner 的初始化与对话方法,引导用户上传包含个人记忆的文档预料,在用户端智能切分笔记片段,构建向量数据

  • 解析用户记忆文档,提炼个性化的 AI 伴侣与用户画像设定


  • 最终智能检索用户记忆,提供懂用户的 AI Partner 对话体验

这能基本验证:单靠Skill + Agent所构造的垂直Agent,所实现的智能效果,无异甚至可超过同类AI产品

突破预设限制,灵活应对实际情况

Workflow与skill

  • Workflow 或 传统程序 的核心问题是,它们假设所有情况都能预设。
比如基于用户记忆的 AI 个性化助理,往往需要提前设定:
用户导入记忆文件的入口
允许用户上传的文件格式
数据应该包含哪些字段
以及可能出现哪些特殊情况,每种情况如何处理。
但现实往往是:
需要教育用户在哪点击「导入」
用户只有预期之外的格式:预期支持 md,但实际只有 doc
数据字段不符:预期每个文件需要一个标题,但用户文件没有标题
或者出现了预设之外的边缘情况。

  • Agent + Skill 应用的运作方式完全不同
而通用 Agent + Skill 应用的运作方式完全不同:
能在统一的对话框,接收各类用户数据(文本、文件、图片)
能自主调用其他 Skill,或即时编写 doc2md 脚本,自动转换用户格式
能提炼补充每个文件的标题,完成数据入库处理
能基于 LLM 的推理智能,弥合各类边缘问题
用 Skill 做的垂直 Agent,以 Skill 的知识与方法为指引,能巧借 Agent 内的 LLM 智能,灵活应对各类问题。

借 Agent 本身的“观察-规划-执行”的动态智能,对用户文档进行自适应切片,而非所有文件都按照固定的分隔符 or 字数切分。(DailyNotes 按照日期标题切分;项目笔记按照标题级别与语义切分)这样能得到更符合实际情况的 RAG 切片

多Skill联用,覆盖指数级场景

  • Agent Skills 实质仍是 Context 工程,Skills 只是把垂直领域的知识、脚本调用方法等挂载到 Agent 的上下文窗口
  • 所以 Skills 在实际应用中极其灵活,甚至在一次任务中能调用多个 Skill
联用 brand-guidelines + pptx,自动制作符合品牌规范的 pptx
联用 AI-Partner-Chat + Article-Copilot,写出更符合个人思考与文风的内容
  • 也可以是更复杂的场景,如做一份产品分析报告:
      从网页抓取竞品数据(Web Scraping Skill)
    提取 PDF 中的用户反馈(PDF Skill)
    分析数据并生成图表(Data Analysis Skill)
    按品牌规范制作 PPT(Brand Guidelines + PPTX Skill)
    每多一个 Skill,就多一种能力,N 个 Skill 可以应对远超 N 的应用场景。