Spec 驱动开发(SDD)的三个 Skills:覆盖 Spec→Implement→Verify 闭环

发布时间: 2026-06-12 文章分类: AI前沿技术
阅读量: 0
AI智能体
企业级AI智能体开发与部署
LumeValley提供全栈式企业级AI智能体开发与部署服务,涵盖战略规划、场景化开发、企业级应用构建、行业解决方案及算力支撑。从需求分析到持续优化,确保智能体高效稳定运行,助力企业实现智能化转型,提升运营效率与竞争力。

AI 编程最大的坑不是模型不够聪明,而是写出来的代码没人知道为什么这样写。邵猛在 X 上分享了一套 Spec 驱动开发(SDD) 打法,直接把规格文档、代码实现、一致性校验三件事拆成三个独立 Skill,安装即用,团队抄过来就能落地。这套方法不绑定任何 IDE 或编程框架,核心思路只有一句话:让 AI 写代码之前,必须先有经人工确认的规格。

为什么把规格拆成两层

SDD 听起来像老调重弹的"先写文档再写代码",但邵猛的拆法非常务实。他没有把所有规格塞进一个文件,而是按职责切成两层:PRODUCT.md 回答"用户需要什么",TECH.md 回答"代码打算怎么实现"。

PRODUCT.md 只管用户故事

这一层是产品的"合同书",不出现任何技术栈词汇。写什么功能、给谁用、什么场景下成立、什么场景下要拒绝——四条线全部锁死。邵猛把这类约束叫做"不变量",意思是无论底层怎么改,产品的行为契约不能变。比如一个导出按钮,规格里写明白"空数据时禁用且悬停提示无数据",实现时换成 Rust 还是换成 Electron,行为都不能漂移。这层文档的读者是产品经理、QA、甚至法务,工程师也读,但读的不是技术细节。

TECH.md 只管架构与策略

到了技术层,叙事主体换成架构决策。模块怎么切分、状态怎么流动、关键接口的契约是什么、为什么选 A 方案不选 B 方案——这些信息归 TECH.md 管。两份文档放在同一个 specs/<issue号>/ 目录里,随 PR 一起提交,评审的时候产品和工程各看各的那一份。邵猛特别强调目录命名要带 issue 编号,这样规格、代码、Issue 三者天然绑定,反查任何一次改动都能拉出完整的决策链。

三个 Skill 怎么闭环

Skill 是 SDD 落地的最小单元,邵猛没有写一套复杂平台,而是把流程切成三段,每段一个 Skill,各自独立安装、互相协作。整套闭环在 npx skills add warpdotdev/common-skills 一行命令之后就能跑起来。

/write-product-spec 起步

第一个 Skill 专门生成 PRODUCT.md。它会拉取 Issue 标题、需求描述、相关讨论,然后输出结构化的用户故事列表和明确的不变量。邵猛在演示里展示了一个关键设计:Skill 不会自动提交,而是把文档写到 specs/<issue>/PRODUCT.md 之后停下来,等人工确认。确认动作可以是 GitHub Review,也可以是本地 cat 一下文件——重要的是规格进入代码库之前必须有人类点头。

/write-tech-spec 接力

产品规格过审,第二个 Skill 接手。它读取已经确认的 PRODUCT.md,输出 TECH.md。邵猛给这个 Skill 设定了一个反直觉的约束:不许复读产品文档里的用户故事。技术规格只讲架构、讲取舍、讲模块边界。用户故事已经在 PRODUCT.md 里了,再写一遍就是浪费 Token、稀释注意力。Agent 拿到 TECH.md 之后才能进入实现阶段,跳过规格直接写代码的情况被流程天然屏蔽。

/validate-changes-match-specs 收口

第三个 Skill 是整套方法的安全网。Agent 写完代码,PR 提上来,这个 Skill 自动跑一遍一致性校验:TECH.md 里声明的接口、模块、不变量,是否在 diff 里都有对应实现。反过来,diff 里冒出来的新逻辑,也要在规格里能找到出处。校验不通过,PR 直接被打回。邵猛在视频里特别演示了一段 Rust 桌面应用代码,校验 Skill 准确抓出了一个异步处理函数没有声明副作用的遗漏,精准到行号。

第五步最反常识:让 AI 操作计算机验证

一致性校验只解决"代码和规格对不对得上",但规格本身可能写漏了用户场景。邵猛在五步流程的最后加了一步:让 Agent 启动一个浏览器或桌面客户端,模拟真实用户点一遍流程。这步听起来很 fancy,做法其实很朴素——复用现有的 computer use 能力,把 SPEC 里的用户故事作为操作脚本,让 AI 自己执行一遍。

从"读 SPEC"到"跑 SPEC"

多数团队的规格文档写完就躺在仓库里积灰。邵猛的做法相当于把规格变成可执行测试:用户故事里写"点击导出后 3 秒内出现下载文件",Agent 就真的去点导出按钮、盯着下载目录、确认文件落盘。这种验证方式对 UI 重构类工作尤其有效,单元测试覆盖不到的视觉与交互问题,computer use 能补上。

对 Rust 桌面团队是降维打击

传统桌面应用团队的 QA 流程严重依赖人工手测,CI 跑再多自动化也覆盖不了真实渲染管线。SDD 的第五步把 computer use 接到规格验证链上,AI 替人跑一遍冒烟,工程师专注看回归。邵猛演示的案例是一个 Tauri 项目,端到端验证跑下来十几秒,比拉一个 QA 工程师点鼠标快了几个数量级。

Skills 可移植才是真正的杠杆

邵猛这套打法的最后一个亮点,也是最容易被忽视的一个:三个 Skill 全部开源在 warpdotdev/common-skills,不绑定 Warp 终端。换句话说,换 VS Code、换 Cursor、换任何 Agent 运行环境,Skill 本身可以原样搬走。

Skill 不是插件,是流程资产

插件式 AI 工具最大的问题是锁定。团队花三个月沉淀的工作流,换个 IDE 就归零。邵猛把流程封装成 Skill,本质上是把团队的工程纪律写进可执行文件,谁来跑 Agent、跑在哪个终端,都得按这套剧本走。Warp 在这里更像第一个吃螃蟹的宿主,而不是围墙。

照搬之前先想清楚权限边界

Skill 可移植不意味着无脑照搬。/validate-changes-match-specs 跑在 CI 上还是本地 Agent 上,决定了它能访问多少仓库上下文;computer use 验证步骤需要图形环境,纯 Linux 服务器流水线接不进来。抄作业之前先盘点自己的运行环境,别把演示视频里的端到端验证硬塞进一台没有显示器的构建机。

AI智能体
企业级AI智能体开发与部署方案
LumeValley打造企业级AI智能体全流程方案,涵盖需求洞察、定制开发、多平台适配部署。凭借专业算法与丰富经验,确保智能体精准理解业务,高效执行任务,无缝融入企业生态,为企业数字化转型提供强劲智能引擎,提升核心竞争力。
点赞 | 93

Lumevalley——全栈AI服务领航者,以“战略-应用-算力”三位一体服务框架,为企业提供从顶层战略规划、场景化AI智能体(AI Agent)开发/搭建/部署,到企业级AI应用开发、AI+行业场景解决方案的全链路服务,并配套AI大模型部署与高性能AI算力底座支撑,助力客户在营销、服务、运营等核心环节实现效率倍增与模式创新。

马上扫码获取产品资料
相关文章

相关文章

填写以下信息, 免费获取方案报价
姓名
手机号码
企业名称
  • 建筑建材
  • 化工
  • 钢铁
  • 机械设备
  • 原材料
  • 工业
  • 环保
  • 生鲜
  • 医疗
  • 快消品
  • 农林牧渔
  • 汽车汽配
  • 橡胶
  • 工程
  • 加工
  • 仪器仪表
  • 纺织
  • 服装
  • 电子元器件
  • 物流
  • 化塑
  • 食品
  • 房地产
  • 交通运输
  • 能源
  • 印刷
  • 教育
  • 跨境电商
  • 旅游
  • 皮革
  • 3C数码
  • 金属制品
  • 批发
  • 研究和发展
  • 其他行业
需求描述
填写以下信息马上为您安排系统演示
姓名
手机号码
你的职位
企业名称

恭喜您的需求提交成功

尊敬的用户,您好!

您的需求我们已经收到,我们会为您安排专属电商商务顾问在24小时内(工作日时间)内与您取得联系,请您在此期间保持电话畅通,并且注意接听来自广州区域的来电。
感谢您的支持!

您好,我是您的专属产品顾问
扫码添加我的微信,免费体验系统
(工作日09:00 - 18:00)
电话咨询 (工作日09:00 - 18:00)
客服热线: 4008 868 127
售前热线: 189 2432 2993
扫码即可快速拨打热线