这其实是很多工程师正在经历的真实困境。当大家默认“AI能写代码就等于能修代码”时,现实很快给出反例:不是所有AI都具备调试能力,更不是所有AI都知道如何在真实项目约束下定位、复现、验证并闭环一个问题。它可能很擅长从零生成一段功能完整的登录页,但面对线上环境偶发的竞态条件崩溃,往往束手无策。
Anthropic 刚推出 Skills [1]时,我非常兴奋。官方的态度也很明确:不要再执着于开发复杂 Agent,而是把精力放在 Skills 上。但在认真研究了一圈官方和社区的 Skills 示例[2]后,我很快冷静下来—— 几乎没有一个 Skills 能直接在真实环境中跑起来。 当时我的判断是:这就是个玩具。直到最近,Claude Code 2.1.3 ...