为文档状态管理和审批生成Frappe工作流。当创建审批工作流、状态转换或多步骤文档流程时使用此技能。
当用户希望规划、设计或实施 A/B 测试或实验时使用。同样适用于用户提及“A/B 测试”、“分流测试”、“实验”、“测试这项改动”、“变体文案”、“多变量测试”或“假设检验”时使用。如需追踪实施效果,可参考分析跟踪功能。
OpenRouter API集成,实现对70多家供应商的400余种LLM模型的统一访问。当构建需要调用OpenRouter API进行聊天补全、流式传输、工具调用、结构化输出或模型路由的应用程序时使用。触发条件为OpenRouter、模型路由、多模型、供应商回退,或当用户需要通过单一API访问多个LLM供应商时。
为使用 useFormValidate 与 Zod 创建表单组件提供指导。当用户希望新建表单组件,或对现有表单组件进行重构,以采用项目标准的表单处理模式时,可使用此技能。
运行dotnet test,捕获失败的测试用例,并生成重跑筛选器与Markdown格式的失败摘要。在测试运行失败、需要精准的重跑指令或简洁的失败报告时使用。
通过自动化指标、人工反馈与基准测试,为LLM应用实施全面的评估策略。在测试LLM性能、衡量AI应用质量,或搭建科学的评估框架时,这一技能将为您提供可靠的支持。
从 OpenAI Codex 和 Google Gemini 中获取更多视角,用于架构分析、评审与调试。所有 LLM 调用均透明呈现。
子代理委派与并行研究模式。在研究框架、分析代码库,或为提高效率,将离散任务委派给多个子代理时使用此功能。
查找我被邀请担任评审的开放 PR(不包括草稿及已获批准的 PR)。
安全操作Cline CLI:掌握核心概念、沙箱规则、提供商与模型的选择、审批流程以及常见工作流。
在提交或合并之前,对已完成的工作进行可重复使用的验证门。适用于实施完成后,Claude 必须证明任务有效、验证主要用户流程、选择基于浏览器、静态浏览器或非浏览器验证方式,并以证据为基础给出通过/失败/被阻止的判定。当需要进行浏览器验证时,依赖 agent-browser 技能完成浏览器操作、截图及录制。
通过实例、可视化与类比,培养数学理解能力。