在线学AI

【伍斌】我没有用Vibe Coding写生产代码,而是先写好测试代码
收藏

【伍斌】我没有用Vibe Coding写生产代码,而是先写好测试代码

价格
0.00
收藏:0
简要介绍
编号 QEcon20250912sh.027 类型 顶会
顶会名称 QEcon 日期 2025年9月12日~13日
地域 上海

一、氛围编程的定位:更适合测试而非生产代码

氛围编程(Vibe Coding)特点:通过自然语言与AI聊天生成代码,降低编程门槛,但存在“不完全理解业务”“质量不可控”“经验无法复用”等问题,在生产代码开发中易增加技术债务,METR实验显示经验开发者使用后产出反降19%。

测试场景适配性

逻辑简单:UI测试(页面交互/元素定位)、API测试(请求响应验证)、故障注入测试逻辑直接明确,无需复杂业务理解,契合AI生成优势。

数据标准化:测试数据清理、环境准备流程固定,AI可快速生成标准化脚本,减少重复劳动。

用例设计全面:AI能系统化分析业务场景,穷举人工难覆盖的边界与异常场景,如复杂折扣规则的多条件组合。

传统单元测试局限性:氛围编程常改动底层逻辑,单元测试耦合度高易失效,UI/API测试提供更稳定的保护层,降低维护成本。

二、“准备时+声明时+运行时”三阶段测试方法论

准备时:脚本生成与环境初始化

核心目标:保障测试环境一致性,AI生成数据清理(清除脏数据)、环境配置(启动服务)、数据准备(生成基础测试数据)脚本,如Saleor电商系统中,AI自动生成clean_up_data.sh(清空数据库)、s1_start_saleor.sh(启动服务)等脚本,替代人工重复操作。

实战案例:通过AI将手工GraphQL API购物流程(获取Token→创建订单→支付验证)转为自动化脚本,支持Docker容器化部署,秒级完成环境初始化。

声明时:“三场一表”设计测试用例

三场景测试分类

冒烟场景(Web UI):验证系统基础功能,如Saleor首页加载、产品详情页访问、购物车添加商品。

Happy Path场景(Web UI):完整正向流程,如用户登录→选品→结算→支付→订单确认。

Sad Path场景(GraphQL API):异常场景验证,如错误账号登录、无效商品ID创建订单。

一表梳理复杂业务:用决策表拆解复杂规则(如Saleor折扣系统),定义条件(订单是否含促销、折扣码类型/状态)与动作(显示成功/错误信息、更新金额),覆盖12种核心折扣场景,避免用例遗漏。

运行时:故障注入与质量验证

故障注入测试:AI设计故障场景(如重命名购物车页面文件导致404),验证冒烟测试是否能识别异常,确保测试有效性。

“理测评解”闭环:AI辅助理解测试代码声明(理)、验证故障覆盖(测)、评审用例完整性(评)、向团队解释测试逻辑(解),保障测试质量。

三、Saleor电商系统实战:从手工到AI自动化

项目背景:Saleor是GitHub 2.2万星标的API优先电商平台,含GraphQL架构与复杂折扣规则,适合验证AI测试能力。

全流程实战步骤

手工测试记录:分别通过GraphQL API(获取产品→创建订单)与Web UI(选品→结算)完成购物,记录操作过程。

AI脚本生成:将手工流程转为自动化脚本,如s1_start_saleor_and_place_order_by_graphql.sh(API下单)、s2_to_s4_start_and_place_order_by_storefront.sh(UI下单)。

用例与代码生成:AI基于“三场一表”生成测试用例,推荐Playwright+TypeScript+Jest技术栈,生成冒烟测试代码(如system-basics.smoke.spec.ts),验证首页加载、购物车访问等7个核心场景,通过率100%。

故障注入与优化:针对购物车页面设计故障注入(重命名路由文件),发现冒烟测试未校验404异常,优化用例增加页面可达性断言。

四、核心价值与总结

解决方案优势

提效降本:AI替代人工完成脚本生成、用例设计,测试环境准备时间从小时级降至分钟级,复杂业务用例覆盖度提升50%+。

质量保障:“三场一表”与故障注入形成双重验证,减少测试遗漏;“理测评解”机制确保测试代码可理解、可评审、可复用。

角色赋能:为传统手工测试人员提供AI工具支持,降低自动化门槛,聚焦用例设计与质量把控,而非代码编写。

适用边界:氛围编程在复杂生产代码开发中受限,但在测试场景(脚本生成、用例设计、故障验证)中优势显著,是企业IT自动化测试的高效解决方案。


购买后查看全部内容