在线学AI

【刘道伟】数字员工AIQA的探索及实践

价格：

￥0.00

收藏：0

简要介绍

编号	QEcon20250912sh.037	类型	顶会
顶会名称	QEcon	日期	2025年9月12日～13日
地域	上海

一、AIQA的核心定位与背景

背景：AI编程带来的测试效能挑战海外AI代码生成比例已达30%-40%（腾讯、阿里等企业披露数据），研发交付速度显著提升，但测试效能难以同步跟进，传统“手工+自动化工具”模式无法满足“快速交付+高质量保障”需求，需通过AI重构测试交付模式。

AIQA的定义与价值

定位：具备企业数字身份的Agent矩阵，非单一通用工具，而是按业务/场景分工的“数字员工”，可独立或协同真人完成复杂测试任务，能力不弱于真人。

三大核心优势：

更懂业务：基于RAG技术整合企业内全量业务知识（需求、测试方案、BUG数据），覆盖范围超单个真人或团队；

更懂测试：学习历史项目测试经验，持续成长为质效领域专家，避免个人经验局限；

更能测试：通过MCP协议操作全量测试工具（环境搭建、自动化执行等），智能选择工具完成任务。

交付模式演进从“1.0手工测试→2.0自动化+部分智能化→3.0 AIQA主导（数字员工）”，核心变化是测试交付从“真人主导+工具辅助”转为“AIQA主导+真人辅助”，实现端到端Agentic DevOps。

二、AIQA整体方案架构

1. 四大基础支撑层

知识建设：解决通用大模型缺乏企业私域知识的问题

数据来源：需求文档、测试方案、BUG库、代码库、流水线数据等；

加工方式：通过大模型提取实体/关系构建知识图谱，或切片为向量存入向量库，结合人工补充校验；

核心作用：为AIQA提供业务知识、测试经验、工具操作指南等支撑，如关联“测试手段-线上BUG-工具使用”的知识链路。

MCP工具建设：让AIQA具备“操作工具”的能力

模式：将测试平台/工具能力封装为MCP服务（分通用MCP空间与业务MCP空间），描述需像API文档般严谨（含场景、参数、限制条件），支持AIQA智能调用（如环境搭建、自动化执行工具）。

模型建设：提供思考与决策能力

基础模型：基于文心、DeepSeek R1等大模型，结合业务数据微调，提升测试场景适配性；

核心能力：任务拆解、工具选择、异常反思、风险评估等，避免“模型幻觉”。

工程基建：保障长程与异步任务处理

任务中心：管理任务生命周期（创建、调度、挂起、唤醒），支持“Human in Loop”（关键环节触发真人确认）；

事件中心：订阅交付全环节事件（如需求提测、用例失败），实时响应并触发后续动作（如自动生成测试计划）。

2. Agent架构设计

Multi-Agents模式：主Agent+专家Agent协同

架构模式	核心逻辑	适用场景
主Workflow+专家Agent	主Agent按固定流程（如“测试方案→用例生成→执行→风险评估”）串联任务，专家Agent负责单环节执行（如用例生成Agent、环境搭建Agent）	交付流程明确的标准化项目
完全自主规划	Plan Agent分配任务、合并结果、解决冲突，专家Agent自主拆解路径、调度工具	需求复杂、流程灵活的项目

关键能力：通过“上下文工程+工具调用”避免路线之争，聚焦任务目标达成，而非局限于框架选择，开源Agent框架可快速搭建基础能力，核心竞争力在于“知识深度+工具覆盖度”。

三、AIQA实践案例

1. 测试方案生成

流程：需求提测后，AIQA主Agent先通过RAG检索同类需求测试方案、业务知识，再结合当前需求文档（MRD）与代码结构，生成含“测试范围、重点场景、风险点、工具选择”的完整方案，支持真人二次优化。

价值：替代手工编写，方案覆盖度提升30%+，避免遗漏边缘场景（如历史高频BUG关联场景）。

2. 自动化测试执行与修复

流程：

AIQA根据测试方案拆解步骤（如“环境搭建→用例执行→结果分析→失败修复”）；

通过MCP调用环境搭建工具、自动化执行工具（如接口测试工具）；

执行失败后，自动检索失败日志关联知识（如“用例失败-历史修复方案”），调用用例修复工具完成脚本优化，无需真人介入；

全程实时同步进度，异常情况（如工具不可用）触发真人协助。

价值：自动化测试执行效率提升40%+，用例修复率达60%+，减少人工重复操作。

四、未来展望与落地建议

三大核心落地方向

聚焦高价值场景：优先落地“测试方案生成、自动化执行与修复、风险评估”等重复度高、知识密集的场景，避免盲目追求“全流程覆盖”；

强化上下文工程：完善知识图谱与向量库的“实时更新+精准检索”能力，确保AIQA获取的知识“新鲜、准确、关联度高”；

面向AI构建工具：新测试工具设计时预留MCP接口，旧工具逐步封装适配，避免AIQA因“工具不可用”受限。

关键原则降低短期预期，避免争论“技术路线”，重点提升工程能力（知识沉淀、工具封装、任务调度），跟随大模型能力进化逐步扩展场景，核心是“让AIQA能稳定解决具体问题，而非追求‘万能Agent’”。

购买后查看全部内容