在线学AI

【张洁芳】基于数据服务生态的测试数据智能体建设实践
收藏

【张洁芳】基于数据服务生态的测试数据智能体建设实践

价格
0.00
收藏:0
简要介绍
编号 QEcon20250912sh.018 类型 顶会
顶会名称 QEcon 日期 2025年9月12日~13日
地域 上海

一、金融业测试数据准备的核心痛点

数据复杂性高:银行系统业务种类多(如客户信息、个人金融、投资理财)、客户群体广、监管规则严,生成端到端测试数据链路长(如购买理财产品的借记卡数据需流经3个系统、6个模块、10+接口)。

架构转型新挑战:分布式架构下测试数据存储于多系统异构数据库,数据不同步导致“测试灾难”;信创转型与多版本迭代(如7-9月版环境)加剧数据同步难度,大量数据不可用。

需求属性高且传统方法失效:每日高频需求(如手机银行需活期存折、个人网银需一类借记卡)依赖人工提供,效率低;传统方法(SQL更新、导入生产数据、接口生成)存在长链路数据难准备、合规风险高、多接口难串联等问题。

二、测试数据智能体建设思路

核心目标:实现造数/查数全自助,解决自动化测试数据误报,提升功能测试用数效率,达成“多(覆盖80%高频数据)、快(一键跨系统造数)、好(数据定时保鲜)、准(大模型精准解析需求)”四大指标。

关键解决方案

统一数据服务规范:封装标准化数据服务,支持“搭积木式”跨系统造数,解决多接口串联与报文字段赋值难题。

构建测试数据知识库:分为造数知识库(含数据服务层、报文字段层,补充多表述方式)与查数知识库(含数据种类层、特征条件层,支持同义词/口语化匹配),为智能解析提供支撑。

数据保鲜机制:通过定时数据建模与刷新,保障数据有效性,避免版本升级导致数据失效。

大模型融合:基于知识库+大模型实现需求精准识别,输出匹配的数据服务或查询条件,减少人工依赖。

三、测试数据智能体建设实践

知识库问题与调优:针对“用户需求与业务规则冲突”(如“上海地区借记卡”因网点/柜员号错误开卡失败),新增常识库(如333地区对应常用网点/柜员号、人民币账户对应钞户),提升智能体业务“成熟度”。

提示词工程优化

提升推理效率:删除提示词中“报文默认值”要求,约束“未提及字段赋空值”,推理耗时从278000毫秒降至48524毫秒(提速6倍)。

适配模型特性:将查数特征拆解为“数字-中文”两列,先让模型输出数字结果,再拼接为“数字-中文”格式(如1→1-军保卡),解决模型仅识别数字的偏差问题。

智能需求识别:结合知识检索模型与银行业务规则,精准解析需求(如“需要借记卡+客户编号123***”,优先匹配“基于现有客户编号开卡”服务,而非“新开客户+开卡”,减少冗余操作)。

四、成效与未来展望

落地成效

覆盖一线高频造数/查数需求,实现对话式自助用数,降低人工依赖。

构建企业级智能测试底座,统一核心应用知识,形成可扩展、可共享的知识库资产。

开创人机对话用数新范式,为AI赋能研发测试提供参考。

未来方向

扩展知识库:拓宽数据源,覆盖更多业务系统,丰富数智资产。

增强检索能力:整合业务规则形成通用模块,优化算法提升推荐准确度。

提升推理精度:迭代提示词工程,优化造数报文/查数特征生成的精度与效率。

泛化用数触点:封装原子服务接口,嵌入接口测试工具、OA聊天、企业研发平台,提升使用便捷性。


购买后查看全部内容