一、金融业测试数据准备的核心痛点
数据复杂性高:银行系统业务种类多(如客户信息、个人金融、投资理财)、客户群体广、监管规则严,生成端到端测试数据链路长(如购买理财产品的借记卡数据需流经3个系统、6个模块、10+接口)。
架构转型新挑战:分布式架构下测试数据存储于多系统异构数据库,数据不同步导致“测试灾难”;信创转型与多版本迭代(如7-9月版环境)加剧数据同步难度,大量数据不可用。
需求属性高且传统方法失效:每日高频需求(如手机银行需活期存折、个人网银需一类借记卡)依赖人工提供,效率低;传统方法(SQL更新、导入生产数据、接口生成)存在长链路数据难准备、合规风险高、多接口难串联等问题。
二、测试数据智能体建设思路
核心目标:实现造数/查数全自助,解决自动化测试数据误报,提升功能测试用数效率,达成“多(覆盖80%高频数据)、快(一键跨系统造数)、好(数据定时保鲜)、准(大模型精准解析需求)”四大指标。
关键解决方案:
统一数据服务规范:封装标准化数据服务,支持“搭积木式”跨系统造数,解决多接口串联与报文字段赋值难题。
构建测试数据知识库:分为造数知识库(含数据服务层、报文字段层,补充多表述方式)与查数知识库(含数据种类层、特征条件层,支持同义词/口语化匹配),为智能解析提供支撑。
数据保鲜机制:通过定时数据建模与刷新,保障数据有效性,避免版本升级导致数据失效。
大模型融合:基于知识库+大模型实现需求精准识别,输出匹配的数据服务或查询条件,减少人工依赖。
三、测试数据智能体建设实践
知识库问题与调优:针对“用户需求与业务规则冲突”(如“上海地区借记卡”因网点/柜员号错误开卡失败),新增常识库(如333地区对应常用网点/柜员号、人民币账户对应钞户),提升智能体业务“成熟度”。
提示词工程优化:
提升推理效率:删除提示词中“报文默认值”要求,约束“未提及字段赋空值”,推理耗时从278000毫秒降至48524毫秒(提速6倍)。
适配模型特性:将查数特征拆解为“数字-中文”两列,先让模型输出数字结果,再拼接为“数字-中文”格式(如1→1-军保卡),解决模型仅识别数字的偏差问题。
智能需求识别:结合知识检索模型与银行业务规则,精准解析需求(如“需要借记卡+客户编号123***”,优先匹配“基于现有客户编号开卡”服务,而非“新开客户+开卡”,减少冗余操作)。
四、成效与未来展望
落地成效:
覆盖一线高频造数/查数需求,实现对话式自助用数,降低人工依赖。
构建企业级智能测试底座,统一核心应用知识,形成可扩展、可共享的知识库资产。
开创人机对话用数新范式,为AI赋能研发测试提供参考。
未来方向:
扩展知识库:拓宽数据源,覆盖更多业务系统,丰富数智资产。
增强检索能力:整合业务规则形成通用模块,优化算法提升推荐准确度。
提升推理精度:迭代提示词工程,优化造数报文/查数特征生成的精度与效率。
泛化用数触点:封装原子服务接口,嵌入接口测试工具、OA聊天、企业研发平台,提升使用便捷性。