在线学AI

【陈军】代码AI+Agent在变更影响分析领域的探索与实践
收藏

【陈军】代码AI+Agent在变更影响分析领域的探索与实践

价格
0.00
收藏:0
简要介绍
编号 QEcon20250912sh.016 类型 顶会
顶会名称 QEcon 日期 2025年9月12日~13日
地域 上海

一、AI时代代码变更的风险与质量突围需求

线上问题核心分布:60.52%的问题源于场景未覆盖(含新迭代不兼容老逻辑30.43%、业务边界问题21.73%等),22%为兼容性问题,12%为预埋代码问题,42%为配置问题,传统人工评估难以全面覆盖。

传统与AI时代的双重挑战

传统挑战:依赖人工经验导致效率低、知识断层,复杂依赖(跨服务接口、隐式配置)难识别,测试覆盖盲区多,过程资产难沉淀。

AI新增挑战:AI生成代码存在业务逻辑偏差、隐式依赖多、缺乏文档;修改代码可能超出测试范围,引入未覆盖分支;代码风格多变导致研发评估准确度降低。

破局方向:构建AI增强的代码知识图谱、推动测试资产智能化、重构组织能力(培养AI数字员工负责影响分析)。

二、代码知识图谱的构建方案

构建目标与核心价值:解决通用大模型领域知识不足、RAG检索效率低的问题,核心目标是构建“准确的代码关系网络”与“高效的查询能力”,支持函数级(API兼容性)、模块级(架构偏移)、系统级(数据流完整性)分析。

关键技术路径

静态代码关系挖掘:通过AST/ASM语法树解析源码,提取类、方法、变量等实体及调用/引用关系,转化为结构化数据(如JSON格式)。

业务知识加工:AI辅助数据清洗(处理缺失值、标准化)、特征选择与生成,人工确认关键特征,给方法打标业务属性(如接口含义、风险等级),建立业务代码知识库。

图数据库优化:解决海量实体关系的存储与查询效率问题,支持复杂长链路调用分析,为变更影响分析提供数据基础。

三、变更影响分析智能体的构建

系统架构分层

应用层:输出变更内容、影响范围、测试建议、风险评估与可视化结果,支持多维度(方法/服务/交付)分析。

智能体层:含意图识别(解析用户需求)、流程规划(动态编排工具)、记忆模块(短期上下文摘要+长期核心实体存储)、技能工具(查询/分析工具)。

数据层:整合MySQL关系数据、ES源码数据、Graph图数据。

基础设施层:依赖diff算法、链路算法、AST/ASM解析、特征库支撑底层能力。

核心能力突破

意图识别:通过规则引擎(正则/关键字初筛)+Prompt分层管理(基础/复杂查询分开),消除模糊语义(如代词指代),提升语义理解准确性。

多轮对话:短期记忆压缩token保留意图,长期记忆持久化核心实体(迭代ID、服务名),避免上下文遗忘与意图漂移。

任务执行:基于工具依赖关系构建有向无环图,动态编排工具执行顺序,实时返回执行日志,标准化数据格式,最终通过大模型润色总结结果。

落地效果:已拦截缺陷中,配置问题占42%、兼容性22%、预埋代码12%,成功识别预埋代码(未调用代码易被误用)、配置命名错误(复制代码忘改配置)等典型风险。

四、未来演进方向

能力增强:开发多粒度上下文理解(融合历史缺陷/修改记录),优化对话策略引导有效交流,引入置信度与采纳率指标持续迭代模型。

范围扩展:从仅支持Java扩展至多语言,构建需求-用例-代码追踪矩阵,通过MCP服务嵌入其他AI流程,形成协同生态。

购买后查看全部内容