在线学AI

【彭鑫】基于大模型的智能化开发:复杂系统视角下的一点思考与探索pdf
收藏

【彭鑫】基于大模型的智能化开发:复杂系统视角下的一点思考与探索pdf

价格
0.00
收藏:0
简要介绍
编号 QEcon20250912sh.001 类型 顶会
顶会名称 QEcon 日期 2025年9月12日~13日
地域 上海

一、核心技术与应用进展

大模型基础支撑:基础大模型需通过领域知识库构建、知识检索、信息融合、生成响应四步夯实能力,结合检索增强拓展信息来源,依托角色扮演、思维链、提示工程提升“思维”能力,借助智能体增强规划与工具使用能力。

智能化开发工具与框架:智能化IDE融合自然语言指令、代码上下文及代码库文档,优化开发体验;ChatDev、MetaGPT等多智能体框架可实现全流程自动化软件开发,输入需求即输出软件制品。

缺陷修复表现:在SWE-Bench_Lite和SWE-Bench_Verified数据集上,多款结合大模型的工具(如ExpeRepair-v1.+CLaude4 Sonnet)有较高解决率,但SWE-Bench更多是AI练兵场,非软件工程能力试金石。

二、软件开发本质与大模型局限

软件开发核心困难:本质困难是抽象软件实体(需求、设计)的概念结构构思,编程语言表示仅为偶然困难;企业开发多为维护型任务,知识缺失影响效率与质量。

大模型的短板:代码数据平面化(缺抽象、缺决策过程),使大模型难获高层次设计能力,多承担原子任务编码;迭代修复能力差,易“反复横跳”致BUG激增,缺整体理解与掌控;在复杂系统问题定位中,易误判目标、难回溯逻辑、重复造轮子。

三、软件系统特性与现有思路问题

软件系统特性:形态具多样性,从简单小应用到复杂操作系统不等;存在内外部系统复杂性,内部设计复杂、交互多,外部依赖系统上下文,且精密性高、需持续演化;开发具探索性,需求与解空间均需不断探索调整。

现有思路不足:“大模型一锅炖”思路将所有知识以语料喂给模型,假设软件是文本token序列与共性模式组合,忽视软件复杂系统属性;主流研究过度关注AI技术“眼球效应”,对软件工程本质困难思考不足。

四、解决方案与探索方向

代码数字孪生:作为AI时代软件知识工程,抽取沉淀软件高层知识,建立与代码映射,分重量级(复杂系统,需文档与人工)和轻量级(中小系统,无需额外文档人工),支持维护任务中的问题定位、修改决策等。

开发框架创新:特性驱动开发框架通过特性拆解编排、迭代上下文管理、用户反馈整合,实现演进式需求与设计调整,已在计时器、茶饮点单等APP开发中应用。

漏洞检测优化:提出LLM4PFA框架,借大模型Agent实现路径敏感与上下文敏感分析,提升静态bug检测准确率(空指针漏洞检测准确率94%);针对逻辑漏洞,通过抽取高层缺陷知识、结合外部知识库,在多个项目中发现未知漏洞。

五、行业现状与未来方向

行业现状:局部智能化支持(代码补全、推荐等)成常态;加速开发人员分化,普通程序员效率提升有限且存风险,专家型程序员成“超级程序员”;企业级收益有限,因软件高层理解与维护支持弱。

未来方向:需捕捉软件设计知识,支撑高层次智能化开发;结合特性驱动开发与代码数字孪生,优化应用开发与维护;推动大模型与程序分析结合,实现软件深层理解;正确定位AI角色,明确其在企业软件开发中“参谋长”而非“司令员”的定位。

购买后查看全部内容