一、议题背景:广告评测的核心痛点
数据与体验的断层:广告主可通过埋点获取流量、转化、成本等理性数据,但缺乏对广告“视觉可见性”的感知,无法解释“用户不点击、不停留、不购买”的感性决策问题,如素材截断、承接页商品不匹配、价格不一致等。
三大核心疑问:
不点击:参竞率与曝光正常,但素材可能被截断/拉伸/填充不足,导致广告主体不明确;
不停留:页面到达率正常,但承接页未还原素材商品,购买流程中断;
不购买:承接页商品还原率正常,但站内价格高于站外素材标注,降低购买意愿。
二、技术方案:数据驱动+真机+AI的全链路解决方案
1. 方案选型:对比与决策
解决目标 | 方案对比 | 最终选择 | 核心原因 |
如何看见广告 | 媒体侧白名单(人工操作、时效短)vs 定制白名单链路(需改代码) | 定制白名单链路 | 裁剪定向逻辑+参竞提价,确保真机稳定透出广告 |
如何记录广告 | 人工巡检(精准但成本高)vs 真机巡检(自动化、规模化) | 真机巡检 | 持久固化广告点位,节约人力,支持截图记录(站外曝光/站内承接/唤端) |
如何判定问题 | OpenCV(成熟但需精准裁切)vs 大模型(泛化强、规则灵活) | 大模型诊断 | 适配80%图片物料,解决复杂场景判定,后续通过多Agent优化幻觉问题 |
2. 核心技术架构:四大模块协同
广告可见性(看见广告):新建白名单链路,删减人群/时段/设备定向逻辑,参竞提价确保真机竞胜,突破常规定向过滤与竞价排名限制。
真机体验(记录广告):
路径编排化:通过ADB脚本实现“APP冷启→点击推荐→上滑”等标准化操作,到达已知广告点位;
规则+AI识别:用XPath规则识别广告标题/底部“广告”关键词,无法识别时调用大模型判定广告存在与区域定位;
全链路记录:同步采集站外曝光截图、站内承接截图、唤端链接及上下文信息。
大模型判定(分析问题):
素材大模型:诊断版位错误、素材截断/过期/替换等视觉问题;
投承大模型:校验承接页与素材的一致性(商品还原、价格匹配、品类对齐)。
自主点位挖掘(拓展覆盖):搭建手机GUI智能体框架,通过“ADB操作→截图检测(OCR+相似度判断)→大模型决策→遍历探索”,1小时遍历1个APP,累计挖掘34%曝光占比的广告点位,解决人工覆盖不足的小样本困境。
3. 关键优化:多Agent工作流
针对单Agent误判率高的问题,拆解为“类型判断→专项评判→结果汇总”的多Agent流程:先判定承接页类型(如商品页/闪购页),再调用对应Agent按专属规则评判,同时输出token级推理过程,整体正确率提升25%。
三、效果展示:问题识别与效能提升
核心问题挖掘:
素材问题:版位错误、素材过期、素材被替换、素材截断;
投承问题:商品未还原、价格不一致、投承品类不匹配。
效能收益:
人效提升:自动化替代人工巡检,节约大量人日;
大模型赋能:将工程规则转化为自然语言,提升泛用性;
数据反哺:沉淀真机上报数据,驱动素材生产、投放圈选优化。
四、未来展望:体验与业务的深化拓展
数据资产沉淀:基于真机数据构建广告位物理尺寸资产集,优化素材生产与投放准确度;
体验维度延伸:新增唤端性能评测(FCP/FSP口径),评估承接页流畅度;
能力扩展:随业务形态接入更多大模型,覆盖直播、闪购等更多场景的问题挖掘,构建“素材+投承+性能”的全维度评测体系。