AI赋能研发治理:记一次由生产事故驱动的代码库保护自动化实践
-
1.1. 事故现场还原
-
问题现象:已评审、已测试的功能在生产环境“神秘”消失。
-
业务影响:描述该问题对业务造成的具体损失或影响。
-
根本原因(Root Cause):深入剖析供应商研发人员不规范的
cherry-pick操作,是如何“绕过”了正常的合并流程,导致了代码遗漏。
-
-
1.2. 问题的根源:失控的分支
- 核心痛点:
master分支缺少保护机制,任何人都可以随意推送(Push),为风险埋下伏笔。 - 管理挑战:公司项目众多,代码库数量庞大,如何保证每个库都遵循了最佳实践?
- 引出思考:单纯依靠“人治”和文档规范,已经无法应对规模化的研发管理。我们急需从“救火队员”转变为“防火体系建设者”。
- 核心痛点:
-
2.1. 我们的武器:Google Antigravity Skill
- 思路转变:介绍为什么选择构建一个AI Skill,而不是编写一个简单的脚本。突出其“自动化”、“智能化”和“可集成”的特性。
- Skill核心使命:定义这个Skill的核心目标——成为代码库分支规范的“守护者”。
-
2.2. “分支守护者” Skill 功能解析
- 第一步:全量资产发现 - 自动通过API获取公司代码管理平台下,指定项目的所有代码库列表。
- 第二步:智能合规检查 - 遍历每一个代码库,检查其
master(或main)分支是否已按要求配置了保护规则(如:禁止强制推送、必须通过Pull Request合并等)。 - 第三步:风险可视化报告 - 自动生成报告,清晰地列出所有“不合规”的代码库,并@相关负责人。
-
2.3. 实现亮点(可选,根据听众技术背景深浅决定)
- 简述实现的关键技术点,例如如何处理API认证、如何设计并行检查以提高效率等。
-
3.1. 可量化的价值
- 效率提升:展示自动化检查与之前人工抽查在时间成本上的巨大差异(例如:过去需要
N人/天,现在仅需M分钟)。 - 风险降低:通过100%覆盖,从源头上杜绝了同类生产事故的再次发生,将分支保护配置率从
X%提升至100%。
- 效率提升:展示自动化检查与之前人工抽查在时间成本上的巨大差异(例如:过去需要
-
3.2. 超越代码的价值
- 文化建设:在团队中树立了“工具化”、“自动化”解决问题的工程师文化。
- 研发治理:为公司建立了一套可扩展、可复制的自动化研发治理(Engineering Governance)范例。
-
4.1. 经验沉淀
- 从一个具体问题出发,是推动AI技术落地的最佳路径。
- 技术方案服务于业务价值,是衡量实践成功与否的黄金标准。
-
4.2. 未来蓝图
- 功能闭环:下一步,Skill不仅要能“检查”,还要能“行动”。例如,自动为未配置保护的仓库创建修复任务,甚至尝试调用API进行“一键修复”。
- 场景延伸:将这种AI Skill模式推广到更多研发治理场景,例如:
- 代码中的敏感信息(密钥、Token)泄露检查。
- 开源组件(Jar包、NPM包)的安全漏洞扫描。
- API文档与代码实现的一致性检查。