meng shao on X: "Agentic Code Review作者 @addyosmani 随着工程瓶颈已从「写代码」转移到「能否信任代码」,代码审查成为当前软件工程里杠杆最高的能力。# 四份独立来源(Faros AI、CodeRabbit、Gi

365bet登录地址 📅 2026-06-20 03:04:06 ✍️ admin 👀 181 ❤️ 363
meng shao on X:

PostLog inSign upPostmeng shao@shao__mengAgentic Code Review

作者 @addyosmani

随着工程瓶颈已从「写代码」转移到「能否信任代码」,代码审查成为当前软件工程里杠杆最高的能力。

# 四份独立来源(Faros AI、CodeRabbit、GitClear、GitHub)指向同一结论:

· 代码产出约 4 倍,实际交付价值仅约 +10%:多出来的 90% 是「待验证的代码」

· 代码 churn +861%、缺陷率 9%→54%:质量与可审查性在下降

· 零 review 合并的 PR +31%、review 时长 +441%:不是「决定不 review」,而是 review 跟不上量

· AI 共著 PR 问题数约 1.7 倍:弱点可预测:逻辑、安全、可读性

# 最重要的前提:你在光谱的哪一端

Osmani 反复强调:大多数争论是不同处境的人互相 prescribing。

三个变量决定 review 策略:

· 爆炸半径 — 坏了会怎样(无人用 vs 用户/金钱/PII)

· 代码寿命 — 下周重写 vs 维护十年

· 理解者数量 — 只有你 vs 整个团队

solo 无用户:可 lean on 测试 + 自动化,轻量 review;但「无用户 ≠ 无验证」,跳过 review 只是把债往后推。

有用户的中期(最危险):仍沿用 solo 习惯,直到事故/postmortem 才醒悟。

大型老系统 + 多用户:文中所述所有 alarming 数据 全部适用,review 同时承担 bug 捕获、知识传递、 comprehension debt 防控。

# Review 的本质变了

传统 review:作者在脑子里已有 intent,reviewer 核对推理。

Agentic review:agent 有 reasoning,但 几乎从不随 diff 附上;reviewer 常是 第一个真正读这段代码的人,还要 重建从未写下来的 intent——这比旧模式更难、更慢,解释了 review 时长暴增。

可解的部分(工具问题):

· 要求 agent 提交:做了什么、排除了什么、决策日志

· 把 intent 重建成本 推回提交方,而非 reviewer 吸收

不可完全外包的部分(人的问题):

· 「这段代码对不对」 vs 「该不该做这件事」

· 没人写进 spec 的需求缺口

· 高爆炸半径下的 accountability

# AI Review 工具:不要选「最好的一个」,要跑「不同的几个」

实证(146 个 PR、4 个 reviewer 并行):

· 93.4% 的 flagged 位置只被 1 个工具发现

· 四个工具 从未同时 flag 同一行

· 各有强项:Greptile(正确性/架构)、CodeRabbit(覆盖面+修复)、Seer(生产严重度)

结论:同质模型 × 4 = 一个 reviewer + 四倍账单;异构 reviewer 组合 才接近「对抗式审查」。高 stakes 跑两个性格不同的;solo 一个 good reviewer + 真测试通常够用;必须在自己代码库上实测。

# 人的角色:从 loop 里到 loop 上

Osmani 的立场(也是文中最具操作性的框架):

· 「人类逐行读每个 diff」已不现实

· 「让 loop 自审自判然后走人」同样危险 — 同源模型的 correlated blind spots,会形成 借来的 confidence

· 正解:human on the loop,而非 in the loop

· 机器:第一遍 triage、低风险/fast-track、重复性检查

· 人:merge 决策、高风险路径、plan/judgment、抽样审计

他自己的做法:用 Claude Code/Codex 对一批 PR 做 风险排序 triage,几分钟确认低风险项,把深度 attention 留给 flagged 项——不是 review 变快,是 review 的形状变了。

Kun Chen(~40 PR/天)是光谱另一端:plan 写在前、agent 并行跑、自动化 gate(No Mistakes)、人负责 escalation——不是不 verify,是把 verify 前移/自动化;复制到企业多用户系统 ≈ 复现 Faros 数据。

# 可执行的 Review 体系(重要!)

1. 按风险分层,不按作者分层

配置改 → linter + 一眼;核心路径 → types、tests、双 AI reviewer、owner 人工、安全 pass。

2. upfront triage(circuit breaker)

Agent PR 约 28% 可快速合并;大 patch、高维护成本 PR 应 先预测、再决定是否投入 human hour——否则 agent 常在主观反馈后 ghost,reviewer abandonment 占 rejected agent PR 的 38%。

3. 提高 intake 门槛(证据 required)

变更目的陈述、合理大小的 diff、真实跑过的 test output——把「第一个读代码的人」从 reviewer 推回 author/agent。

4. 刻意小 PR

Agent PR 平均大 51%;大 diff 要么被拒,要么被 rubber-stamp。

5. 先读 test diff,再读 implementation

典型 failure mode:改行为 → 改 assertion 让测试变绿。绿 check ≠ 行为正确;mutation testing 在此有价值。

6. CI 是不可谈判的墙

警惕:删测试、skip lint、降 coverage、重复 helper、用户输入进 prompt 无防护。Agent 会「梯度下降」到最便宜的 green——CI 不能被说服。

7. 人 owns merge

AI review 是 sensor,不是 verdict;能点 merge 的人 = 能 on-call 的人。

# 对团队负责人的含义

· binding constraint 已是「trusted human 确认速度」,不是 generation 速度

· 因「AI 提速」砍 review/QA 人力 = 把节省换成未来 incident

· Review capacity 是 需度量、保护、 deliberate 花费的资源,不是 AI 解放出来的 slack

· OS maintainer 的 triage 地狱是 canary;企业若只盯 merged PR 指标,会看不见 senior engineer 被 review tax 拖垮Addy Osmani@addyosmaniJun 15ArticleAgentic Code ReviewCoding agents are extraordinarily good now and getting better fast. The interesting consequence is that the hard part of engineering moved from writing code to deciding whether to trust it, which...1:01 AM · Jun 16, 202612.7KViews303016167878113113Read 30 repliesNew to X?Sign up now to get your own personalized timeline!

Sign up with GoogleSign up with AppleCreate accountBy signing up, you agree to the Terms of Service and Privacy Policy, including Cookie Use.

Relevant peoplemeng shao@shao__mengFollowTrending nowTerms of Service|Privacy Policy|Cookie Policy|Accessibility|Ads info|More© 2026 X Corp.Don't miss what's happeningPeople on X are the first to know.Log inSign up

相关推荐

sportcar365 十大返利APP佣金排行榜|揭晓返利佣金最高的APP是哪个?
365bet登录地址 足球买球时加时赛算不算?深度解析足彩规则与历史渊源
注册365bet要什么条件 13段蝎子精套6特技化生展:8个全红宝宝
注册365bet要什么条件 广角摄像头能拍多少度,广角摄像头能拍多少度的照片
sportcar365 中国移动查询号码方式汇总
sportcar365 寒暄和寒喧哪个才是正确的用词?
365bet登录地址 《LOL》萨勒芬妮什么时候出 萨勒芬妮国服上线时间
365bet登录地址 T28(概念车)

T28(概念车)

📅 11-11 👀 3142
sportcar365 特仑苏节气广告《天鹅湖》,拍出了真正的生命力

友情伙伴