■ 1. 背景と課題
- AI駆動開発によりコード生産量が急増した一方で人間のレビュー時間は変わらずPRのスタックが問題となった
- 「最低1人からApproveをもらう」ルールにより数時間待った末にnitpickレベルの指摘を受けて修正・再依頼するという非効率な状況が常態化していた
- すべてのPRに人間レビューを必須とすることの合理性が問い直されるようになった
■ 2. One-Way Door / Two-Way Door フレームワーク
- Amazonの創業者Jeff Bezosが株主への手紙で示した意思決定の分類フレームを採用した
- 基本方針:
- One-Way Door(戻れない決定): 慎重に審査する
- Two-Way Door(戻れる決定): 速く判断する
- 代表的なOne-Way Door例はデータベース設計であり スキーママイグレーションやデータマイグレーションに多大な工数がかかる
- フロントエンドのUI変更やAPIスキーマの改修などはTwo-Way Doorに該当し少ない工数で方針変更が可能
- PRの大半はTwo-Way Doorであり人間レビューを必須とする合理的理由はないという仮説を立てた
■ 3. セルフマージガイドライン
- 判定の軸: 「その変更は容易にやり直せるか」で決まる
- 人間レビュー必須の対象(特定領域・パス指定):
- DBスキーマ・マイグレーション(カラム削除や型変更はデータ消失を伴い本番適用後のDDLロールバックも困難)
- RLSポリシー(設定ミスが即座に全テナントへ波及しセキュリティインシデントにつながる)
- 認証・認可(認証バイパスやセッション漏洩はrevertしても被害が残る)
- インフラ(IaC)・CI/CDのデプロイ系ワークフロー
- AI基盤設定・リリース制御・依存関係のMajorアップデート
- 人間レビュー必須の対象(アプリケーション全体に波及する変更・性質指定):
- 基盤ライブラリの追加・置換(フレームワーク・ORM・AI基盤・認証基盤など)
- マネージドサービスの追加・変更
- ミドルウェア構成・エラーハンドリング戦略・ロギング基盤などの横断的関心事
- モノレポ構成の変更
- 例外: Design Docs・ADR・コーディング規約などチーム合意を伴うドキュメントはOne-Way Doorではないが人間レビューを必須とする(合意形成プロセスを経ない更新を防ぐため)
- 上記に該当しないものはTwo-Way Doorとみなしてセルフマージ可とし 判断に迷った場合は人間レビューを選ぶことをデフォルトとする
■ 4. Claude Code Actionによる自動判定
- PR作成時にClaude Code Actionがガイドラインと差分を読み込みセルフマージ可否をコメントで投稿する
- 判定結果は「セルフマージ可」「人間レビュー必須」のいずれかで根拠となるガイドライン該当項目と該当ファイルもあわせて提示される
- PR作成者もレビュアーもその場でセルフマージの可否とその理由を把握できる
- 判定が誤っていると感じた場合はPR作成者がコメントで反論したりガイドライン自体を更新したりできる
- Claude Code Actionの判定はあくまで判断の拠り所であり最終決定権は人間にある
■ 5. 導入効果(運用開始後2週間)
- セルフマージ判定結果:
- 159件中80%(127件)が「セルフマージ可」と判定された
- 事前想定(約2/3)を上回る比率でセルフマージが適用可能であった
- リードタイム改善:
- p90リードタイムが過去13週の132〜316hのレンジから直近週は92hに短縮された(約30〜70%削減)
- 24h以内マージ率が48〜68%から77%に向上した
- 中央値は1.7hとなりほとんどのPRが同日中にマージされる状態に近づいた
■ 6. リスク対策
- Design Docによる事前合意:
- 新規機能開発時に機能要件と技術的な設計の両方をDesign Docにまとめて1つのPRで人間レビューを必須とする
- POからビジネス要求のApproveを Devメンバーからエンジニアリング判断のApproveをそれぞれ取得する
- 事前すり合わせにより以後の開発をほぼセルフマージで進めつつ要件や実装方針のブレリスクを抑制できる
- ドキュメントの剪定:
- AIレビューの精度はチームのドキュメント品質に強く依存するためドキュメント管理を整備する
- AI自身がドキュメントを書くようになり1ファイル1000行近くに達するものも出てきたため扱いづらくなっていた
- ドキュメンテーションガイドラインを策定しAgent Skillsでリポジトリ全体を継続的に剪定する仕組みを整えた
- AIレビューの拡張:
- 既存のDevin Review・CodeRabbit・CopilotにClaude Code Actionによるコードレビューを追加した
- Claude Code Actionはプロンプトを細かく指定できSub Agentを並列に動かして観点を独立して増やせる点が優れている
- AIレビューが過剰になったり的外れなコメントが続いたりすると開発者が疲弊してスルーするリスクがある
- AIレビューの精度や指摘傾向を継続的に観測して改善するループを設計中である
■ 7. 結論
- 人間レビュー必須のルールはコードを人間が書いていた時代に作られたものでありAI駆動開発の現在では見直しが必要
- One-Way Door / Two-Way Doorの考え方でAIと人間のレビューを線引きし判定をClaude Code Actionに委任することでPRの約8割が人間レビューを介さずマージできるようになった
- p90リードタイムは過去13週のレンジと比較して約30〜70%短縮され開発者はレビュー待ちなく次のタスクに着手できる状態となった
- AI駆動開発の中では開発プロセスのあらゆる前提が問い直し対象となり引き続き仕組みのアップデートを続ける方針である