F

Anthropic社、Claude Codeでのマルチエージェントによるコードレビュー機能をベータ公開

AIニュース
|Fumi Nozawa

Anthropicは3月9日、マルチエージェントチームによるコードレビュー機能「Code Review」をベータ版として公開した。Anthropicが社内で運用しているレビューシステムをベースに、深い解析に重点を置き、通常の自動チェックでは見逃しがちなバグを検出することを目的としている。

コードレビューのボトルネック解消へ

Anthropicによると、同社エンジニアのコード出力量は過去1年で200%増加しており、レビュー作業がボトルネックになっているという。多くのプルリクエスト(PR)が十分に精査されず、スキムのような浅いレビューで済まされるケースが増えている。Code Reviewはこの課題に対応するために開発され、深い解析とマルチエージェントによる並列レビューで、従来のGitHub Actionよりも詳細なバグ検出を可能にした。

社内データでは、以前は16%のPRにのみ実質的なレビューコメントが付いていたが、Code Review導入後は54%に増加している。ただしPRの最終承認は人間が行う必要があり、AIが自動承認することはない。

マルチエージェントによるレビューの仕組み

PRが作成されると、Code Reviewは複数のエージェントを派遣し、並行してバグを検出。検出された問題は確認プロセスを経て、誤検知を排除し、重大度に応じてランク付けされる。最終結果は、PR上に概要コメントとしてまとめられ、必要に応じてインラインコメントも付与される。

レビューはPRの規模に応じてスケールし、大規模な変更には多数のエージェントが深く解析し、軽微な変更には簡易的なレビューが実施される。平均的なレビュー時間は約20分と報告されている。

実運用での効果

社内テストでは、1,000行以上の大規模PRでは84%に問題が検出され、平均7.5件の課題が報告された。一方、50行未満の小規模PRでは31%、平均0.5件の問題が見つかるにとどまる。検出された問題の正確性は高く、1%未満が誤検知として扱われた。

具体例として、ある本番サービスへの一行変更は一見問題ないように見えたが、Code Reviewは認証に影響する重大なバグとして警告。修正後にマージされ、エンジニア自身も見逃していた可能性があると報告している。

また、TrueNASのオープンソースミドルウェアでのZFS暗号化リファクタリングでは、既存コードに潜んでいた型不一致のバグが浮き彫りになり、従来の人間レビューでは見落とされやすい問題を特定した。

コストと管理

Code Reviewは深い解析を優先するため、GitHub Actionよりコストが高く、PRの規模に応じて平均15~25ドルのトークン使用料が発生する。組織は以下の管理機能を利用できる:

  • 月次予算上限設定
  • リポジトリ単位でのレビュー制御
  • ダッシュボードでレビュー数や承認率、総コストを追跡

利用開始方法

Code ReviewはTeamおよびEnterpriseプラン向けにベータ版として提供中。管理者はClaude Codeの設定で有効化し、対象リポジトリを選択するだけで、開発者は新規PR作成時に自動でレビューが実行される。詳細は公式ドキュメントで確認できる。

この記事をシェア

Fumi Nozawa

Fumi Nozawa

デジタルマーケター & ストラテジスト

Paul Smith、Boucheronといったグローバルブランドでデジタルマーケティングを担当。現在は海外を拠点に、戦略設計からWeb実装までを牽引。マーケターとしての視点とテクノロジーへの理解を活かし、欧米企業の日本進出やブランド成長を支援しています。

日本進出支援日本企業の海外進出支援Web開発デジタル体験ブランド戦略デジタル広告

プロジェクトの相談、その他ご相談など、 お気軽にお問い合わせください。