RPGで激変！コード生成の新潮流

紹介論文
1. この論文を一言でまとめると
はじめに：LLMコード生成の限界とRPGの登場
RPGとは？：リポジトリ計画グラフの全貌
ZeroRepo：RPGを活用したコード生成フレームワーク
RepoCraft：大規模コード生成のベンチマーク
RPGの可能性：スケーラビリティと応用
まとめ：RPGによる次世代コード生成

紹介論文

今回紹介する論文はRPG: A Repository Planning Graph for Unified and Scalable Codebase
Generationという論文です。

https://arxiv.org/pdf/2509.16198v1.pdf

この論文を一言でまとめると

大規模コード生成の課題を解決する「Repository Planning Graph (RPG)」を解説。LLMの限界を突破し、効率的かつ高品質なコードベース構築を可能にするZeroRepoフレームワークの全貌を掴み、次世代開発のヒントを得ましょう。

はじめに：LLMコード生成の限界とRPGの登場

近年のAI技術の進化は目覚ましく、特にLLM（大規模言語モデル）を活用したコード生成は、ソフトウェア開発の現場に大きな変革をもたらしつつあります。LLMは、関数やファイル単位といった比較的小規模なコードの自動生成においては目覚ましい成果を上げています。

しかし、大規模なソフトウェアリポジトリ全体をスクラッチから自動生成するとなると、LLMには依然として多くの課題が残されています。なぜなら、大規模プロジェクトでは、高レベルの要件定義から詳細な実装まで、一貫性のある計画と管理が不可欠だからです。

### 大規模プロジェクトにおけるLLMの課題

* **曖昧さと冗長性:** 自然言語は、人間にとっては理解しやすいものの、コンピュータにとっては曖昧で冗長な表現が多く、ソフトウェアの複雑な構造を正確に伝えるには限界があります。
* **計画の不安定性:** LLMが生成するコードの機能が、不完全であったり、重複していたり、スコープが不明確な場合があり、結果として要件の網羅性を担保するのが困難になります。
* **実装の断片化:** LLMが生成するコードは、依存関係、データの流れ、モジュール間の境界などが一貫しておらず、結果として全体がまとまりのない、不安定なシステムになりがちです。

これらの課題を解決するために登場したのが、RPG（Repository Planning Graph）という新しいアプローチです。

### RPG：次世代コード生成への道標

RPGは、機能要件、ファイル構造、データフロー、関数設計といった、リポジトリ全体を網羅した情報をグラフ構造で表現します。自然言語の曖昧さを排除し、ソフトウェア開発の全体像を明確化することで、長期的な計画とスケーラブルなコード生成を可能にします。

RPGを活用することで、開発者はより効率的かつ高品質なコードベースを構築できるようになり、ソフトウェア開発の未来を大きく変える可能性を秘めているのです。RPGは、まさに次世代コード生成への道標となるでしょう。

RPGとは？：リポジトリ計画グラフの全貌

大規模コード生成の課題を解決する鍵となるのが、**Repository Planning Graph (RPG)** です。RPGは、従来の自然言語による計画とは一線を画す、構造化されたリポジトリ表現です。では、RPGとは一体何なのでしょうか？

### RPGの概念：コード生成を効率化する設計図

RPGは、単なるファイルやディレクトリのリストではありません。リポジトリの機能と実装ロジックを、ノードとエッジで表現する、洗練された設計図です。

* **ノード:** 階層的な機能（例：データ読み込み、機械学習アルゴリズム、評価）と、それに対応するファイル、クラス、関数を指定します。つまり、「何を作るか」を定義します。
* **エッジ:** ノード間のセマンティックな関係（例：データの流れ、依存関係）をエンコードします。つまり、「どのように作るか」を定義します。

RPGは、機能レベルだけでなく、リポジトリ全体の構造も表現するため、開発者はコードベース全体を俯瞰しながら設計できます。

### RPGの構造：機能と実装を統合する力

RPGは、リポジトリの機能を段階的に詳細化していく過程を表現します。高レベルのモジュールから具体的なアルゴリズムまで、階層的に表現することで、複雑なシステムも整理することができます。

* **機能レベル:** 高レベルのモジュールが、中レベルのコンポーネント、最終的には具体的なアルゴリズムへと分解される過程を表現します。
* **構造レベル:** リポジトリのファイル構成を反映し、ルートノードはファイル領域、中間ノードはファイル、リーフノードは関数やクラスに対応します。

RPGを用いることで、機能の階層構造と実際のファイル構成が自然に対応付けられ、開発者はより直感的にコードを理解し、修正することができます。

### 自然言語による計画との違い：曖昧さを排除し、一貫性を実現

従来の自然言語による計画は、曖昧さや冗長性、長期的な計画の維持の難しさといった課題がありました。RPGは、これらの課題を克服し、コード生成を効率化します。

* **曖昧さの排除:** 自然言語の代わりに、明確な構造を持つグラフを使用することで、意図の解釈のずれを防ぎます。
* **一貫性の実現:** 長期的な計画でも、機能と実装の整合性を維持し、矛盾のないコードベースを生成します。
* **コンパクトな表現:** 複雑なシステムを、簡潔かつ理解しやすい形で表現します。

RPGは、従来の自然言語プランの弱点を克服し、コード生成プロセス全体を通じて一貫性と効率性をもたらします。

### RPGによるコード生成の効率化：複雑なシステムをシンプルに

RPGは、複雑な依存関係をモデル化し、コードの規模が大きくなっても、ほぼ線形にスケーリングします。また、エージェントがリポジトリを理解するのを助け、コードの特定箇所を迅速に見つけ出す（ローカリゼーション）能力を高めます。

* **依存関係のモデル化:** モジュール間のデータフローやクラス間の関係など、複雑な依存関係を明確に表現します。
* **スケーラビリティ:** 機能の追加やコードの増大に対して、安定したパフォーマンスを維持します。
* **エージェントのローカリゼーション:** コードの修正や機能追加が必要な箇所を、迅速かつ正確に特定します。

RPGは、単なる設計図ではありません。コード生成の効率と品質を向上させるための強力なツールなのです。

RPGは、コード生成のあり方を根本から変える可能性を秘めています。次世代のコード生成技術を理解し、活用するために、RPGの概念と構造をしっかりと把握しておきましょう。

ZeroRepo：RPGを活用したコード生成フレームワーク

前セクションでは、RPGが大規模コード生成における課題を解決する鍵となることを解説しました。本セクションでは、そのRPGを実際に活用したコード生成フレームワークであるZeroRepoについて、その内部構造を詳しく見ていきましょう。

ZeroRepoの3つの主要なステージ

ZeroRepoは、RPGを中核として、以下の3つの段階を経てリポジトリを生成します。

提案レベル構築（Proposal-Level Construction）
実装レベル構築（Implementation-Level Construction）
グラフ誘導コード生成（Graph-Guided Code Generation）

それぞれのステージでRPGがどのように機能し、品質を保証するのかを詳しく解説します。

1. 提案レベル構築：機能グラフの設計

最初のステップは、ユーザーからの仕様（例えば「機械学習ライブラリを作って」）を、実行可能なコードに変換するための設計図、つまり機能グラフを作成することです。この段階では、以下の3つのプロセスを経て機能グラフを洗練していきます。

機能のグラウンディング：広範なフィーチャーツリーと呼ばれる、ソフトウェア機能の知識ベースから、プロジェクトに関連するノードを抽出します。これにより、LLMの不安定さや偏りを軽減し、網羅的な機能選択を可能にします。
リポジトリに合わせたサブツリーの選択：ユーザーの目的に合わせて、フィーチャーツリーから最適なサブツリーを選択します。探索（Exploration）と活用（Exploitation）を組み合わせた戦略を用いることで、多様性と精度を両立します。
グラフのリファクタリング：選択されたサブツリーを、凝集度と結合度に基づき、モジュール化された機能グラフに再構成します。LLMがソフトウェアエンジニアリングの原則に従って機能を分割し、明確な機能境界を確立します。

2. 実装レベル構築：RPGの完成

機能グラフが完成したら、次はそれを具体的なコードに落とし込むための情報を追加します。この段階では、以下の要素をエンコードすることで、機能グラフを完全なRPGへと拡張します。

ファイルスケルトン：リポジトリのファイル構造を定義し、機能モジュールを具体的なディレクトリに配置します。
インターフェース：モジュール間のデータフローをモデル化し、関数やクラスのインターフェースを明確化します。
データフロー：モジュール間のデータの流れを定義し、インターフェース設計を具体的な実行セマンティクスに結びつけます。

3. グラフ誘導コード生成：テスト駆動開発による品質保証

RPGが完成すると、ZeroRepoはいよいよコードの生成に取り掛かります。この段階では、以下の2つの重要な要素が品質保証を支えます。

トポロジカル順序でのトラバース：RPGのノードを依存関係の順に処理することで、依存関係が満たされた状態でのコード生成を保証します。
テスト駆動開発（TDD）：各ノードに対応するコードを生成する前に、タスク仕様からテストケースを自動生成します。生成されたコードはテストに合格するまで修正され、品質を確保します。

テスト駆動開発（TDD）とは、テストコードを先に記述し、それに合格するように実装を行う開発手法のことです。これにより、開発初期段階から品質が確保され、手戻りが少なくなります。

このように、ZeroRepoはRPGという設計図に基づき、着実にコードを生成していくことで、高品質なリポジトリを構築します。

RepoCraft：大規模コード生成のベンチマーク

近年、LLM（大規模言語モデル）を活用したコード生成技術が急速に進化していますが、その真価を測るための信頼できる評価基準が不可欠です。そこで登場したのが、**RepoCraft**ベンチマークです。

RepoCraftは、単なるコードの断片的な生成能力だけでなく、リポジトリ全体の設計、実装、そしてテストまでを包括的に評価することを目的としています。これにより、LLMが現実世界のソフトウェア開発プロジェクトにどれだけ貢献できるのか、より正確に把握することが可能になります。

RepoCraftベンチマークの概要

RepoCraftは、以下の6つの著名なオープンソースプロジェクトを基に構築されています。

* scikit-learn
* pandas
* sympy
* statsmodels
* requests
* django

これらのプロジェクトは、機械学習、データ分析、数式処理、Webフレームワークなど、多様な分野を網羅しており、現実的なソフトウェア開発のシナリオを反映しています。RepoCraftでは、これらのプロジェクトを「お題」として、LLMにリポジトリ全体のコード生成を依頼します。そして、生成されたコードの機能網羅性、正確性、コード品質などを詳細に分析し、評価を行います。

ZeroRepo、RepoCraftで優れた性能を発揮！

RepoCraftベンチマークにおいて、ZeroRepoは既存手法を凌駕する優れた性能を発揮しました。特に、以下の点でその有効性が示されています。

* **機能網羅性：** 必要な機能をどれだけ満たしているか。ZeroRepoは**最大81.5%**の機能網羅率を達成し、既存の最強手法（Claude Code）を大きく上回りました。
* **新規性：** 既存の機能だけでなく、新しい機能を生み出す能力も評価。ZeroRepoは、**11〜13%**の新規性率を達成し、100を超える新たな機能を追加しました。
* **コード規模：** 生成されたコードの規模も重要な指標です。ZeroRepoは、**36K LOC**（コード行数）および**445Kトークン**を生成し、既存手法を圧倒しました。

これらの結果は、ZeroRepoがRPGを活用することで、より大規模かつ多様で、現実世界のソフトウェア開発に近いリポジトリを構築できることを示しています。

既存手法との比較から見えてくるRPGの優位性

ZeroRepoと既存手法との比較を通じて、RPGの優位性が明確になりました。従来の自然言語による計画では、機能が不完全であったり、重複していたり、一貫性がなかったりする課題がありましたが、RPGは構造化された計画によってこれらの問題を解決し、より高品質なコード生成を実現しました。

詳細なデータや分析結果については、論文をご参照ください。

RepoCraftベンチマークは、大規模コード生成技術の進歩を測るための重要な指標となります。そして、ZeroRepoの優れた性能は、RPGが次世代のコード生成技術を牽引する可能性を示唆しています。

RPGの可能性：スケーラビリティと応用

RPG（Repository Planning Graph）は、単なるコード生成ツールではありません。その真価は、スケーラビリティ、複雑な依存関係のモデル化能力、そしてエージェントのローカリゼーション能力という3つの重要な側面において発揮されます。これらの特性は、今後の大規模コード生成と長期的な開発において、RPGが中心的な役割を果たす可能性を示唆しています。

RPGのスケーラビリティ：コードの海を乗りこなす

従来のコード生成手法では、機能を追加するたびに複雑性が増し、開発効率が低下するという課題がありました。RPGは、この問題を解決するために、機能とコードサイズをほぼ線形にスケーリングする能力を備えています。つまり、プロジェクトが大規模化しても、RPGを活用することで、開発速度を維持し、効率的なコード生成を継続できるのです。

これは、自然言語表現を用いた場合とは対照的です。自然言語では、プロジェクトが進化するにつれて、一貫性を保つのが難しくなり、コードの品質が低下する可能性があります。RPGは、首尾一貫性と拡張性を維持し、ますます複雑な機能とアーキテクチャを備えたリポジトリをモデル化するための強固な基盤を提供します。

複雑な依存関係のモデル化：コードのつながりを明確にする

現代のソフトウェア開発では、コンポーネント間の複雑な依存関係を適切に管理することが重要です。RPGは、モジュール間のデータフローやクラスレベルの関係など、複雑な依存関係をモデル化する強力な手段を提供します。

たとえば、あるモジュールの出力が別のモジュールの入力として使用される場合、RPGはこれらの関係を明示的に表現できます。これにより、開発者はコードの全体像を把握し、変更が他のコンポーネントに与える影響を予測しやすくなります。また、クラス間の継承関係やインターフェースの実装なども明確にモデル化できるため、コードの再利用性と保守性を高めることができます。

エージェントのローカリゼーション能力：問題解決を迅速化する

コード生成エージェントが、大規模なコードベースの中から特定の問題に関連するコード箇所を迅速に特定できることは、開発効率を大きく左右します。RPGは、エージェントのリポジトリ理解を向上させ、ローカリゼーションを加速することで、この課題を解決します。

グラフガイダンスは、エージェントに原則的なナビゲーションメカニズムを提供し、より高速な依存関係追跡、より正確なバグのローカリゼーション、よりスムーズなモジュール統合を可能にします。これは、バグ修正や機能追加といったタスクの効率を大幅に向上させます。従来の自然言語ベースの手法と比較して、RPGはリポジトリのグローバルな構造表現を提供し、エージェントが機能全体の視点からターゲットをローカライズし、開発サイクル全体を加速することを可能にします。

今後の応用：大規模コード生成と長期的な開発

RPGのスケーラビリティ、依存関係のモデル化能力、ローカリゼーション能力は、今後の大規模コード生成と長期的な開発において、非常に有望な可能性を示しています。RPGは、複雑なソフトウェアシステムの構築を支援し、開発プロセス全体を効率化するための強力なツールとなるでしょう。

特に、以下のような分野での応用が期待されます。

エンタープライズアプリケーション開発: 大規模で複雑なビジネスロジックを持つアプリケーションの自動生成。
組み込みシステム開発: ハードウェアとソフトウェアの連携を考慮した、効率的なコード生成。
AIを活用したソフトウェア開発: 機械学習モデルの学習、評価、デプロイメントを自動化するフレームワークの生成。

RPGは、リポジトリレベルのコード生成における主要な構造化された表現として機能する可能性を秘めており、今後のソフトウェア開発のあり方を大きく変えるかもしれません。

まとめ：RPGによる次世代コード生成

Repository Planning Graph (RPG) は、LLMを活用したコード生成の未来を大きく変える可能性を秘めた、革新的なアプローチです。提案レベルから実装レベルまで、一貫した計画を可能にする構造化された表現は、これまでの自然言語による計画の限界を克服し、より効率的かつ高品質なコードベースの構築を支援します。

ZeroRepoフレームワークが示すように、RPGは単なる理論的な概念ではありません。RepoCraftベンチマークでの優れた性能は、RPGがスケーラビリティ、正確性、そして現実的なソフトウェア開発の複雑さを扱う能力において、既存の手法を凌駕することを示しています。

今後の研究開発においては、以下のような方向性が考えられます。