Delta Activations徹底解説！LLMの再利用を加速

紹介論文
1. この論文を一言でまとめると
イントロダクション：LLM再利用時代の課題とDelta Activations
Delta Activationsとは？仕組みを徹底解剖
実験結果から見るDelta Activationsの有効性：クラスタリングと加法性
1. クラスタリング：モデルをタスクやドメインごとに分類
2. 加法性：複数の特性を組み合わせた表現
Delta Activationsの応用例：モデル選択、タスク埋め込み、モデルマージ
Delta-Xファミリー：多様なモデル表現への拡張
まとめ：Delta ActivationsでLLMの再利用を加速しよう
1. Delta Activationsを活用するための3つのステップ

紹介論文

今回紹介する論文はDelta Activations: A Representation for Finetuned Large Language Modelsという論文です。

https://arxiv.org/pdf/2509.04442v1.pdf

この論文を一言でまとめると

Delta Activationsは、ファインチューンされたLLMをベクトル表現することで、モデルの特性を効率的に比較・分類する革新的な手法です。本記事では、その仕組みから応用例までを分かりやすく解説し、LLMの再利用を促進する方法を提案します。

イントロダクション：LLM再利用時代の課題とDelta Activations

大規模言語モデル（LLM）の進化は目覚ましく、特にオープンソースLLMの登場によって、誰もが手軽に高性能なモデルを利用できる時代になりました。さらに、特定のタスクやドメインに特化したファインチューンモデルが続々と登場し、LLMの活用範囲はますます広がっています。

しかし、ここで新たな課題が生まれています。それは、増え続けるファインチューンモデルの中から、自分の目的に最適なモデルをどのように見つけ出すか？という問題です。

例えば、あなたが医療分野の文章生成AIを開発したいと考えているとしましょう。数多くの医療系ファインチューンモデルが存在する中で、それぞれのモデルがどのような特性を持ち、どのデータセットで学習されたのか、性能はどの程度なのか、といった情報を一つ一つ調べて比較するのは、非常に手間がかかります。現状では、モデルに関するメタデータが不十分であったり、リポジトリが整理されていなかったりするため、モデルの比較が困難な状況です。

この課題を解決するために提案されたのが、Delta Activationsという新しい手法です。Delta Activationsは、ファインチューンされたモデルを、その内部アクティベーションの変化を捉えたベクトル表現として表現します。これにより、モデルの特性を数値的に比較することが可能になり、モデルのクラスタリングやモデル選択、さらにはモデルマージといった様々な応用が期待されています。

Delta Activationsは、モデル自体から得られる情報のみに基づいてモデルを表現するため、学習データへのアクセスを必要としません。

本記事では、Delta Activationsの仕組みから応用例までを徹底的に解説し、LLMの再利用を加速するためのヒントを提供します。Delta Activationsを活用することで、あなたはLLMの海を迷うことなく、目的に合った最適なモデルを見つけ出し、その潜在能力を最大限に引き出すことができるでしょう。

さあ、Delta Activationsの世界へ飛び込み、LLMの再利用を加速させましょう！

Delta Activationsとは？仕組みを徹底解剖

Delta Activationsは、ファインチューンされた大規模言語モデル（LLM）の再利用を促進する、革新的な手法です。その核心は、モデルの内部アクティベーションの変化を捉え、それをベクトルとして表現することにあります。このセクションでは、Delta Activationsの仕組みを徹底的に解剖し、その計算方法と、モデルの特性をどのように捉えるのかを図解を交えながら解説します。

Delta Activationsの定義：変化を捉えるベクトル表現

Delta Activationsは、ある特定の入力が与えられたとき、ベースモデル（事前学習済みの元のモデル）とファインチューンモデル（特定のタスク向けに調整されたモデル）の内部状態がどのように異なるかを定量化します。具体的には、以下の式で表されます。

“`
∆f(x) = hf(x) – hbase(x)
“`

ここで、

* `∆f(x)`: 入力`x`に対するDelta Activations（ベクトル）
* `hf(x)`: ファインチューンモデル`f`の入力`x`に対する最終層のアクティベーション
* `hbase(x)`: ベースモデルの入力`x`に対する最終層のアクティベーション

つまり、Delta Activationsは、ファインチューンによってモデルの内部表現がどのように変化したかを捉える差分ベクトルなのです。

Delta Activationsの計算ステップ：汎用的なプロンプトでモデルを比較

Delta Activationsを実際に計算するには、以下のステップを踏みます。

1. **プローブデータセットの準備:**

モデルのコアな計算経路を活性化させるために、タスク固有の情報を含まない、汎用的なプロンプトテンプレートから生成された固定されたデータセットを使用します。これにより、モデルの偏りを最小限に抑え、純粋なモデルの特性を捉えることができます。

2. **アクティベーションの取得:**
ベースモデルとファインチューンモデルの両方で、プローブデータセットの各入力に対する最終層のアクティベーションを取得します。このアクティベーションは、モデル内部のニューロンの発火パターンを表しており、モデルがどのように情報を処理しているかの指標となります。

3. **差分ベクトルの計算:**
各入力に対して、ファインチューンモデルのアクティベーションからベースモデルのアクティベーションを減算し、差分ベクトルを計算します。この差分ベクトルが、その入力に対するモデルの変化を表します。

4. **集約:**
すべての入力に対する差分ベクトルを平均化し、モデル全体の埋め込みベクトル（Delta Activations）を生成します。この平均化によって、個々の入力に依存しない、モデルの普遍的な特性を捉えることができます。

図解：Delta Activationsのイメージ

[論文の図2を参考に、Delta Activationsの計算プロセスを図解で説明する。図には、ベースモデル、ファインチューンモデルA、ファインチューンモデルBのそれぞれのアクティベーションと、Delta Activationsのベクトルが表示されている。] (図は省略)

図を入れる場合は、論文の図2を参考にしてください。ベースモデル、ファインチューンモデルA、Bの隠れ層の状態と、それぞれのDelta Activationsのベクトルを示すイメージです。

Delta Activationsが捉えるモデルの特性：行動指標としてのデルタ

Delta Activationsは、単なる数値の羅列ではありません。それは、モデルがベースモデルからどのように学習し、変化したかを物語る行動指標なのです。Delta Activationsは、以下の特性を捉えることができます。

* **タスクへの適応:** Delta Activationsは、モデルが特定のタスクを解決するために、内部表現をどのように変化させたかを反映します。
* **ドメイン知識の獲得:** Delta Activationsは、モデルが特定のドメインの知識を獲得するために、ニューロンの発火パターンをどのように調整したかを捉えます。
* **学習方法の違い:** Delta Activationsは、異なる学習方法（例えば、教師あり学習と強化学習）がモデルの内部表現に与える影響を明らかにします。

このように、Delta Activationsは、モデルのブラックボックスな内部を覗き込み、その特性を理解するための強力なツールとなるのです。

Delta Activationsは、モデルの内部表現の変化を捉えることで、モデルの特性を理解するための鍵となります。次のセクションでは、実験結果を基に、Delta Activationsが実際にどのように役立つのかを見ていきましょう。

実験結果から見るDelta Activationsの有効性：クラスタリングと加法性

Delta Activationsの真価は、その有効性を示す実験結果に裏打ちされています。論文では、様々な実験を通して、Delta ActivationsがLLMを効果的に表現し、その特性を捉えることができることが示されています。ここでは、特に重要な「クラスタリング」と「加法性」の2つの側面について、具体的な実験結果を交えながら解説します。

クラスタリング：モデルをタスクやドメインごとに分類

LLMの再利用を促進するためには、モデルがどのようなタスクやドメインに特化しているかを把握することが重要です。Delta Activationsは、モデルをベクトル表現に変換することで、この分類を自動化することを可能にします。

論文では、異なるドメイン（LEGAL, MATH, MEDICAL, COMMONSENSE, CODING）のデータセットでファインチューンされたLLMのモデルプールを構築し、Delta Activationsを用いてこれらのモデルをクラスタリングする実験が行われました。その結果、Delta Activationsは、モデルがどのドメインに特化しているかを高い精度で識別し、適切にクラスタリングできることが示されました。

クラスタリングの指標：シルエットスコア
クラスタリングの性能は、シルエットスコアという指標で評価されます。シルエットスコアは、-1から+1までの値をとり、+1に近いほどクラスタリングの質が高いことを意味します。

さらに、Delta Activationsのクラスタリング性能を評価するために、以下のベースライン手法との比較が行われました。

* Flattened weights: ファインチューンされたLoRAアダプターの重みを直接ベクトル化したもの
* Salient mask: ファインチューンによって最も大きく更新されたパラメータの上位1%を示すバイナリマスク
* Output sentence embeddings: モデルが生成した出力文を文埋め込みモデルでベクトル化したもの

その結果、Delta Activationsは、すべてのベースライン手法を上回り、最も優れたクラスタリング性能を発揮しました。特に、Flattened weightsは負のシルエットスコアを示し、効果的なクラスタリングができていないことがわかりました。

t-SNE可視化：クラスタリングの様子を視覚的に確認
t-SNEという次元削減手法を用いることで、高次元のDelta Activationsを2次元空間に可視化することができます。論文中のt-SNEプロットを見ると、Delta Activationsがドメインごとに綺麗にクラスタを形成している様子がわかります。

加法性：複数の特性を組み合わせた表現

現実のLLMは、複数のタスクやドメインにわたってファインチューンされることが少なくありません。Delta Activationsの重要な特性として、加法性が挙げられます。これは、複数のデータセットでファインチューンされたモデルのDelta Activationsが、個々のデータセットでファインチューンされたモデルのDelta Activationsのベクトル和と近似できるという性質です。

例えば、MATHとCODINGのデータセットで同時にファインチューンされたモデルのDelta Activationsは、MATHのみでファインチューンされたモデルのDelta Activationsと、CODINGのみでファインチューンされたモデルのDelta Activationsを足し合わせたものと近い値になります。

この加法性により、Delta Activationsは、複数の特性を持つモデルの動作を適切に表現することができます。これは、複雑なタスクに対応できる汎用的なLLMを開発する上で非常に重要な特性と言えるでしょう。

なぜ加法性が重要なのか？
加法性を持つことで、Delta Activationsは、個々のタスクに関する知識を組み合わせるように、モデルの表現を合成できます。これにより、異なるデータセットで学習されたモデルの知識を統合したり、新しいタスクに適応させたりすることが容易になります。

実験では、10個のドメインペアに対して、混合データセットで学習したモデルと、個々のデータセットで学習したモデルのDelta Activationsを比較しました。その結果、ベクトル和が混合モデルの埋め込みをより良く近似することが示され、Delta Activationsの加法性が確認されました。

これらの実験結果から、Delta ActivationsがLLMの特性を効果的に捉え、再利用を促進するための強力なツールであることがわかります。次のセクションでは、Delta Activationsの具体的な応用例について見ていきましょう。

Delta Activationsの応用例：モデル選択、タスク埋め込み、モデルマージ

Delta Activationsの真価は、その応用範囲の広さにあります。ここでは、論文で紹介されている主要な応用例である、モデル選択、タスク埋め込み、モデルマージについて、具体的なシナリオを交えながら解説します。

モデル選択：最適なモデルを効率的に見つけ出す

LLMの活用が進むにつれて、特定のタスクに対してどのモデルが最も適しているかを判断することが重要になっています。しかし、モデルの数が増えれば増えるほど、一つ一つ試していくのは非効率的です。Delta Activationsは、この課題を解決します。

Delta Activationsを用いることで、モデルをベクトル空間に埋め込むことができます。このベクトル空間上で、タスクのベクトル（タスク埋め込みについては後述）とモデルのベクトルとの距離を計算することで、タスクに最適なモデルを効率的に選択できるのです。

具体例：論文中では、Big-Bench Hard (BBH)タスクにおいて、Delta Activationsの類似性に基づいてLoRAモデルを選択することで、ランダムにモデルを選択するよりも性能が向上することが示されています。これは、Delta Activationsがモデルの特性を捉え、タスクとの関連性を判断する上で有効であることを示唆しています。

タスク埋め込み：タスクの特性をベクトルとして表現する

タスク埋め込みは、タスクそのものをベクトルとして表現する技術です。Delta Activationsを用いることで、few-shotのタスク埋め込みが可能になります。つまり、少数のサンプルデータを用いてタスクを学習させたモデルのDelta Activationsを計算することで、そのタスクの特性をベクトルとして表現できるのです。

なぜタスク埋め込みが重要なのか？タスク埋め込みを用いることで、タスク間の類似度を計算したり、特定のタスクに最適なモデルを検索したりすることが可能になります。これは、モデルの再利用を促進し、新たなタスクへの適応を効率化する上で非常に重要な技術です。

具体例：論文中では、few-shot学習させたモデルのDelta Activationsを用いることで、タスクのドメインを特定できることが示されています。これは、Delta Activationsがタスクの特性を捉え、タスク間の類似性を判断する上で有効であることを示唆しています。

モデルマージ：複数のモデルの知識を統合する

モデルマージは、複数のモデルの知識を統合し、より高性能なモデルを生成する技術です。Delta Activationsは、モデルマージ戦略を改善するために活用できます。

Delta Activationsがどのように役立つのか？ Delta Activationsを用いることで、モデル間の関係性や知識の違いを把握することができます。この情報を基に、どのモデルをマージすべきか、どのようにマージすべきかを判断することで、より効果的なモデルマージが可能になります。

例えば、互いに補完的な知識を持つモデル同士をマージしたり、特定のタスクに特化したモデルを、汎用的な知識を持つモデルに統合したりすることで、より汎用性の高い高性能なモデルを生成することができます。

注意： 論文中では、Delta Activationsを用いて類似モデルを選択した場合、必ずしもモデルマージの性能が向上するとは限らないことが示唆されています。これは、類似モデル同士が干渉し合い、性能を阻害する可能性があるためです。Delta Activationsは、あくまでモデル間の関係性を理解するためのツールであり、モデルマージ戦略は慎重に検討する必要があります。

このように、Delta Activationsは、モデル選択、タスク埋め込み、モデルマージなど、様々な応用が可能な汎用性の高い技術です。これらの応用例を組み合わせることで、LLMの再利用をさらに加速し、その可能性を最大限に引き出すことができるでしょう。

Delta-Xファミリー：多様なモデル表現への拡張

Delta Activationsの真価は、その拡張性の高さにもあります。単にアクティベーションの変化を捉えるだけでなく、モデル内部の様々な表現を捉え、比較するための基盤となるのです。この拡張された枠組みは、Delta-Xファミリーと呼ばれ、LLMの理解を深めるための新たな可能性を切り開いています。

Delta-Xとは？アクティベーション以外の表現も捉える

Delta Activationsの基本的な考え方は、ベースモデルとファインチューンモデルの差分に着目することです。この「差分」を計算する対象は、アクティベーションに限りません。Delta-Xファミリーでは、例えば以下のような表現も差分の対象として扱うことができます。

Delta Logits: モデルが出力する各トークンの確率（ロジット）の変化を捉えます。これにより、モデルがどのような単語を選択しやすくなったのか、あるいは選択しにくくなったのかを分析できます。
Delta Weighted Activations: アクティベーションに重みを加えた変化を捉えます。モデルのどの部分がより重要になったのかを理解するのに役立ちます。
Delta Meaning: モデルが生成するテキストの意味表現の変化を捉えます。これにより、モデルがより抽象的なレベルでどのように変化したのかを分析できます。
論文内では、Inverse Perplexity Scores（PPLの逆数）の変化を捉えることで、意味表現の変化を近似しています。

クロスアーキテクチャなモデル比較：Delta Meaningの活用

Delta-Xファミリーの特に興味深い応用例は、異なるアーキテクチャを持つモデル同士の比較です。通常、モデルアーキテクチャが異なると、アクティベーションの次元などが異なるため、直接比較は困難です。しかし、Delta Meaningのように、モデルアーキテクチャに依存しない表現を用いることで、異なるモデルを共通の土俵で比較することが可能になります。

例えば、論文中では、LLAMA-3.1-8BとLLAMA-3.2-1Bという異なるサイズのモデル間で、Delta Meaningを用いて比較が行われました。その結果、異なるモデル間でも、ファインチューンの種類（ドメイン）ごとに適切にクラスタリングできることが示されています。これは、Delta-Xファミリーが、単一のアーキテクチャに縛られない、汎用的なモデル表現を可能にすることを示唆しています。

まとめ：Delta-Xでモデル比較の幅を広げよう

Delta-Xファミリーは、Delta Activationsの枠組みを拡張し、モデルの多様な側面を捉えることを可能にします。特に、Delta Meaningを用いることで、これまで困難だったクロスアーキテクチャなモデル比較も実現できます。Delta-Xファミリーを活用することで、LLMの理解を深め、より効果的なモデルの再利用につなげることができるでしょう。

まとめ：Delta ActivationsでLLMの再利用を加速しよう

本記事では、ファインチューンされたLLMの再利用を劇的に効率化するDelta Activationsについて、その仕組みから応用例までを徹底的に解説しました。Delta Activationsは、LLMの内部アクティベーションの変化を捉え、モデルの特性をベクトルとして表現することで、これまで困難だったモデルの比較・分類を可能にします。

Delta Activationsを活用するための3つのステップ

Delta Activationsの理解：まずは本記事で解説したDelta Activationsの基本的な概念と計算方法を理解しましょう。
Delta Activationsの計算：論文で公開されているコード (https://github.com/OscarXZQ/delta_activations) を参考に、お手持ちのファインチューンモデルのDelta Activationsを計算してみましょう。
Delta Activationsの活用：モデル選択、タスク埋め込み、モデルマージなど、本記事で紹介した応用例を参考に、Delta Activationsを様々なLLM活用シーンで試してみましょう。

Delta Activationsは、LLMの再利用を促進し、AI開発の加速に貢献する強力なツールです。ぜひ本記事を参考に、Delta Activationsを活用して、LLMの可能性を最大限に引き出してください。そして、より効率的で持続可能なAI開発を実現しましょう！

Delta Activationsは、LLMの再利用を加速する鍵となる技術です。積極的に活用し、LLMの可能性を広げましょう。