NumPy einsum：初心者向けチュートリアルと実践的な活用事例

NumPyのeinsum関数は、アインシュタインの縮約記法に基づいて、多次元配列（テンソル）に対する汎用的な演算を効率的に実行するための強力なツールです。初見ではその簡潔な記法に戸惑うかもしれませんが、einsumをマスターすることで、様々なNumPyの操作をより簡潔かつ高速に記述できるようになります。

この記事では、einsumの基本的な概念から始まり、実践的な活用事例を通して、その魅力を深く掘り下げていきます。

1. アインシュタインの縮約記法とは？

アインシュタインの縮約記法は、物理学におけるテンソル演算を簡潔に表現するために開発された記法です。NumPyのeinsum関数は、この記法をNumPy配列（テンソル）演算に適用します。

1.1 基本ルール

添字: 配列の次元（軸）を表すアルファベット（i, j, k, …）を使用します。
縮約: 同じ添字が入力配列に2回以上現れる場合、その添字に対応する軸に沿って和を取ります。これが「縮約」と呼ばれる操作です。
自由添字: 出力配列の次元を表す添字は、入力配列に1回だけ現れる添字です。
明示的な総和: ->を使って出力の添字を指定できます。指定しない場合は、すべての自由添字が出力に含まれます。

例:

ベクトルの内積: a[i] * b[i] → "i,i->" または "i,i"
- aとbという2つのベクトルがあり、それぞれに添字iが付いています。
- iが2回現れているため、a[i] * b[i]の結果をiについて総和を取ります。
- ->の後に何も指定していないため、出力はスカラ値となります。
行列の転置: A[i,j] → "ij->ji"
- Aという行列があり、添字iとjが付いています。
- ijをjiに変換することで、行と列を入れ替えています。
行列の積: A[i,k] * B[k,j] → "ik,kj->ij"
- AとBという2つの行列があり、それぞれに添字ikとkjが付いています。
- kが2回現れているため、kについて総和を取ります。
- 出力はijなので、iが行、jが列となる行列になります。

2. NumPy einsum の基本的な使い方

NumPyのeinsum関数は、アインシュタインの縮約記法に基づいて配列演算を実行します。

“`python
import numpy as np

ベクトルの内積

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
inner_product = np.einsum(“i,i->”, a, b)
print(f”ベクトルの内積: {inner_product}”) # 出力: ベクトルの内積: 32

行列の転置

A = np.array([[1, 2], [3, 4]])
A_transpose = np.einsum(“ij->ji”, A)
print(f”行列の転置:\n{A_transpose}”)

出力:

行列の転置:

[[1 3]

[2 4]]

行列の積

B = np.array([[5, 6], [7, 8]])
C = np.einsum(“ik,kj->ij”, A, B)
print(f”行列の積:\n{C}”)

出力:

行列の積:

[[19 22]

[43 50]]

“`

2.1 引数の説明

第1引数 (string): アインシュタインの縮約記法を表す文字列。
第2引数以降 (array_like): 演算対象のNumPy配列。
オプション引数: out (出力配列を指定), dtype (データ型を指定), order (メモリレイアウトを指定), casting (キャスト規則を指定), optimize (最適化方法を指定)などがあります。optimizeは、大規模な配列演算においてパフォーマンスを向上させるために重要です。

3. einsum の活用事例

einsumは、様々なNumPyの操作を簡潔に記述できる汎用的な関数です。以下に、代表的な活用事例を示します。

3.1 基本的な演算

ベクトルの内積: "i,i->" または "i,i"
ベクトルの外積: "i,j->ij"
行列の転置: "ij->ji"
行列の積: "ik,kj->ij"
ベクトルの要素ごとの積 (アダマール積): "i,i->i"
行列の要素ごとの積 (アダマール積): "ij,ij->ij"
テンソルのトレース: "ii->" (2階テンソル), "iii->" (3階テンソル)
テンソルの対角成分: "ii->i" (2階テンソル), "iii->ij" (3階テンソル)

3.2 より高度な演算

テンソルの縮約: 複数の軸に沿って総和を取る操作。例えば、3階テンソルの特定の軸を縮約して2階テンソルを得る場合などに使用します。
ブロードキャスト: einsumはNumPyのブロードキャストの仕組みを利用できます。これにより、次元数の異なる配列同士の演算を簡潔に記述できます。
テンソル積: 複数のテンソルを掛け合わせる操作。NumPyのtensordot関数と同様のことができます。
バッチ処理: 複数のデータセットに対して同じ演算をまとめて行う場合に、einsumを活用できます。
カーネル法: 機械学習におけるカーネル法の実装にeinsumを活用できます。
画像処理: 画像処理における様々なフィルタリング処理や変換処理にeinsumを活用できます。

3.3 具体的な例:

バッチ行列積: 複数の行列のペアに対して、それぞれ行列積を計算する場合。

python A = np.random.rand(3, 2, 3) # (バッチサイズ, 行数, 列数) B = np.random.rand(3, 3, 4) # (バッチサイズ, 行数, 列数) C = np.einsum("bij,bjk->bik", A, B) # (バッチサイズ, 行数, 列数) print(C.shape) # 出力: (3, 2, 4)

この例では、AとBはそれぞれ3つの行列を含んだ配列です。einsumの記法"bij,bjk->bik"によって、バッチサイズbごとに、Aのi行j列成分とBのj行k列成分を掛け合わせた結果を、Cのi行k列成分として格納します。
テンソルの軸の入れ替えと縮約: 4階テンソルの軸を入れ替え、特定の軸に沿って縮約する場合。

python T = np.random.rand(2, 3, 4, 5) result = np.einsum("ijkl->lk", T) # i,j軸が縮約される print(result.shape) # 出力: (4, 5)

この例では、4階テンソルTのi軸とj軸が縮約され、l軸とk軸が残った2階テンソルが出力されます。

4. einsum の最適化

einsumには、計算の最適化を行うためのoptimizeオプションがあります。大規模な配列演算においては、このオプションを使用することでパフォーマンスを大幅に向上させることができます。

optimizeオプションには、以下の値を指定できます。

False: 最適化を行いません (デフォルト)。
True: NumPyが自動的に最適な計算順序を選択します。
‘greedy’: 貪欲法による最適化を行います。
‘optimal’: 動的計画法による最適化を行います (計算コストが高い)。
パスのリスト: ユーザーが明示的に計算順序を指定します。

“`python

例: optimize=True を使用

A = np.random.rand(100, 200)
B = np.random.rand(200, 300)
C = np.random.rand(300, 400)

最適化なし

result_no_opt = np.einsum(“ij,jk,kl->il”, A, B, C)

最適化あり (NumPyが自動的に最適な計算順序を選択)

result_opt = np.einsum(“ij,jk,kl->il”, A, B, C, optimize=True)

最適化のパスを明示的に指定

path = [(‘ij,jk->ik’, A, B), (‘ik,kl->il’, , C)] # ““は中間結果を表す
result_path = np.einsum(“ij,jk,kl->il”, A, B, C, optimize=path)

パフォーマンス比較 (時間計測)

import time

start_time = time.time()
np.einsum(“ij,jk,kl->il”, A, B, C)
end_time = time.time()
print(f”最適化なし: {end_time – start_time:.4f} 秒”)

start_time = time.time()
np.einsum(“ij,jk,kl->il”, A, B, C, optimize=True)
end_time = time.time()
print(f”最適化あり: {end_time – start_time:.4f} 秒”)
“`

一般的には、optimize=Trueを指定するだけで十分なパフォーマンス向上が期待できます。より高度な最適化が必要な場合は、'greedy'または'optimal'を試すか、パスのリストを明示的に指定することを検討してください。

5. einsum を使うメリット

簡潔な記述: 複雑な配列演算を、アインシュタインの縮約記法を用いて簡潔に記述できます。
高い可読性: 数式とほぼ同じ形式で記述できるため、コードの意図が伝わりやすく、可読性が向上します。
高いパフォーマンス: optimizeオプションを使用することで、大規模な配列演算を効率的に実行できます。
汎用性: 様々なNumPyの操作をeinsumで統一的に記述できます。
NumPyとの親和性: NumPyのブロードキャストの仕組みを利用できるため、柔軟な配列演算が可能です。

6. einsum を学ぶ上での注意点

アインシュタインの縮約記法の理解: einsumを使いこなすためには、アインシュタインの縮約記法の理解が不可欠です。
添字の解釈: 添字がどの軸を表しているのかを常に意識することが重要です。
optimizeオプションの活用: 大規模な配列演算では、optimizeオプションを積極的に活用しましょう。
エラーメッセージの解読: einsumのエラーメッセージは、添字の不整合など、記法に関する問題であることが多いです。エラーメッセージを丁寧に読み解くことで、問題を解決することができます。
段階的な学習: 最初は基本的な演算から始め、徐々に複雑な演算に挑戦していくと、einsumの理解が深まります。

7. まとめ

NumPyのeinsum関数は、アインシュタインの縮約記法に基づいて、多次元配列に対する汎用的な演算を効率的に実行するための強力なツールです。初めは難しく感じるかもしれませんが、基本的な概念を理解し、様々な活用事例を試すことで、einsumの威力を実感できるはずです。einsumをマスターすることで、NumPyのコードをより簡潔かつ高速に記述できるようになり、データ分析や機械学習などの分野で、より高度な処理を行うことができるようになります。

この記事が、einsumを学ぶための一助となれば幸いです。積極的にeinsumを活用し、NumPyのスキルを向上させてください。

8. 付録：更なる学習のために

NumPyドキュメント: NumPyの公式ドキュメントは、einsum関数の詳細な仕様やオプションについて学ぶための最も信頼できる情報源です。(https://numpy.org/doc/stable/reference/generated/numpy.einsum.html)
オンラインチュートリアル: 様々なオンラインチュートリアルやブログ記事で、einsumの基本的な使い方から応用例まで学ぶことができます。
書籍: NumPyやPythonに関する書籍の中には、einsumについて解説しているものもあります。
実践的なコーディング: 実際にeinsumを使って様々な問題を解いてみることで、理解が深まります。
コミュニティ: NumPyのコミュニティに参加し、質問をしたり、他のユーザーのコードを読んだりすることで、einsumに関する知識を深めることができます。

9. 終わりに

NumPy einsumは強力なツールであり、習得には時間と努力が必要ですが、その恩恵は計り知れません。この記事が、einsumの世界への第一歩となり、あなたのデータ分析の旅をより豊かにすることを願っています。