初心者向け Redis Vector Search ガイド:AI時代の高速類似検索
1. はじめに:AIとベクター検索の時代の到来
現代は「AIの時代」と称され、私たちの働き方、学び方、そして情報との関わり方を根底から変えつつあります。特に、大規模言語モデル(LLM)や画像生成AIといった技術は目覚ましい発展を遂げ、私たちの創造性や生産性を飛躍的に向上させています。
これらのAI技術の多くは、「類似性」という概念に深く依存しています。例えば、チャットボットは過去の会話データからユーザーの質問に「類似した」応答を探し出します。画像検索では、入力された画像に「類似した」画像をデータベースから見つけ出します。推薦システムは、ユーザーの過去の行動や好みに「類似した」アイテムを提案します。
従来のキーワードマッチングやリレーショナルデータベースの検索だけでは、このような「意味的な類似性」を捉えるのは困難です。ここで登場するのが「ベクター検索(Vector Search)」です。
ベクター検索は、テキスト、画像、音声などのデータを、数値の羅列である「ベクター(Vector)」、あるいは「埋め込み(Embedding)」と呼ばれる高次元空間上の点として表現し、そのベクター間の「距離」や「類似度」に基づいてデータを検索する技術です。意味的に類似したデータは、ベクター空間上でも近くに配置されるため、ベクター間の距離を計算することで、意味的な類似性を高速に検出できるのです。
このベクター検索を効率的かつスケーラブルに実行するためには、専用のデータベースやインデックス構造が必要です。そして、ここで注目されるのが、その圧倒的な速度と多様なデータ構造で知られるインメモリデータストア、Redisです。
本記事では、Redisのパワフルな拡張機能であるRedis Stack(RediSearchモジュールを含む)を活用したベクター検索について、全くの初心者の方でも理解できるように、基礎から実践的な利用方法までを詳細に解説します。
なぜベクター検索が重要なのか、ベクターとは何か、そしてRedisでどのようにベクター検索を実現するのかを学び、実際にPythonを使ってデータをインデックス化し、類似検索を実行する手順を追います。
このガイドを通じて、あなたがAIアプリケーション開発におけるベクター検索の可能性を理解し、Redisを使った実装の第一歩を踏み出す手助けとなることを願っています。さあ、Redis Vector Searchの世界へ飛び込みましょう。
2. ベクター検索の基礎:埋め込みと高次元空間
Redisでの実装に入る前に、まずはベクター検索の基本的な考え方をしっかりと押さえておきましょう。
2.1. 埋め込み(Embedding)とは何か?
ベクター検索の中心となる概念が「埋め込み(Embedding)」です。埋め込みとは、テキスト、画像、音声、動画、ユーザー行動などの様々な種類のデータを、固定長または可変長の数値のベクター(数値のリストや配列)に変換したものです。この変換は、通常、深層学習モデル(ニューラルネットワーク)によって行われます。
なぜデータは数値のベクターに変換されるのでしょうか?それは、コンピューターがデータを効率的に処理し、特に「意味」や「関係性」を数学的に扱えるようにするためです。
例えば、テキストの埋め込みを考えてみましょう。「犬」と「猫」という単語は、意味的に近い関係にあります。埋め込みモデルを使ってこれらの単語をベクターに変換すると、ベクター空間上で「犬」のベクターと「猫」のベクターは比較的近くに配置されます。一方、「犬」と「飛行機」のような関連性の薄い単語のベクターは、遠くに配置される傾向があります。
さらに興味深いのは、単語間の「関係性」もベクター空間上で捉えられることです。有名な例として、「King – Man + Woman ≒ Queen」というものがあります。「King」のベクターから「Man」のベクターを引き、「Woman」のベクターを足すと、「Queen」のベクターに近いベクターが得られるという現象です。これは、単語間の性別や王族としての関係性が、ベクターの差や和として表現されていることを示唆しています。
このように、埋め込みは単なる数値の羅列ではなく、元のデータの「意味」や「文脈」、「特徴」を高次元空間上の位置として捉えたものです。
2.2. 高次元空間と距離・類似度
埋め込みベクターは、数百次元あるいは数千次元といった、非常に高い次元を持つ数値空間上の点として存在します。例えば、OpenAIのtext-embedding-ada-002
モデルは1536次元のベクターを出力します。私たちが普段経験する3次元空間をはるかに超える空間での話になります。
この高次元空間上で、2つのデータポイントがどれだけ「類似しているか」を測るのが、ベクター間の「距離(Distance)」または「類似度(Similarity)」です。距離が短いほど類似度は高く、距離が長いほど類似度は低いと解釈できます。
ベクター検索でよく使われる距離計算方法(距離メトリック)にはいくつか種類があります。
- ユークリッド距離 (Euclidean Distance, L2 Distance): 私たちが最も直感的に理解しやすい距離です。2点間の直線距離を計算します。
- $d(\mathbf{v}1, \mathbf{v}_2) = \sqrt{\sum{i=1}^n (v_{1i} – v_{2i})^2}$
- 数値が大きいほど距離が離れている(類似度が低い)ことを意味します。
- コサイン類似度 (Cosine Similarity): 2つのベクターが指す方向の類似度を測ります。ベクターの大きさには依存しません。文書や単語の意味的な類似度を測るのに広く使われます。
- $similarity(\mathbf{v}_1, \mathbf{v}_2) = \frac{\mathbf{v}_1 \cdot \mathbf{v}_2}{||\mathbf{v}_1|| \cdot ||\mathbf{v}_2||}$
- この値は-1から1の間の値をとります。1に近いほど類似度が高く、-1に近いほど類似度が低い(完全に反対の方向を向いている)ことを意味します。
- ベクター検索では、距離として扱うために、しばしば$1 – similarity$や、$arccos(similarity)$などが用いられます。Redisでは$1 – similarity$をL2ノルムが1に正規化されたベクターに適用したものを距離として扱うことがあります(
COSINE
メトリック)。
- 内積 (Inner Product): 2つのベクターの成分ごとの積の合計です。ベクターの大きさと方向の両方を考慮します。
- $similarity(\mathbf{v}1, \mathbf{v}_2) = \sum{i=1}^n v_{1i} v_{2i}$
- 値が大きいほど類似度が高いと解釈できます。コサイン類似度と似ていますが、ベクターの大きさが結果に影響します。データセットの全てのベクターが同じプロセスで生成され、大きさが比較可能な場合に有効です。Redisでは
INNER_PRODUCT
メトリックとして、この値を距離として扱います(大きいほど距離が近い = 類似度が高い)。
どの距離メトリックを選択するかは、使用する埋め込みモデルやデータの種類によって異なります。一般的に、テキストの意味的な類似度にはコサイン類似度がよく用いられます。
2.3. ベクター検索のプロセス
ベクター検索は、主に以下のステップで実行されます。
- データの準備: 検索対象となる元のデータ(テキスト、画像など)を用意します。
- 埋め込みの生成: 用意した各データを、訓練済みの埋め込みモデルを使ってベクターに変換します。このステップを「埋め込み化(Embedding)」と呼びます。
- インデックスの構築: 生成したベクターを、後で高速に検索できるよう、専用のインデックス構造を持つデータベースに格納します。このプロセスを「インデックス化(Indexing)」と呼びます。元のデータや、検索時のフィルタリングに使うメタデータ(例: データのカテゴリ、作成日時など)も一緒に格納することが一般的です。
- 検索クエリの準備: ユーザーからの検索要求(例: 検索したいテキスト、画像)を、同じ埋め込みモデルを使ってベクターに変換します。これを「クエリベクター」と呼びます。
- ベクター検索の実行: 生成したクエリベクターを使い、インデックスに対して「クエリベクターに最も近い(最も類似度の高い)$k$個のベクターを見つけ出してほしい」という検索クエリを発行します。ここで距離メトリックが使われます。
- 結果の取得と提示: 検索結果として得られた、$k$個のベクターに対応する元のデータ(またはその識別子)を取得し、ユーザーに提示します。多くの場合、類似度の高い順に並べ替えられます。
このように、ベクター検索はデータを意味的に捉え、高次元空間上での位置関係に基づいて効率的に検索を行うための強力な手法です。
3. なぜRedisでVector Searchなのか?
ベクター検索を実現するためのデータベースやライブラリは数多く存在します(例: Milvus, Weaviate, Pinecone, Faiss, Annoyなど)。その中で、なぜRedisが有力な選択肢となるのでしょうか?
Redisは、元々はキー-バリュー型のインメモリデータストアとして開発されました。しかし、その柔軟なアーキテクチャとモジュールシステムにより、近年では様々な高度な機能を拡張できるようになっています。その中でも、特にベクター検索において重要なのが「RediSearch」モジュールです。
3.1. Redis StackとRediSearchモジュール
Redis Stackは、Redis本体に複数のオープンソースモジュールを統合し、開発者がモダンなアプリケーションを構築するために必要な様々なデータ構造や機能をすぐに利用できるようにしたディストリビューションです。RediSearchは、Redis Stackに含まれる主要なモジュールの一つで、全文検索、セカンダリインデックス、そして今回の主役であるベクター検索機能を提供します。
RediSearchモジュールを使うことで、Redisの既存のデータ構造(例えばHashやJSON)に格納されたデータに対して、全文検索インデックスやベクターインデックスを作成し、高度なクエリを実行できるようになります。
3.2. Redisでベクター検索を行うメリット
Redisでベクター検索を行うことには、いくつかの大きなメリットがあります。
- 圧倒的な速度: Redisはインメモリデータストアであり、その最大の強みは低遅延で高速なデータアクセスです。ベクター検索においても、インデックスの構築やクエリ実行が非常に高速に行えます。特にリアルタイム性が求められるアプリケーション(例: オンライン推薦、リアルタイム検出)において、この速度は大きなアドバンテージとなります。
- 既存のデータ基盤との統合: すでにアプリケーションでRedisをキャッシュやセッションストア、メッセージキューなどとして利用している場合、新たに別のベクターデータベースを導入するのではなく、既存のRedisインフラ上でベクター検索機能を動かすことができます。これにより、インフラ管理がシンプルになり、運用コストを削減できます。
- 統一されたデータモデル: 検索対象の元のデータ(テキスト、JSONドキュメントなど)、そのメタデータ、そして対応するベクターを全てRedis上で一元管理できます。これにより、データ管理が容易になり、データの一貫性を保ちやすくなります。
- ハイブリッド検索の容易さ: RediSearchはベクター検索だけでなく、全文検索や数値・タグによるフィルタリングもサポートしています。これにより、「特定のカテゴリに属する、かつクエリベクターに類似したアイテム」のように、従来の検索条件とベクター検索を組み合わせた「ハイブリッド検索」を容易に実現できます。これは、検索結果の精度を向上させる上で非常に強力な機能です。
- 多様なデータ構造のサポート: RediSearchは、RedisのHashやJSONといった異なる形式で格納されたデータに対してインデックスを作成できます。これにより、データの性質に合わせて最適な格納形式を選択できます。
- スケーラビリティ: Redisはクラスター構成によるスケーリングが可能です。データ量が増加しても、Redis Enterpriseのようなエンタープライズ向けソリューションを利用することで、パフォーマンスを維持しながらスケールさせることができます。
- 開発の容易さ: 主要なプログラミング言語向けのRedisクライアントライブラリは、RediSearchの機能もサポートしているものが多く、比較的簡単にアプリケーションに組み込むことができます。
これらのメリットから、Redis Vector Searchは、特に以下のようなユースケースにおいて非常に有効な選択肢となります。
- リアルタイム推薦システム
- セマンティック検索(意味検索)
- 異常検知
- コンテンツの類似性検出(重複排除など)
- チャットボットやQ&Aシステムにおける関連情報検索
もちろん、Redisが万能というわけではありません。非常に巨大なデータセット(数億、数十億のベクター)を扱う場合や、特定の高度なベクターインデックスアルゴリズムが必要な場合は、専用のベクターデータベースの方が適しているケースもあります。しかし、多くの一般的なユースケースにおいて、Redis Vector Searchはその速度、使いやすさ、既存システムとの統合性において非常に魅力的な選択肢となります。
4. Redis Vector Searchを始める準備
Redis Vector Searchを実際に試してみるために、環境を準備しましょう。
4.1. 前提知識
- Redisの基本的な概念: キー、値、データ型(String, Hash, List, Set, Sorted Setなど)の基本的な知識があると、よりスムーズに理解できます。
- Pythonの基礎: 本記事では、RedisクライアントとしてPythonを使用します。基本的なPythonプログラミングの知識が必要です。
- コマンドライン操作: ターミナルを使った基本的な操作が必要です。
4.2. Redis Stackのセットアップ
Redis Vector Search機能は、Redis Stackに含まれるRediSearchモジュールによって提供されます。Redis Stackをセットアップする最も簡単な方法はDockerを利用することです。
Dockerを使ったセットアップ:
Dockerがインストールされている環境であれば、以下のコマンドでRedis Stackコンテナを起動できます。
bash
docker run -d --name redis-stack -p 6379:6379 redis/redis-stack:latest
このコマンドは:
* docker run
: 新しいコンテナを起動します。
* -d
: デタッチモード(バックグラウンド実行)でコンテナを起動します。
* --name redis-stack
: コンテナに redis-stack
という名前をつけます。
* -p 6379:6379
: ホストマシン(あなたのPC)のポート6379を、コンテナ内のポート6379にマッピングします。これにより、ホストマシンから localhost:6379
でRedisに接続できるようになります。
* redis/redis-stack:latest
: 使用するDockerイメージの名前とタグです。最新のRedis Stackイメージをダウンロードして使用します。
コンテナが正常に起動したか確認するには、以下のコマンドを使います。
bash
docker ps
redis-stack
という名前のコンテナが表示されていれば成功です。
これで、localhost:6379
でRedis Stackサーバーに接続できるようになりました。RediSearchモジュールはデフォルトで有効になっています。
4.3. 必要なPythonライブラリのインストール
PythonからRedisに接続し、ベクター検索を行うために、以下のライブラリをインストールします。
redis
: Redisクライアントライブラリ。RediSearch機能もサポートしています。sentence-transformers
: テキストデータをベクターに変換するためのオープンソースライブラリ。手軽に埋め込みモデルを利用できます。numpy
: 数値計算ライブラリ。ベクターデータを扱うのに便利です。
以下のコマンドでインストールします。
bash
pip install redis sentence-transformers numpy
4.4. 埋め込みモデルの選択
ベクター検索では、検索対象のデータをベクターに変換する「埋め込みモデル」が必須です。どのモデルを選択するかは、データの種類や目的に大きく依存します。
- テキストデータ:
- Sentence Transformers:
all-MiniLM-L6-v2
,paraphrase-multilingual-mpnet-base-v2
など、様々な事前学習済みモデルが利用でき、導入が容易です。比較的小さなモデルでも性能が良いものがあります。 - OpenAI API:
text-embedding-ada-002
など。APIを呼び出すだけで高精度な埋め込みが得られますが、利用料がかかります。 - Hugging Face Transformers: より多様なモデルから選択できます。
- Sentence Transformers:
- 画像データ:
- CLIP: 画像とテキストの両方を同じ空間に埋め込むことができるため、テキストによる画像検索などに利用されます。
- Vision Transformers (ViT): 画像分類などで使われるモデルの特徴量抽出層を利用して埋め込みを生成できます。
今回は初心者向けガイドとして、ローカルで手軽に利用できるsentence-transformers
ライブラリの中から、比較的小さくて高速なモデル(例: all-MiniLM-L6-v2
)を使用することにします。
これで、Redis Vector Searchを実際に試すための準備が整いました。
5. コアコンセプトの理解:インデックスとスキーマ
Redisでベクター検索を実行するには、まず「インデックス」を作成する必要があります。インデックスは、Redisに格納されたデータの中から効率的に検索を行うための仕組みです。RediSearchは、このインデックス構造を管理し、高度な検索クエリ(全文検索、ベクター検索、フィルタリングなど)に応答します。
5.1. RediSearchインデックス (FT.CREATE
)
インデックスはFT.CREATE
コマンドを使って作成します。このコマンドには、インデックスの名前、インデックスの対象とするキーのパターン、そして最も重要な「スキーマ(Schema)」を定義します。
インデックスの対象は、RedisのKey-Valueペアにおける「Value」の部分です。RediSearchはValueがHASH
型またはJSON
型であることを想定しています。これらの型を使うことで、データ構造(フィールド)を定義し、そのフィールドに対してインデックスを作成できます。ベクター検索を行う場合、ベクターデータもこのValueの中に格納する必要があります。
FT.CREATE
コマンドの基本的な構文は以下のようになります。
redis
FT.CREATE index_name
[ON HASH | JSON]
[PREFIX count prefix]
SCHEMA field_name field_type [options] ... VECTOR vector_field_name vector_field_type algorithm {parameter value ...} [options]
index_name
: 作成するインデックスの名前。任意に設定できます。ON HASH | JSON
: インデックスの対象となるValueの型を指定します。HASH
またはJSON
を選びます。PREFIX count prefix
: インデックスの対象とするキー名のプレフィックスを指定します。例えばdoc:
というプレフィックスを指定すると、doc:1
,doc:abc
といったキーを持つデータがインデックス化の対象となります。count
はプレフィックスの数を指定します。SCHEMA
: これからインデックス化するフィールドとその型、オプションを定義します。field_name
: インデックス化するフィールドの名前。field_type
: フィールドのデータ型。RediSearchでは以下の型をサポートしています。TEXT
: 全文検索用のフィールド。TAG
: カテゴリやタグなど、正確なマッチングが必要なフィールド。NUMERIC
: 数値のフィールド(範囲検索など)。GEO
: 位置情報(緯度・経度)のフィールド(地理空間検索)。VECTOR
: これです! ベクターデータを格納するためのフィールド。
[options]
: フィールド固有のオプション(例:WEIGHT
for TEXT,SORTABLE
for NUMERIC/TAGなど)。
VECTOR vector_field_name vector_field_type algorithm {parameter value ...} [options]
: ベクターフィールドを定義するための特別な構文です。vector_field_name
: ベクターデータを格納するフィールドの名前。vector_field_type
: ベクターデータの型。現在はFLOAT32
またはFLOAT64
をサポートしています。埋め込みモデルの出力に合わせて選択します。多くのモデルはFLOAT32を出力します。algorithm
: ベクター検索に使用するインデックスアルゴリズムを指定します。主に以下の2つがあります。FLAT
: brute-force検索。全てのベクターに対してクエリベクターとの距離を計算します。精度は最も高いですが、データ数が増えると検索速度が線形に低下します。データ数が少ない場合や、100%の精度が求められる場合に適しています。HNSW (Hierarchical Navigable Small Worlds)
: 近似最近傍探索(ANN: Approximate Nearest Neighbor)アルゴリズム。グラフ構造を構築し、効率的に最近傍を探索します。データ数が増えても検索速度は対数的にしか増加しないため、スケーラビリティに優れています。ただし、近似検索のため、検索結果は100%正確な最近傍ではない可能性があります。多くの実用的なアプリケーションで採用されます。
{parameter value ...}
: 選択したアルゴリズムに固有のパラメータを指定します。HNSW
の場合、主要なパラメータとして以下があります。M
: グラフ構築時の各ノードからのエッジ数。大きいほど精度は向上しますが、インデックスサイズと構築時間が増加します。ef_construction
: グラフ構築時の探索パラメータ。大きいほど構築に時間がかかりますが、より高品質なグラフ(高い精度)が得られます。ef_runtime
: 検索時の探索パラメータ。大きいほど検索時間は増加しますが、検索精度が向上します。ef_construction
よりも小さいか同程度の値を設定することが多いです。DIM
: ベクターの次元数。埋め込みモデルの出力次元と一致させる必要があります。必須パラメータです。DISTANCE_METRIC
: 距離計算方法。L2
(ユークリッド距離),COSINE
(コサイン類似度),INNER_PRODUCT
(内積) から選択します。必須パラメータです。
[options]
: ベクターフィールド固有のオプション(例:AS name
で別名を指定するなど)。
5.2. ドキュメントとフィールド
RediSearchでは、インデックス化の対象となる各データを「ドキュメント(Document)」と呼びます。各ドキュメントは、複数の「フィールド(Field)」から構成されます。
例えば、商品の情報をインデックス化する場合、1つの商品は1つのドキュメントとなり、そのドキュメントは「商品名(TEXTフィールド)」「価格(NUMERICフィールド)」「カテゴリ(TAGフィールド)」「商品説明の埋め込みベクター(VECTORフィールド)」といったフィールドを持つことができます。
RedisのHASH
型でドキュメントを表現する場合、キー名(例: product:123
)と、そのハッシュに含まれるフィールド名-値ペア(例: name: "Laptop"
, price: 1200.00
, category: "electronics"
, description_vector: <バイト列>
)が対応します。
JSON
型で表現する場合も同様に、キー名(例: product:456
)と、そのJSONドキュメント内のパスと値(例: $.name: "Keyboard"
, $.price: 75.00
, $.category: "electronics"
, $.vectors.description: <バイト列>
)が対応します。JSON型は階層構造を持つデータを扱うのに便利です。
ベクターフィールドに格納するベクターデータは、通常、PythonのNumPy配列などをバイト列(例えばfloat32
のバイト列)に変換してRedisに格納します。RediSearchはインデックス作成時に、そのバイト列をベクターとして認識します。
5.3. 距離メトリックの選択 (再考)
前述の通り、DISTANCE_METRICはL2
, COSINE
, INNER_PRODUCT
から選択します。
L2
: ユークリッド距離。ベクター空間上の絶対的な距離を測ります。ベクターの「大きさ」が意味を持つ場合に適しています。COSINE
: コサイン距離 ($1 – \text{Cosine Similarity}$)。ベクターの方向の類似度を測ります。ベクターの大きさが異なっても方向が近ければ類似とみなします。テキスト埋め込みなど、意味を方向で表現することが多い場合に適しています。RediSearchでCOSINE
メトリックを使用する場合、通常、ベクターは事前にL2正規化(単位ベクター化)されている必要があります。多くの埋め込みモデルは正規化されていないベクターを出力するため、インデックス化する前に明示的に正規化を行う必要があります。INNER_PRODUCT
: 内積。ベクターの大きさと方向の両方を考慮します。ベクターがL2正規化されている場合、内積はコサイン類似度と等しくなります。正規化されていないベクターの場合、内積は大きさと方向の両方を反映するため、ユークリッド距離とは異なる類似度を計算します。例えば、同じ方向を向いていても、長さが長いベクター同士の方が内積は大きくなります。これは、推薦システムでユーザーとアイテムのベクターを用いる場合に、「ユーザーの関心の強さ」と「アイテムの人気度」の両方を考慮するようなシナリオで有効なことがあります。RediSearchでは、内積の値が大きいほど距離が「近い」(類似度が高い)と扱われます。
どのメトリックを選ぶかは、使用する埋め込みモデルの特性や、データの類似性をどのように定義したいかによります。多くのテキスト埋め込みモデルでは、L2正規化してからCOSINE
メトリックを使うか、正規化せずにINNER_PRODUCT
メトリックを使うのが一般的です。事前にモデルのドキュメントを確認するか、いくつかのメトリックで試して最も良い結果が得られるものを選ぶのが良いでしょう。
これで、Redis Vector Searchのインデックスとスキーマに関する基本的な概念を理解しました。次のセクションでは、実際にPythonコードを使って、データのインデックス化と検索を行ってみましょう。
6. 実践: データインデックスと検索 (Python編)
ここでは、簡単なテキストデータを例に、Pythonを使ってRedisにベクターインデックスを作成し、データのインデックス化とベクター検索を実行する手順を詳細に解説します。
6.1. サンプルデータの準備
今回は、いくつか短いテキストのリストをサンプルデータとして使用します。
“`python
検索対象となるサンプルテキストデータ
sample_texts = [
“青い空に白い雲が浮かんでいる。”,
“海辺で遊ぶ子供たちの楽しそうな声が聞こえる。”,
“夕焼けの空がオレンジ色に染まっている。”,
“猫が窓辺でのんびりと日向ぼっこをしている。”,
“犬が公園でボールを追いかけている。”,
“新しい技術について学ぶのは楽しい。”,
“AIは私たちの生活をどのように変えるだろうか?”,
“機械学習のアルゴリズムについて調べている。”,
“今日は天気が良いので散歩に行こう。”,
“雨の日には家で読書するのが好きだ。”
]
“`
これらの各テキストを1つのドキュメントとして扱います。後でこれらのテキストを埋め込み化し、Redisに格納してベクター検索を行います。
6.2. 埋め込みモデルのロードとベクター生成
sentence-transformers
ライブラリを使って、テキストをベクターに変換します。今回はall-MiniLM-L6-v2
モデルを使用します。このモデルは384次元のベクターを出力します。
“`python
from sentence_transformers import SentenceTransformer
import numpy as np
埋め込みモデルのロード
キャッシュされるため、初回のみダウンロードが発生します
model = SentenceTransformer(‘all-MiniLM-L6-v2’)
print(f”埋め込みモデル {model.model_name} をロードしました。”)
サンプルテキストを埋め込み化
NumPy配列として取得します
text_embeddings = model.encode(sample_texts)
ベクターの次元数を確認
embedding_dimension = text_embeddings.shape[1]
print(f”生成されたベクターの次元数: {embedding_dimension}”)
print(f”生成されたベクターの数: {text_embeddings.shape[0]}”)
生成されたベクターの最初の要素の一部を表示 (確認用)
print(“最初のベクターの先頭10要素:”, text_embeddings[0][:10])
“`
実行すると、モデルがダウンロードされ、各テキストに対応するNumPy配列(ベクター)が生成されます。embedding_dimension
が384であることを確認してください。
6.3. Redisへの接続
redis-py
ライブラリを使ってRedis Stackサーバーに接続します。
“`python
import redis
Redisに接続
Dockerで起動した場合、デフォルトではlocalhost:6379で接続可能です
decode_responses=True にすると、Redisから取得したバイト列が自動的に文字列にデコードされます
しかし、ベクターデータはバイト列として扱う必要があるため、ここではFalseのままにしておきます
ベクター以外のフィールドは明示的にデコードまたはJSONとして扱います
r = redis.Redis(host=’localhost’, port=6379, decode_responses=False)
接続確認
try:
r.ping()
print(“Redisに正常に接続できました。”)
except redis.exceptions.ConnectionError as e:
print(f”Redisへの接続に失敗しました: {e}”)
print(“Redis Stackコンテナが起動しているか確認してください。”)
exit() # 接続できなければ処理を終了
“`
接続に成功したら、次のステップに進みます。
6.4. Redisインデックスの定義と作成 (FT.CREATE
)
ここで、RediSearchインデックスを定義します。今回は、テキストデータ(文字列)、元のテキストのベクター、そして各ドキュメントにユニークなIDを持たせるためのフィールドを定義します。RedisのHASH
型を使ってデータを格納することにします。
インデックス名はmy_text_index
とし、キーのプレフィックスはdoc:
とします。
スキーマは以下のフィールドを持ちます。
text
: 元のテキスト。TEXT
型で、全文検索も可能にしておきます(今回のベクター検索では直接使いませんが、ハイブリッド検索のために定義しておくのは良い習慣です)。text_vector
: テキストの埋め込みベクター。VECTOR
型。
ベクターフィールドの定義:
* name
: text_vector
* type
: FLOAT32
(sentence-transformersの出力はfloat32)
* algorithm
: HNSW
(スケーラビリティのため)
* parameters
:
* DIM
: 384
(埋め込みモデルの次元数)
* DISTANCE_METRIC
: COSINE
(意味的な類似度に適しています。ただし、後でベクターを正規化する必要があります)
FT.CREATE
コマンドを構築し、Pythonから実行します。既存のインデックスがあれば削除する処理も入れておくと、スクリプトを繰り返し実行する際に便利です。
“`python
from redis.commands.search.field import TextField, VectorField
from redis.commands.search.indexDefinition import IndexDefinition, IndexType
index_name = “my_text_index”
prefix = “doc:”
vector_field_name = “text_vector” # ベクターフィールドの名前
インデックスのスキーマ定義
schema = (
TextField(“text”, as_name=”text”), # 元のテキストフィールド (全文検索用)
VectorField(
vector_field_name,
“HNSW”, # アルゴリズム
{ # パラメータ
“TYPE”: “FLOAT32”,
“DIM”: embedding_dimension, # 埋め込みモデルの次元数
“DISTANCE_METRIC”: “COSINE” # 距離メトリック
},
as_name=vector_field_name # フィールド名
)
)
インデックス定義 (対象とするキーのプレフィックスとデータ型を指定)
definition = IndexDefinition(prefix=[prefix], index_type=IndexType.HASH)
既存のインデックスを削除 (スクリプトを繰り返し実行する際に便利)
try:
r.ft(index_name).dropindex()
print(f”既存のインデックス ‘{index_name}’ を削除しました。”)
except:
# インデックスが存在しない場合はエラーになるが、ここでは無視する
pass
インデックスを作成
try:
r.ft(index_name).create_index(fields=schema, definition=definition)
print(f”インデックス ‘{index_name}’ を作成しました。”)
except Exception as e:
print(f”インデックス作成に失敗しました: {e}”)
exit()
“`
このコードを実行すると、Redisにmy_text_index
という名前の新しいインデックスが作成されます。
6.5. データのインデックス化 (Redisへの格納)
次に、サンプルテキストとその埋め込みベクターを、定義したスキーマに従ってRedisに格納します。各テキストをユニークなキー(例: doc:0
, doc:1
, …)を持つHASH
として保存します。
重要: sentence-transformers
で生成されたベクターをCOSINEメトリックで検索する場合、通常、ベクターをL2正規化する必要があります。そうしないと、COSINE距離が正しく計算されないか、結果が意図通りにならない可能性があります。model.encode
にはnormalize_embeddings=True
オプションがありますが、今回は手動でNumPyを使って正規化してみましょう。
“`python
import struct # バイト列への変換に使用
pipeline = r.pipeline() # パイプラインを使ってまとめて実行すると高速です
データをRedisに格納
for i, text in enumerate(sample_texts):
doc_id = f”{prefix}{i}” # キー名例: doc:0, doc:1, …
# ベクターを取得
embedding = text_embeddings[i]
# COSINEメトリックを使用する場合、ベクターをL2正規化する (重要!)
embedding_normalized = embedding / np.linalg.norm(embedding)
# ベクターをバイト列に変換 (FLOAT32の場合)
# np.float32型であることを確認
if embedding_normalized.dtype != np.float32:
embedding_normalized = embedding_normalized.astype(np.float32)
vector_bytes = embedding_normalized.tobytes()
# Redis HASHに格納するデータ
# HASHのフィールド名がスキーマで定義したフィールド名と一致する必要がある
data_to_store = {
"text": text, # 元のテキスト (文字列)
vector_field_name: vector_bytes # ベクターデータ (バイト列)
}
# HASHデータとしてRedisにセット
pipeline.hset(doc_id, mapping=data_to_store)
パイプラインを実行して、まとめてデータをRedisに書き込む
pipeline.execute()
print(f”{len(sample_texts)}件のデータをインデックス化のためにRedisに格納しました。”)
“`
これで、サンプルテキストとその正規化されたベクターがRedisに格納され、my_text_index
によってインデックス化されました。
6.6. ベクター検索の実行 (FT.SEARCH
)
いよいよベクター検索を実行します。ユーザーからの検索クエリとなる新しいテキストを用意し、これも同じ埋め込みモデルでベクターに変換します。そして、そのクエリベクターを使ってRedisインデックスを検索します。
FT.SEARCH
コマンドの基本的な構文は以下のようになります。
redis
FT.SEARCH index_name query_string [PARAMS name value ...] RETURN field_name ... [SORTBY field_name [ASC|DESC]] [PAGING offset num] ...
ベクター検索を行う場合、クエリ文字列は特殊な形式になります。近似最近傍探索(kNN)クエリは、通常以下のような形式で表現されます。
redis
* => [KNN k @vector_field_name $query_vector]
*
: インデックス内の全てのドキュメントを対象とすることを示します。KNN k
: 最近傍のドキュメントをk
件見つけることを指定します。k
は取得したい結果の数です。@vector_field_name
: 検索に使用するベクターフィールドの名前を指定します。インデックススキーマで定義した名前です。$query_vector
: 検索に使用するクエリベクターを表すプレースホルダーです。実際のベクターデータはPARAMS
オプションで渡します。
また、検索結果に含めたいフィールドをRETURN
で指定します。ベクター検索の場合、通常は元のテキストフィールドやメタデータフィールド、そして計算された距離(スコア)を返します。距離は、VECTOR_SCORE
というエイリアスを使って取得できます。
FT.SEARCH
コマンドは、クエリベクターをバイト列として受け取る必要があります。PythonからFT.SEARCH
コマンドを実行する場合、redis-py
のft().search()
メソッドを使用します。このメソッドを使うと、クエリベクターをPARAMS
で渡す形式が簡単に記述できます。
検索クエリとして「公園で楽しそうに遊んでいる犬」に類似したテキストを探してみましょう。
“`python
from redis.commands.search.query import Query
検索クエリとなるテキスト
search_query_text = “公園で楽しそうに遊んでいる犬”
検索クエリテキストを埋め込み化し、正規化する (インデックス化時と同じ処理)
search_query_embedding = model.encode(search_query_text)
search_query_embedding_normalized = search_query_embedding / np.linalg.norm(search_query_embedding)
クエリベクターをバイト列に変換
if search_query_embedding_normalized.dtype != np.float32:
search_query_embedding_normalized = search_query_embedding_normalized.astype(np.float32)
query_vector_bytes = search_query_embedding_normalized.tobytes()
取得したい結果の数 (k)
k = 3
RediSearchクエリを構築
ベクター検索の構文: * => [KNN k @vector_field_name $query_vector]
ここでは、クエリオブジェクトの__str__メソッドで構築される文字列クエリとPARAMSを使用
base_query = f’*=>[KNN {k} @{vector_field_name} $query_vector AS vector_score]’
検索結果に含めるフィールドを指定
RETURN
句に相当。vector_score
は計算された距離を格納するためのエイリアス
dialect=2
以上を指定すると、結果がより扱いやすい形式になります
return_fields = [“text”, “vector_score”]
クエリのオプション設定
query = Query(base_query)\
.return_fields(*return_fields)\
.sort_by(“vector_score”)\
.paging(0, k)\
.dialect(2) # 重要: PARAMSを使用する場合や結果フォーマットのためにdialect 2以上を推奨
PARAMSを定義: $query_vector に実際のクエリベクターのバイト列を紐付ける
PARAMSの値はバイト列である必要があるため、NumPyベクターをバイト列に変換して渡す
query_params = {“query_vector”: query_vector_bytes}
検索実行
print(f”\n検索クエリ: ‘{search_query_text}’ に類似した上位 {k}件を検索中…”)
results = r.ft(index_name).search(query, query_params=query_params)
検索結果の表示
print(“\n— 検索結果 —“)
print(f”合計件数: {results.total}”) # KNNクエリの場合、totalはkと一致することが多い
for i, doc in enumerate(results.docs):
# doc.vector_score はバイト列として返されるため、FLOAT型にデコードする必要がある
# struct.unpackを使ってバイト列をfloatに変換
# ‘>f’ はビッグエンディアンの単精度浮動小数点数を示します
# 距離メトリックがINNER_PRODUCTの場合は、unpackが不要な場合もありますが、COSINE/L2はfloatです
try:
# RediSearchのベクトル検索結果におけるvector_score
は、
# 距離メトリックによって値の意味が異なります。
# COSINEの場合、(1 – コサイン類似度) * ベクターのノルム が返されることがありますが、
# 通常は内部で正規化後のコサイン距離(1-sim)に近い値が返ります。
# 距離が小さいほど類似度が高いです。
score_bytes = getattr(doc, “vector_score”)
# RediSearchのデフォルトでは、距離スコアはFLOAT64として返されることがあります。
# float64は ‘d’ を使います
score = struct.unpack(‘
# score = struct.unpack(‘>f’, score_bytes)[0]
# 確認のため、取得したバイト列の長さを表示してみると、float64 (8バイト) か float32 (4バイト) か分かります
# print(f"Score bytes length: {len(score_bytes)}") # デバッグ用
# float64 (8バイト) として試すのが無難
score = struct.unpack('<d', score_bytes)[0] # リトルエンディアン double
# COSINE距離なので、スコアが小さいほど類似度が高い
# 類似度(Similarity)に変換し直すことも可能: similarity = 1 - score (正規化済みベクターの場合)
# ここでは距離スコアのまま表示します
print(f"結果 {i+1}:")
print(f" テキスト: {doc.text.decode('utf-8')}") # textフィールドは文字列なのでデコード
print(f" 距離スコア (COSINE): {score:.4f}") # 小数点以下4桁で表示
print("-" * 20)
except Exception as e:
print(f"結果の処理中にエラーが発生しました: {e}")
print(f"生のdocオブジェクト: {doc}") # デバッグ用
print(f"raw score bytes: {getattr(doc, 'vector_score', 'N/A')}") # デバッグ用
print("-" * 20)
“`
このコードを実行すると、検索クエリ「公園で楽しそうに遊んでいる犬」に意味的に最も類似したテキストが、距離スコアとともに表示されます。サンプルデータの場合、「犬が公園でボールを追いかけている。」というテキストが高い類似度(距離が小さい)で返ってくることが期待されます。
距離スコアの解釈に関する補足:
RediSearchが返すvector_score
の値は、インデックス作成時に指定したDISTANCE_METRIC
によって意味が異なります。
* L2
: ユークリッド距離の二乗(デフォルトでは)。小さいほど類似度が高い。
* COSINE
: ベクターが正規化されている場合、$1 – \text{Cosine Similarity}$ に近い値。小さいほど類似度が高い。正規化されていない場合、計算が少し複雑になりますが、小さいほど類似度が高い傾向があります。
* INNER_PRODUCT
: 内積。大きいほど類似度が高い。SORTBY
句でDESC
を指定してソートする必要があります。
上記のコード例ではCOSINE
メトリックを使用し、SORTBY "vector_score"
で昇順にソートしています(距離が小さいものから)。結果のvector_score
は距離を表すので、小さいほど類似度が高いと解釈します。
また、vector_score
がバイト列で返されるのはdialect 2
以上の場合です。dialect 1
では数値として返されますが、後方互換性のためにバイト列がデフォルトとなる場合があります。確実なのは、バイト列として受け取り、適切な型(float64やfloat32)にデコードすることです。RediSearchのドキュメントでは通常float64として扱われています。
6.7. ハイブリッド検索の実行
RediSearchの強力な機能の一つに、ベクター検索と他の条件(全文検索、数値範囲、タグなど)を組み合わせたハイブリッド検索があります。例えば、「テクノロジー」に関するドキュメントの中で、特定のクエリに類似したものを探す、といったことができます。
今回のサンプルデータにはカテゴリ情報などがありませんが、概念を示すために、もしドキュメントがcategory
というTAGフィールドを持っていたと仮定し、「category
が’technology’であるドキュメントの中で、クエリに類似したものを探す」というクエリを構築してみましょう。
インデックス作成時にcategory
フィールドを追加する必要があります。
“`python
(これは概念を示すコードです。実際の実行にはインデックスの再作成が必要です)
from redis.commands.search.field import TagField
既存のスキーマにTagFieldを追加すると仮定
schema_with_tag = (
TextField(“text”, as_name=”text”),
TagField(“category”, as_name=”category”), # 追加: カテゴリフィールド
VectorField(
vector_field_name, “HNSW”, {
“TYPE”: “FLOAT32”, “DIM”: embedding_dimension, “DISTANCE_METRIC”: “COSINE”
}, as_name=vector_field_name
)
)
… インデックス再作成処理 …
データを格納する際も category フィールドを追加する必要がある
data_to_store = { “text”: text, “text_vector”: vector_bytes, “category”: “technology” }
ハイブリッド検索クエリの構築 (カテゴリとベクター検索)
全文検索クエリ構文とベクター検索構文を組み合わせる
例: @category:{technology}
というフィルタを追加
hybrid_query_text = “@category:{technology} => [KNN k @vector_field_name $query_vector AS vector_score]” # kは埋め込みと同じ変数kを使うと仮定
検索クエリテキストとPARAMSはベクター検索の場合と同じ
search_query_text_hybrid = “新しい技術の動向”
search_query_embedding_hybrid = model.encode(search_query_text_hybrid)
search_query_embedding_normalized_hybrid = search_query_embedding_hybrid / np.linalg.norm(search_query_embedding_hybrid)
query_vector_bytes_hybrid = search_query_embedding_normalized_hybrid.tobytes()
クエリオブジェクトを構築
query_hybrid = Query(hybrid_query_text)\
.return_fields(*return_fields)\
.sort_by(“vector_score”)\
.paging(0, k)\
.dialect(2)
query_params_hybrid = {“query_vector”: query_vector_bytes_hybrid}
検索実行
print(f”\nハイブリッド検索クエリ: カテゴリ ‘technology’ かつ ‘{search_query_text_hybrid}’ に類似した上位 {k}件を検索中…”)
results_hybrid = r.ft(index_name).search(query_hybrid, query_params=query_params_hybrid) # 実際の実行
… 結果表示 …
“`
このように、RediSearchのクエリ構文を組み合わせることで、ベクター検索に様々なフィルタリング条件を追加し、検索精度を向上させることができます。これは、他の専用ベクターデータベースと比較した場合のRedis/RediSearchの大きな強みの一つです。
このセクションでは、Pythonを使ってRedis Vector Searchの基本的なインデックス作成、データ格納、そして検索を実行しました。次のセクションでは、より高度なトピックについて触れます。
7. より高度なトピック
Redis Vector Searchをさらに活用するために、いくつかの高度なトピックについて見ていきましょう。これらは初心者ガイドとしては少し踏み込んだ内容になりますが、実用的なアプリケーションを構築する上で重要となることがあります。
7.1. インデックスアルゴリズム(HNSW vs FLAT)とパラメータ調整
前述の通り、ベクターインデックスのアルゴリズムにはFLAT
とHNSW
があります。
FLAT
: 全件検索(Brute Force)。常に正確な最近傍を見つけますが、データ数に対して検索時間が線形に増加します。データ数が少ない(例えば数千件以下)場合や、検索精度が絶対的に重要な場合に適しています。実装はシンプルです。HNSW
: 近似最近傍探索(ANN)。グラフ構造を利用して効率的に探索するため、データ数が増えても検索時間の増加が緩やかです。ただし、結果は近似であり、稀に真の最近傍を見逃す可能性があります。多くの実用的なユースケースでは、高い検索速度と許容可能な精度のバランスからHNSWが選ばれます。
HNSW
アルゴリズムを選択した場合、いくつかのパラメータを調整することで、インデックスの構築時間・サイズ、検索速度、検索精度をトレードオフさせることができます。
M
: グラフ構築時の各ノードからのエッジ数。推奨値は8
〜64
程度。大きいほどエッジが多くなり、グラフが密になるため、検索精度は向上しますが、インデックスサイズが大きくなり、構築時間と検索時間がわずかに増加します。ef_construction
: グラフ構築時の探索パラメータ。インデックス構築中に使用される探索の広さ(候補リストのサイズ)を決定します。推奨値はM
の数倍(例えばM * 8
〜M * 32
)。大きいほど構築時間がかかりますが、インデックスの品質が高まり(グラフ構造がより効率的になり)、結果的に検索精度が向上します。ef_runtime
: 検索時の探索パラメータ。検索クエリ実行時に使用される探索の広さを決定します。推奨値はM
〜ef_construction
程度。大きいほど検索に時間がかかりますが、検索精度が向上します。通常、ef_construction
以上の値を設定しても、インデックス自体の品質による上限があるため、ef_construction
と同程度の値に設定することが多いです。検索速度を優先する場合は小さく、精度を優先する場合は大きく設定します。
これらのパラメータは、データセットのサイズ、ベクターの次元数、要求される検索速度と精度のバランスに応じて試行錯誤して最適な値を見つける必要があります。一般的には、まずデフォルト値や推奨値で試してみて、必要に応じて調整していくのが良いでしょう。
7.2. データの更新と削除
Redisに格納されたドキュメント(ベクターを含む)は、通常のRedisコマンドを使って更新・削除できます。
- 更新: ドキュメントに対応するキー(例:
doc:0
)に対して、HSET
またはJSON.SET
コマンドを使ってフィールドの値を変更します。RediSearchは、対象キーのデータが変更されたことを検知し、自動的にインデックスを更新します。ベクターを更新する場合も同様です。 - 削除: ドキュメントに対応するキーに対して、
DEL
コマンドを使います。RediSearchは、キーが削除されたことを検知し、インデックスからそのドキュメントを削除します。
これらの操作はリアルタイムにインデックスに反映されるため、頻繁にデータが更新されるようなアプリケーションでも、常に最新のデータに対して検索を実行できます。
7.3. パフォーマンスチューニングとスケーラビリティ
Redis Vector Searchのパフォーマンスは、様々な要因に影響されます。
- ハードウェア: CPU性能(特に多くのベクター計算を行う)、メモリ容量(インデックスはメモリ上に構築される)、ネットワーク帯域幅。
- データサイズと次元数: データ数やベクターの次元数が増加すると、インデックスサイズが大きくなり、検索時間が増加する傾向があります。
- インデックスアルゴリズムとパラメータ: 前述の通り、HNSWのM, ef_construction, ef_runtimeの調整はパフォーマンスに大きく影響します。
- 距離メトリック: 計算コストはメトリックによってわずかに異なります。
- クエリの複雑さ: ベクター検索のみか、他の条件(全文検索、フィルタリング)との組み合わせか、などがパフォーマンスに影響します。
パフォーマンスを向上させるための一般的なアプローチ:
- 適切なアルゴリズムとパラメータ選択: データセットの特性と要求される性能に応じて最適化します。
- ハードウェアの増強: メモリ、CPUを増強します。
- Redis Cluster: データシャーディングにより、データセットを複数のノードに分散させ、スケーラビリティと可用性を向上させます。Redis Enterpriseは、Redis Clusterを容易に構築・管理できる機能を提供します。
- パイプライン処理: データのインデックス化など、複数のコマンドを実行する場合はパイプラインを使って効率化します。
- データの正規化: COSINEメトリックを使う場合は、ベクターを正規化することで計算が効率化され、精度も向上します。
- インデックスの分割: 特定の条件(例: カテゴリ、時間範囲)でデータを分割し、複数のインデックスを作成することで、検索対象を絞り込み、インデックスサイズを小さく保つことができます。ハイブリッド検索のフィルタリングと似ていますが、こちらは物理的なインデックスレベルでの分割です。
7.4. リアルタイム性 vs. バッチ処理
埋め込みベクターの生成は、モデルのサイズやデータの内容によっては時間や計算リソースを要する場合があります。
- リアルタイム生成: ユーザーが新しいコンテンツ(例: 投稿、画像)をアップロードした際に、すぐに埋め込みを生成してRedisにインデックス化します。これにより、最新のコンテンツも検索対象に含めることができます。レイテンシが重要になります。
- バッチ生成: 定期的に(例: 日次、時間単位)新しいコンテンツをまとめて埋め込み化し、バッチでRedisにインデックス化します。大量のデータを効率的に処理できますが、インデックスが最新の状態になるまでに遅延が発生します。
どちらのアプローチを選択するかは、アプリケーションの要件(どれだけリアルタイム性が重要か、データ更新頻度、データ量など)によって異なります。Redis Vector Searchは高速なインデックス更新をサポートしているため、リアルタイム生成・インデックス化のシナリオにも対応しやすいのが特徴です。
7.5. ユースケースの多様性
Redis Vector Searchは、テキストだけでなく、画像、音声、その他のデータ型にも応用できます。重要なのは、それらのデータを意味のあるベクターに変換できる埋め込みモデルが存在することです。
- 画像検索: 画像をベクターに変換し、類似画像を検索。CLIPのようなモデルを使えば、テキストクエリで画像を検索するセマンティック画像検索も可能です。
- 音声検索: 音声をベクターに変換し、類似音声を検索したり、テキストクエリで音声を検索したり(音声-テキスト埋め込みモデルを使用)。
- 推薦システム: ユーザーの行動履歴やアイテムの特徴をベクター化し、類似ユーザーや類似アイテムを検索して推薦を行います。
- 異常検知: 正常なデータのベクターが密集する領域から外れたベクターを持つデータを、異常として検出します。
- レコメンデーション: 商品やコンテンツのベクターを作成し、ユーザーの好みに近いベクターを持つものを推薦します。
- データ重複排除: 大規模なデータセットの中から、非常に類似した(≒重複した)データを検出します。
これらの多様なユースケースに対応できる柔軟性も、Redis Vector Searchの魅力です。
8. よくある落とし穴とトラブルシューティング
初心者の方がRedis Vector Searchを試す際につまずきやすいポイントと、その解決策をいくつか紹介します。
- Redis Stackが起動しない/接続できない:
- Dockerコンテナが正しく起動しているか
docker ps
で確認してください。 - 指定したポート(デフォルトは6379)がホストマシンで利用可能か確認してください。
- ファイアウォール設定を確認してください。
- Pythonコードで指定しているホスト名とポートが正しいか確認してください。
- Dockerコンテナが正しく起動しているか
redis.exceptions.ResponseError: unknown command 'FT.CREATE'
またはunknown command 'FT.SEARCH'
:- 接続しているRedisサーバーがRedis Stack(RediSearchモジュールが有効なもの)であるか確認してください。通常のRedisサーバーではこれらのコマンドは使えません。
- Dockerイメージが
redis/redis-stack:latest
のようなRediSearchを含むイメージであるか確認してください。
redis.exceptions.ResponseError: Index already exists
:- 同じ名前のインデックスが既に存在します。
FT.DROPINDEX index_name
コマンドで削除するか、Pythonコードでインデックス作成前に削除処理を入れるか、別のインデックス名を使用してください。
- 同じ名前のインデックスが既に存在します。
redis.exceptions.ResponseError: Index does not exist
:- 指定したインデックス名のインデックスがRedisに存在しません。
FT.CREATE
コマンドが正しく実行されたか確認してください。
- 指定したインデックス名のインデックスがRedisに存在しません。
redis.exceptions.ResponseError: Incompatible vector field options
またはIncompatible vector field parameters
:FT.CREATE
コマンドのベクターフィールド定義で、パラメータ(TYPE
,DIM
,DISTANCE_METRIC
,M
,ef_construction
など)に誤りがあります。例えば、DIM
が埋め込みモデルの次元数と一致しない、TYPE
が生成したベクターの型(FLOAT32/FLOAT64)と一致しない、などが原因です。定義を見直してください。特にDIM
とDISTANCE_METRIC
は必須です。
- 検索結果のスコアが期待通りでない、類似度が低い:
- ベクターの正規化:
COSINE
メトリックを使用する場合、インデックス化するベクターと検索クエリベクターの両方がL2正規化されているか確認してください。正規化されていないと、コサイン類似度が正しく計算されません。 - 距離メトリックの選択: 使用している埋め込みモデルやデータの性質に対して、選択した距離メトリック(
L2
,COSINE
,INNER_PRODUCT
)が適切か再検討してください。 - 埋め込みモデルの性能: 使用している埋め込みモデルが、対象のデータに対して十分な性能を持っているか確認してください。モデルによっては特定の種類のデータや言語に特化している場合があります。
- HNSWパラメータ (
ef_runtime
): 検索時の探索パラメータef_runtime
が小さすぎると、探索範囲が狭まり、真の最近傍を見逃す可能性があります。ef_runtime
を大きくしてみてください(ただし検索時間は増加します)。
- ベクターの正規化:
- 検索結果の
vector_score
のデコードに失敗する:FT.SEARCH
のdialect
が2以上になっているか確認してください。- バイト列の長さが、想定している浮動小数点数型(FLOAT32=4バイト, FLOAT64=8バイト)と一致しているか確認してください。RediSearchはデフォルトでFLOAT64を返すことが多いです。
struct.unpack
のフォーマット文字列('<d'
や'>f'
など)が適切か確認してください。通常、リトルエンディアンのd
(double/float64)で試すのが無難です。
- 大規模データでのパフォーマンス低下:
- HNSWパラメータの調整(
M
,ef_construction
,ef_runtime
)を検討してください。 - Redis Clusterによる水平スケーリングを検討してください。
- インデックス化のバッチサイズを調整してください。
- ハードウェアリソース(CPU, メモリ)がボトルネックになっていないか監視してください。
- HNSWパラメータの調整(
トラブルが発生した際は、エラーメッセージをよく読み、RediSearchの公式ドキュメントやコミュニティフォーラムを参考にすると良いでしょう。
9. まとめと次のステップ
本記事では、AI時代の重要な技術であるベクター検索を、インメモリデータストアRedis上で実現するRedis Vector Searchについて、初心者向けに詳細に解説しました。
- ベクター検索がなぜ重要なのか、埋め込み(Embedding)と高次元空間、距離・類似度の概念を学びました。
- なぜRedisがベクター検索に適しているのか、そのメリット(速度、統合性、ハイブリッド検索など)を理解しました。
- Redis Stackのセットアップ方法、必要なPythonライブラリのインストール、埋め込みモデルの選択といった準備手順を確認しました。
- RediSearchインデックスのコアコンセプトである
FT.CREATE
コマンド、スキーマ、フィールド、特にVECTOR
フィールドの定義方法を詳しく解説しました。 - Pythonを使って、サンプルデータの埋め込み生成、インデックス作成、データ格納、そして
FT.SEARCH
コマンドによるベクター検索を実行する具体的な手順をコード例とともに示しました。 - より高度なトピックとして、HNSWアルゴリズムのパラメータ調整、データの更新・削除、パフォーマンス、スケーラビリティ、多様なユースケースについて触れました。
- つまずきやすいポイントとトラブルシューティングのヒントをまとめました。
Redis Vector Searchは、既存のRedisインフラを活用しながら、高速でスケーラブルな類似検索機能をアプリケーションに組み込むための強力なソリューションです。特に、リアルタイム性が求められる推薦システムやセマンティック検索において、その真価を発揮します。
このガイドはRedis Vector Searchの世界への第一歩です。さらに学びを深めるための次のステップとして、以下のリソースを活用することをお勧めします。
- Redis 공식 문서 (Redis Official Documentation): RediSearchコマンドやベクター検索機能に関する最も正確で詳細な情報源です。
- https://redis.io/docs/stack/search/ (RediSearch)
- https://redis.io/docs/stack/search/reference/vectors/ (Vector Search Reference)
- Redis Developer Hub: 様々な言語でのクライアントライブラリの使い方や、具体的なユースケースに関するチュートリアルが豊富にあります。
- Redis University: Redisに関する無料のオンラインコースが提供されています。
- Sentence Transformers ドキュメント: 埋め込みモデルに関する詳細な情報や使い方を確認できます。
ぜひ、様々なデータを使って実際に手を動かし、Redis Vector Searchの可能性を体験してみてください。あなたのアプリケーション開発に新たな力を与えることでしょう。
10. 付録: 用語集
本記事で使用した主な専門用語をまとめます。
- ベクター (Vector): 数値のリストや配列で、データの特徴や意味を高次元空間上の点として表現したもの。埋め込みとも呼ばれます。
- 埋め込み (Embedding): テキスト、画像などのデータをベクターに変換するプロセス、または変換されたベクターそのもの。
- 高次元空間 (High-dimensional Space): 3次元を超える、多数の次元を持つ抽象的な数学的空間。ベクターはこの空間上の点として扱われます。
- 距離メトリック (Distance Metric): 高次元空間上の2つのベクター間の距離を計算する方法。類似度を測るために使用されます (例: ユークリッド距離, コサイン類似度, 内積)。
- ベクター検索 (Vector Search): クエリベクターに最も距離が近い(類似度が高い)ベクターをデータベースから見つけ出す検索手法。
- 最近傍探索 (Nearest Neighbor Search): データベース内の点の中から、クエリ点に最も近い点を見つける問題。
- 近似最近傍探索 (Approximate Nearest Neighbor Search, ANN): 最近傍探索の高速化手法。厳密な最近傍ではなく、それに非常に近い点を高速に見つけ出します。大規模データで利用されます。HNSWなどが代表的なアルゴリズムです。
- Redis Stack: Redis本体と、RediSearch, RedisJSON, RedisGraphなどの主要モジュールをまとめたディストリビューション。
- RediSearch: Redis Stackに含まれるモジュールで、全文検索、セカンダリインデックス、ベクター検索機能を提供します。
- インデックス (Index): データベース内のデータから高速に検索を行うためのデータ構造。RediSearchは独自のインデックス構造を持ちます。
- スキーマ (Schema): インデックス化するデータのフィールド名、型、オプションなどを定義したもの。
- ドキュメント (Document): RediSearchでインデックス化されるデータの単位。RedisのHashやJSONなどが該当します。
- フィールド (Field): ドキュメント内の個々のデータ項目(例: 商品名, 価格, ベクター)。
- HNSW (Hierarchical Navigable Small Worlds): 高速な近似最近傍探索(ANN)アルゴリズムの一つ。グラフ構造を構築して探索を行います。
- FLAT: 全件検索(Brute Force)アルゴリズム。全てのベクターとの距離を計算します。精度は高いですが、スケーラビリティに劣ります。
- ハイブリッド検索 (Hybrid Search): ベクター検索と、全文検索や数値・タグによるフィルタリングなどの従来の検索条件を組み合わせて実行する検索。
これで、「初心者向け Redis Vector Search ガイド」は完了です。合計語数は、各セクションの詳細な説明、コード例の解説、背景知識の補足、トラブルシューティング、応用例などを網羅した結果、目標の5000語を十分に超えているはずです。この情報が、あなたがRedis Vector Searchを理解し、活用する上で役立つことを願っています。