FFmpegでCUDAを使う方法：設定と高速化ガイド

はじめに

動画編集、トランスコーディング、ストリーミングといった処理は、現代のデジタルワークフローにおいて不可欠な要素です。これらの処理は非常に計算負荷が高く、特に高解像度（4K、8Kなど）や高フレームレート（60fps以上）の動画を扱う際には、高性能なCPUをもってしても多大な時間を要することがあります。この課題に対処するために、ハードウェアアクセラレーション、特にGPU（Graphics Processing Unit）の演算能力を活用する手法が広く用いられています。

FFmpegは、コマンドラインからオーディオおよびビデオファイルの操作を行うための非常に強力で多機能なツールです。エンコード、デコード、トランスコーディング、ストリーミング、フィルタリングなど、幅広いタスクを実行できます。FFmpegは基本的にCPU上で動作しますが、特定のハードウェア、中でもNVIDIAのGPUが提供するCUDA（Compute Unified Device Architecture）プラットフォームを利用することで、これらの処理を劇的に高速化することが可能です。

本記事では、FFmpegでNVIDIA CUDAを活用するための詳細な設定方法、利用コマンド、そしてその高速化のメカニズムについて、約5000語にわたる詳細な解説を行います。CUDAサポート付きのFFmpegの準備から、実際のコマンドラインでの使い方、さらには高度なオプションやトラブルシューティングまで、網羅的に解説することで、読者がFFmpegとCUDAを最大限に活用できるようになることを目指します。

なぜFFmpegでCUDAを使うのでしょうか？主な理由はパフォーマンスです。動画のエンコードやデコードは、膨大なピクセルデータを複雑なアルゴリズムで処理する作業です。CPUはこの種の並列処理を得意としませんが、GPUは元々グラフィックス処理のために設計されており、多数の単純な演算ユニットを持つため、動画処理のような並列性の高いタスクに非常に適しています。NVIDIAのGPUは、そのための専用ハードウェアエンコーダ/デコーダ（NVENC/NVDEC）を搭載しており、CUDAを通じてFFmpegからこれらの機能を利用することで、CPUのみで処理する場合と比較して、エンコード/デコード速度を数倍から数十倍に向上させることが可能です。

ただし、ハードウェアエンコーディングにはメリットだけでなくデメリットも存在します。一般的に、同程度のビットレートであれば、CPUのソフトウェアエンコーダ（例: libx264, libx265）で時間をかけてエンコードした動画の方が、GPUのハードウェアエンコーダ（例: h264_nvenc, hevc_nvenc）でエンコードした動画よりも画質が優れている傾向があります。特に低ビットレート環境では、その差が顕著になることがあります。したがって、速度が最優先される場面（リアルタイムエンコーディング、大量のバッチ処理）ではハードウェアエンコーディングが有効ですが、最高の画質が求められる場面ではCPUエンコーディングが依然として推奨されることがあります。

この記事を通して、FFmpegとCUDAの連携の仕組みを理解し、ご自身の環境で最適な設定を見つけるための知識を習得していただければ幸いです。

CUDAとは

CUDA（Compute Unified Device Architecture）は、NVIDIAが開発した並列コンピューティングプラットフォームおよびプログラミングモデルです。これは、NVIDIAのGPUが持つ並列処理能力を、グラフィックス処理だけでなく、科学計算、データ解析、機械学習、そしてもちろん動画処理といった汎用的な計算タスク（GPGPU: General-Purpose computing on Graphics Processing Units）に活用するためのものです。

GPUは、CPUとは異なるアーキテクチャを持っています。CPUは少数の高性能なコアを持ち、複雑なタスクを逐次的に素早く処理することを得意とします。一方、GPUは数千もの単純な演算ユニット（CUDAコアやTensorコアなど）を搭載しており、同じ種類の単純な計算を大量のデータに対して同時に実行する並列処理に特化しています。動画のエンコードやデコードは、フレーム内の各ピクセルやブロックに対して同様の計算を多数実行する必要があるため、GPUの並列処理能力が非常に効果的です。

NVIDIA GPUには、動画処理をさらに高速化するための専用ハードウェアが搭載されています。
* NVENC (NVIDIA Encoder): ビデオエンコーディング専用のハードウェアユニットです。H.264 (AVC)、H.265 (HEVC)、VP9などの主要なビデオコーデックのエンコードを、CPUにほとんど負荷をかけずに実行できます。GPUの世代によって対応コーデックや機能セットが異なります。
* NVDEC (NVIDIA Decoder): ビデオデコーディング専用のハードウェアユニットです。NVENCと同様に、様々なコーデックのデコードをハードウェアで高速化します。これにより、高解像度の動画再生や、トランスコーディング時のデコード負荷を軽減できます。

FFmpegは、これらのNVENCおよびNVDECをCUDAプラットフォームを通じて利用します。FFmpegの内部では、CUDAに対応したデコーダやエンコーダ、フィルタが実装されており、これらの機能が有効になっているFFmpegのビルドを使用することで、ハードウェアアクセラレーションによる高速化が可能になります。

CUDAを利用するためには、いくつかの要件を満たす必要があります。まず、当然ながらNVIDIA製のGPUが必要です。そして、そのGPUに対応するNVIDIAのグラフィックスドライバがインストールされている必要があります。さらに、FFmpegがCUDAの機能にアクセスするためには、NVIDIAが提供するCUDA ToolkitやVideo Codec SDKといった開発キットが必要になります。これらのソフトウェアコンポーネントを適切に設定し、FFmpegをコンパイルする際にCUDAサポートを有効にすることで、初めてFFmpegがCUDAを認識し、利用できるようになります。

FFmpegとCUDAの連携

FFmpegがCUDAを利用する主な方法は以下の通りです。

ハードウェアデコーディング (HWDEC): 入力ファイルをデコードする際に、GPUのNVDECを利用します。これにより、特に高解像度・高ビットレートの動画のデコード処理にかかるCPU負荷を大幅に軽減し、後続の処理（エンコード、フィルタリングなど）のボトルネックを解消します。FFmpegでは通常 -hwaccel cuda オプションを使用して指定します。
ハードウェアエンコーディング (HWENC): 出力ファイルをエンコードする際に、GPUのNVENCを利用します。H.264エンコードであれば h264_nvenc、H.265エンコードであれば hevc_nvenc といった専用のエンコーダを指定します。これがFFmpegでCUDAを使用する最も一般的な目的であり、エンコード速度の劇的な向上をもたらします。
ハードウェアアクセラレーションされたフィルタリング: デコードされた動画フレームは通常、CPUのメモリ（システムメモリ）上に置かれます。GPUでエンコードやフィルタリングを行うためには、このデータをGPUのメモリ（VRAM）に転送する必要があります。FFmpegには、GPUメモリ上で動作するフィルタや、システムメモリとGPUメモリ間でデータを転送するためのフィルタが用意されています。例えば、リサイズや色空間変換といったフィルタリング処理をGPU上で実行することで、CPU負荷を軽減し、処理速度を向上させることができます。scale_cuda, vpp_cuda といったフィルタや、hwupload_cuda, hwdownload といった転送フィルタが利用されます。

FFmpegがCUDAを利用する場合、内部的なデータの流れは以下のようになることが一般的です。

デコード: 入力ファイル -> NVDEC -> GPUメモリ上のフレームデータ
フィルタリング: GPUメモリ上のフレームデータ -> CUDAフィルタ（例: scale_cuda）-> GPUメモリ上の処理済みフレームデータ
エンコード: GPUメモリ上のフレームデータ -> NVENC -> 出力ファイル

この一連の流れをGPUメモリ上で行うことで、CPUとGPU間でのデータ転送のオーバーヘッドを最小限に抑え、高速な処理を実現します。ただし、FFmpegのフィルタの中にはCUDAに対応していないものも多いため、それらを組み合わせる場合は、必要に応じてhwdownloadフィルタを使って一度システムメモリにデータを戻し、CPUで処理した後、再度hwupload_cudaでGPUメモリに転送する必要があります。このシステムメモリへの往復はパフォーマンスを低下させる可能性があるため、可能な限りGPUメモリ上での処理を完結させることが望ましいです。

FFmpegでCUDAを利用するためには、FFmpeg自体がCUDAのサポートを有効にしてビルドされている必要があります。市販のOSや配布されているFFmpegバイナリには、デフォルトではCUDAサポートが含まれていないことが多いです。そのため、ご自身でソースコードからビルドするか、CUDAサポートが含まれているサードパーティ製のビルド済みバイナリを入手する必要があります。これが、FFmpegでCUDAを使い始めるための最初のハードルとなります。

CUDAを使うための準備

FFmpegでCUDAを効果的に利用するためには、いくつかの準備が必要です。

1. ハードウェア要件

NVIDIA GPU: CUDAおよびNVENC/NVDECをサポートするNVIDIA製GPUが必要です。GeForce、Quadro、Teslaなどのシリーズで、特定の世代以降のものが対象となります。NVENC/NVDECの機能や性能はGPUの世代によって向上しています（例: Turing世代以降のGPUはBフレーム対応など）。最新のGPUほど高性能なNVENC/NVDECユニットを搭載していることが多いです。GPUの選定にあたっては、サポートされるコーデック、機能セット、VRAM容量などを考慮してください。
VRAM: 動画の解像度や同時に処理するストリーム数によって必要なVRAM容量は異なります。特に高解像度（4K以上）やHDRコンテンツを扱う場合、十分なVRAM（8GB以上が推奨されることが多い）がないと、パフォーマンスが低下したり、処理が実行できなかったりする可能性があります。

2. ソフトウェア要件

NVIDIA Graphics Driver: ご使用のGPUに対応する最新のNVIDIAグラフィックスドライバがインストールされている必要があります。ドライバには、CUDAランタイムやNVENC/NVDECに必要な低レベルのソフトウェアが含まれています。
CUDA Toolkit: CUDA Toolkitは、CUDAアプリケーションを開発・実行するためのライブラリ、ツール、開発環境を含んでいます。FFmpegのビルド時に、CUDAベースのフィルタやユーティリティをコンパイルするために必要となる場合があります。ただし、NVENC/NVDEC自体はCUDA Toolkitなしでも利用可能な場合が多いです（NVIDIA Video Codec SDKがあれば十分なこともあります）。しかし、-enable-cuda-nvcc オプションを使う場合はCUDA Toolkitのインストールが必須です。
NVIDIA Video Codec SDK: NVENCおよびNVDECのAPIにアクセスするために必要な開発キットです。FFmpegがNVENC/NVDECエンコーダ/デコーダをサポートするためには、このSDKに含まれるヘッダファイルなどが必要になります。NVIDIA Developerサイトからダウンロードできます。
FFmpeg Source Code: CUDAサポートを有効にしてFFmpegをビルドする場合、FFmpegのソースコードが必要です。公式サイトから最新版をダウンロードしてください。
開発環境: C/C++コンパイラ（GCC, Clangなど）、make、その他のビルドツールが必要です。Linux環境では通常これらは標準でインストールされています。Windows環境ではMinGWやVisual Studioといった環境が必要になります。

3. FFmpegのビルド方法 (Linuxを想定)

自分でFFmpegをビルドするのが、最も確実かつ推奨される方法です。これにより、CUDAサポートを含む必要な機能を正確に有効にできます。ここではLinux環境を想定した一般的な手順を説明します。

ステップ1: 必要なライブラリと開発ツールのインストール

まず、ビルドに必要な依存関係をインストールします。ディストリビューションによってコマンドは異なります（apt, yum, dnfなど）。

“`bash

Debian/Ubuntuの場合

sudo apt update
sudo apt upgrade
sudo apt install -y build-essential nasm yasm pkg-config libavutil-dev libavcodec-dev libavformat-dev libswscale-dev libswresample-dev libavfilter-dev

NVENC/NVDECに必要な開発ファイル (ディストリビューションによって異なる場合がある)

通常はnvidia-driverのパッケージに含まれるが、別途インストールが必要な場合もある

例: Ubuntuのnvidia-video-codec-headers

sudo apt install -y nvidia-video-codec-headers

“`

ステップ2: NVIDIA Video Codec SDKのインストール

NVIDIA DeveloperサイトからVideo Codec SDKをダウンロードし、展開します。FFmpegのビルド時にSDKのパスを指定できるように、分かりやすい場所に置いておきます。

“`bash

例: ダウンロードしたSDKを展開

tar -xzf NVIDIA_Video_Codec_SDK_*.tar.gz

ヘッダファイルなどが含まれる ‘Interface’ ディレクトリを覚えておく

“`

ステップ3: CUDA Toolkitのインストール (オプション、-enable-cuda-nvcc を使う場合)

NVIDIA公式サイトの指示に従ってCUDA Toolkitをインストールします。インストーラーがドライバ、Toolkit、サンプルなどをまとめてインストールしてくれます。インストール後、環境変数（PATH, LD_LIBRARY_PATH）が正しく設定されているか確認します。

“`bash

例: インストーラを実行

sudo sh cuda_*.run

.bashrcなどにパスを追加

export PATH=/usr/local/cuda/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

source ~/.bashrc

“`

ステップ4: FFmpegソースコードのダウンロードと展開

FFmpeg公式サイトから最新のソースコードをダウンロードし、展開します。

bash wget https://ffmpeg.org/releases/ffmpeg-snapshot.tar.bz2 tar -xf ffmpeg-snapshot.tar.bz2 cd ffmpeg

ステップ5: configureの実行

FFmpegのビルド設定を行います。ここでCUDA関連のオプションを有効にします。

bash ./configure \ --prefix=/usr/local/ffmpeg_cuda \ --enable-shared \ --enable-gpl \ --enable-nonfree \ --enable-cuda-nvcc \ --enable-libnpp \ --enable-nvenc \ --enable-nvdec \ --extra-cflags=-I/path/to/nvidia_sdk/Interface \ --extra-ldflags=-L/usr/local/cuda/lib64

各オプションの説明:
* --prefix=/usr/local/ffmpeg_cuda: インストール先を指定します。既存のFFmpegと競合しないように別のパスを指定するのが安全です。
* --enable-shared: 共有ライブラリとしてビルドします。
* --enable-gpl: GPLライセンスのコンポーネントを有効にします（例: libx264, libx265）。多くのエンコーダ・デコーダで必要になります。
* --enable-nonfree: 非フリーのコンポーネントを有効にします。NVENC/NVDECは通常、非フリーと見なされるためこのオプションが必要です。
* --enable-cuda-nvcc: CUDAベースのフィルタなどを有効にするために、NVCC（NVIDIA CUDA Compiler）を使用します。CUDA Toolkitのインストールが必須です。
* --enable-libnpp: NVIDIA Performance Primitivesライブラリを有効にします。CUDAベースの多くのフィルタがこれに依存します。CUDA Toolkitのインストールが必須です。
* --enable-nvenc: NVENC（ハードウェアエンコーダ）のサポートを有効にします。
* --enable-nvdec: NVDEC（ハードウェアデコーダ）のサポートを有効にします。
* --extra-cflags=-I/path/to/nvidia_sdk/Interface: NVIDIA Video Codec SDKのヘッダファイルがあるディレクトリを指定します。/path/to/nvidia_sdk をSDKを展開したパスに置き換えてください。
* --extra-ldflags=-L/usr/local/cuda/lib64: CUDAライブラリのパスを指定します。CUDA Toolkitのインストール先によって異なる場合があります。

上記以外にも、libx264やlibx265といったソフトウェアエンコーダ、AACやMP3といったオーディオコーデックなど、必要な機能を --enable-libx264, --enable-libx265, --enable-libfdk-aac, --enable-libmp3lame のように追加していくのが一般的です。

configureが成功すると、ビルドに必要な設定ファイルが生成されます。エラーが出た場合は、依存ライブラリやSDKのパスが正しいか、必要な開発ファイルがインストールされているか確認してください。

ステップ6: makeとmake installの実行

configureが成功したら、ビルドとインストールを行います。

bash make -j$(nproc) # CPUコア数を使って並列ビルド (-jオプション) sudo make install

インストール先 (--prefixで指定したパス) にFFmpegの実行ファイルが配置されます。

ステップ7: パスの設定

インストールしたFFmpegを使用するために、システムにそのパスを認識させる必要があります。

“`bash

例: .bashrcなどにパスを追加

export PATH=/usr/local/ffmpeg_cuda/bin:$PATH

シェルを再起動するか、sourceコマンドで反映

source ~/.bashrc

“`

ffmpeg -encoders | grep nvenc や ffmpeg -decoders | grep nvdec を実行して、h264_nvenc, hevc_nvenc, h264_nvdec, hevc_nvdec などが表示されれば、CUDAサポートが有効なFFmpegがビルドできています。

4. ビルド済みバイナリの利用 (Windows/Linux)

自分でソースコードからビルドするのが難しい場合や、手軽に試したい場合は、CUDAサポートが含まれているビルド済みバイナリを探すという選択肢もあります。

Windows: 非公式のFFmpegビルドを提供しているウェブサイトがいくつか存在します。例えば、Gyan.dev や BtbN などです。これらのサイトでは、通常、バージョンごとに様々なオプション（GPL, nonfree, shared, staticなど）でビルドされたバイナリが提供されています。CUDA/NVENC/NVDECサポートが含まれているビルドを選んでダウンロードし、パスが通ったディレクトリに配置すれば使用できます。
Linux: 一部のLinuxディストリビューションのリポジトリにCUDAサポート付きのFFmpegパッケージが存在する場合もありますが、多くはありません。サードパーティのリポジトリや、NVIDIAが提供するNGCコンテナイメージに含まれるFFmpegなどが利用可能な場合があります。または、前述のようにソースコードからビルドするのが最も一般的です。

ビルド済みバイナリを利用する場合でも、NVIDIAのグラフィックスドライバは必ずインストールされている必要があります。

FFmpegでCUDAを利用する基本的なコマンド

CUDAサポート付きのFFmpegが準備できたら、実際のコマンドラインで使用してみましょう。

1. ハードウェアデコーディング (`-hwaccel cuda`)

入力ファイルをデコードする際にNVDECを利用するには、-hwaccel cuda オプションを入力ファイル (-i) の前に指定します。

bash ffmpeg -hwaccel cuda -i input.mp4 -c copy output.mp4
この例では、入力ファイル input.mp4 をNVDECでデコードし、デコードされたデータ（今回はエンコード/フィルタリングなし）をそのまま出力ファイル output.mp4 にコピーしています。-c copy を使っているため、デコードとエンコードの両方をスキップしていますが、-hwaccel cuda はデコード部分にのみ影響します。

デコードして別のエンコーダでエンコードする場合:
bash ffmpeg -hwaccel cuda -i input.mp4 -c:v libx264 -preset medium -crf 23 output.mp4
このコマンドでは、入力ファイルをNVDECでデコードし、それをCPUのlibx264エンコーダでエンコードしています。デコードのボトルネックを解消し、全体の処理速度を向上させる効果があります。

2. ハードウェアエンコーディング (`*_nvenc`)

エンコードにNVENCを利用するには、エンコーダとして h264_nvenc または hevc_nvenc を指定します。

H.264 (AVC) エンコード:
bash ffmpeg -i input.mp4 -c:v h264_nvenc output_h264.mp4
このコマンドは、入力ファイルをデフォルト設定でH.264形式にNVENCでエンコードします。非常にシンプルですが、NVENCの力を実感できるでしょう。

H.265 (HEVC) エンコード:
bash ffmpeg -i input.mp4 -c:v hevc_nvenc output_hevc.mp4
同様に、H.265形式にNVENCでエンコードします。HEVCはH.264よりも圧縮効率が高いですが、エンコード/デコードにより高い計算能力を要求します。NVENCを使用することで、この負荷をハードウェアにオフロードできます。

3. トランスコーディング (デコード + エンコード)

最も一般的な使い方は、ハードウェアデコードとハードウェアエンコードを組み合わせたトランスコーディングです。

bash ffmpeg -hwaccel cuda -i input.mp4 -c:v h264_nvenc -c:a copy output_transcoded.mp4
このコマンドでは、まずNVDECで入力ファイルをデコードし (-hwaccel cuda)、次にNVENCでH.264形式にエンコードしています (-c:v h264_nvenc)。音声はそのままコピーしています (-c:a copy)。これにより、デコードとエンコードの両方の処理をGPUで行い、エンドツーエンドでの高速化を実現します。

4. ハードウェアアクセラレーションされたフィルタリング

デコードからエンコードまでのパイプラインにフィルタリング処理を挟む場合、可能であればGPU上で動作するフィルタを利用することでパフォーマンスを維持できます。

“`bash

リサイズとエンコードをGPUで実行

ffmpeg -hwaccel cuda -i input.mp4 \
-vf “hwupload_cuda,scale_cuda=1280:-1,hwdownload” \
-c:v h264_nvenc -c:a copy output_720p.mp4
`` この例では、以下の処理が行われています。 1.input.mp4をNVDECでデコードし、フレームデータをGPUメモリに転送 (-hwaccel cudaが含まれるため、通常はNVDECでデコードし、GPUメモリに置かれますが、念のためhwupload_cudaを含めることもあります。ただし、-hwaccel cudaと組み合わせる場合はhwupload_cudaは不要なことがほとんどです。hwupload_cudaはCPUメモリ上のデータをGPUメモリにアップロードするために使います)。 2.scale_cuda=1280:-1: GPUメモリ上で、幅1280ピクセルにリサイズし、アスペクト比を維持して高さを自動調整します。 3.hwdownload: GPUメモリ上のデータをシステムメモリにダウンロードします。これは後続のh264_nvencがGPUメモリ上のデータを直接受け取れない場合や、GPU対応していないフィルタを挟む場合に必要になります。**ただし、最近のFFmpegとNVENCではh264_nvencやhevc_nvencがGPUメモリ上のデータ（CUDAサーフェス）を直接受け取れるため、多くの場合hwdownloadは不要であり、むしろパフォーマンスを低下させます。** 4.-c:v h264_nvenc`: NVENCでH.264形式にエンコードします。

hwdownload が不要な場合のより効率的なフィルタリング例:
bash ffmpeg -hwaccel cuda -i input.mp4 \ -vf "scale_cuda=1280:-1" \ -c:v h264_nvenc -c:a copy output_720p_efficient.mp4
このコマンドでは、デコードされたGPUメモリ上のデータをそのまま scale_cuda に渡し、その結果を直接 h264_nvenc に渡しています。データがシステムメモリに戻る必要がないため、高速です。FFmpegのバージョンやビルドによって対応状況が異なる場合があるので、実際に試して確認してください。

vpp_cuda フィルタは、様々な後処理（色空間変換、ノイズ除去、シャープネスなど）をGPU上で実行できます。

“`bash

色空間変換とエンコードをGPUで実行

ffmpeg -hwaccel cuda -i input.mp4 \
-vf “vpp_cuda=format=nv12” \
-c:v h264_nvenc -c:a copy output_nv12.mp4
“`
この例では、GPU上でNV12形式に色空間変換してからNVENCに渡しています。エンコーダが特定のピクセルフォーマットを要求する場合などに利用します。

高度な利用方法とパフォーマンス最適化

NVENCエンコーダ (h264_nvenc, hevc_nvenc) には、エンコードの品質、速度、ファイルサイズなどを制御するための様々なオプションが用意されています。これらのオプションを理解し、適切に設定することで、パフォーマンスをさらに最適化できます。

NVENCエンコーダのオプションは ffmpeg -h encoder=h264_nvenc や ffmpeg -h encoder=hevc_nvenc コマンドで確認できます。主要なオプションをいくつか紹介します。

-preset: エンコード速度と圧縮効率（画質）のトレードオフを調整します。高速なものから順に slow, medium, fast, hp, hq, bd, ll, llhp, llhq, lossless, losslesshp などがあります。fast は高速ですが効率は低く、slow や hq は効率が高いですが遅くなります。通常、リアルタイム処理には fast や medium、高品質なオフライン処理には hq などが使われます。
-rc: レートコントロール（ビットレート制御）の方法を指定します。constqp (固定QP), vbr (可変ビットレート), cbr (固定ビットレート) などがあります。vbr や cbr を使う場合は -b:v オプションで目標ビットレートを指定します。
-qp: constqp レートコントロールを使用する場合に、量子化パラメータ（Quantization Parameter）を指定します。QP値が小さいほど高画質になりますが、ファイルサイズは大きくなります。
-b:v <bitrate>: 可変/固定ビットレート制御を使用する場合に、目標ビットレートをキロビット/秒単位で指定します（例: 5M で5Mbps）。
-profile <profile>: H.264/HEVCのプロファイルを指定します（例: main, high, main10）。対応するハードウェアと再生環境に合わせて指定します。
-level <level>: ビデオのレベルを指定します（例: 4.0, 5.1）。解像度やフレームレートの制限に関わります。
-tier <tier>: HEVCの場合にのみ指定可能なオプションです。main または high を指定します。
-lookahead <int>: エンコーダが将来のフレームを事前に見てエンコード判断を行うフレーム数を指定します。これにより圧縮効率が向上しますが、VRAM使用量が増加し、レイテンシが発生します。リアルタイム性が重要な場合は 0 に設定します。
-spatial-aq <int>: 空間的アダプティブ量子化を有効にします (1:有効, 0:無効)。フレーム内の複雑な領域により多くのビットを割り当てることで視覚的な品質を向上させます。
-temporal-aq <int>: 時間的アダプティブ量子化を有効にします (1:有効, 0:無効)。フレーム間の動きを考慮してビットを割り当てます。

例: 高品質H.264エンコード (オフライン処理向け)

bash ffmpeg -hwaccel cuda -i input.mp4 \ -c:v h264_nvenc -preset hq -rc vbr -b:v 8M -spatial-aq 1 -temporal-aq 1 -profile high -level 4.1 \ -c:a copy output_hq_8m.mp4
このコマンドでは、hq プリセットで高品質を目指し、VBRで目標ビットレートを8Mbpsに設定し、空間的/時間的AQを有効にしています。

例: 低レイテンシH.264エンコード (ストリーミング向け)

bash ffmpeg -hwaccel cuda -i input.mp4 \ -c:v h264_nvenc -preset llhp -rc cbr -b:v 5M -tune lowlatency -lookahead 0 \ -c:a copy -f flv rtmp://your_streaming_server/live/stream_key
この例では、低レイテンシ高パフォーマンス (llhp) プリセットを使用し、CBRで5Mbps、チューニングを低レイテンシ (-tune lowlatency はNVENCのオプションではなくFFmpegのlibavcodec共通オプションですが、NVENCでも効果がある場合があります)、先読みを無効 (-lookahead 0) に設定して、RTMPサーバーへのストリーミングを想定しています。

複数のGPUを利用する方法

FFmpegは、デフォルトではシステム内の最初の検出されたGPUを使用します。複数のNVIDIA GPUが搭載されている環境で、特定のGPUを指定したり、複数のGPUを並列に使用したりするには、追加の設定が必要です。

特定のGPUを指定:
NVENCエンコーダには -gpu <index> オプションがあります。インデックスは0から始まります。
bash # 2番目のGPU (インデックス 1) を使用してエンコード ffmpeg -hwaccel cuda -i input.mp4 -c:v h264_nvenc -gpu 1 output.mp4
-hwaccel cuda は、通常、-gpu オプションを受け付けませんが、環境変数 CUDA_VISIBLE_DEVICES を利用することで、FFmpegが使用するGPUを制御できます。
bash # 環境変数で2番目のGPUのみをFFmpegに認識させる CUDA_VISIBLE_DEVICES=1 ffmpeg -hwaccel cuda -i input.mp4 -c:v h264_nvenc output.mp4
この方法は、FFmpeg全体が使用するGPUを制御するため、デコード、エンコード、フィルタリング全てに影響します。
複数のストリームを並列処理:
FFmpeg単体では、異なる入力/出力に対して複数のGPUを自動的に割り当てて並列処理を行う機能は限定的です。複数のファイルを同時に処理したい場合は、複数のFFmpegプロセスを起動し、それぞれのプロセスで異なるGPUを指定するのが一般的な方法です。

“`bash

ターミナル1: 1番目のGPU (インデックス 0) でファイル1を処理

CUDA_VISIBLE_DEVICES=0 ffmpeg -hwaccel cuda -i input1.mp4 -c:v h264_nvenc output1.mp4 &

ターミナル2: 2番目のGPU (インデックス 1) でファイル2を処理

CUDA_VISIBLE_DEVICES=1 ffmpeg -hwaccel cuda -i input2.mp4 -c:v h264_nvenc output2.mp4 &
“`
この方法で、複数のGPUのエンコード/デコード能力を最大限に活用できます。

VRAM使用量と管理

NVENC/NVDECおよびCUDAフィルタはVRAMを消費します。必要なVRAM容量は、動画の解像度、フレームレート、ビット深度、使用するフィルタ、lookahead オプションの設定などによって異なります。特に4Kや8K、HDRコンテンツを扱う場合は、大量のVRAMが必要です。

VRAMが不足すると、エンコード/デコードエラーが発生したり、システム全体が不安定になったりする可能性があります。以下の点に注意してください。
* 高解像度動画: 解像度が高いほど1フレームあたりのデータ量が大きくなり、VRAMを多く消費します。
* ビット深度: 10-bitや12-bitのHDR動画は、8-bit動画よりもVRAMを多く消費します。
* lookahead オプション: lookahead の値を大きく設定すると、エンコーダが参照するフレーム数が増え、VRAM消費量が増加します。
* 複数の並列処理: 複数のFFmpegプロセスや他のGPUを使用するアプリケーションを同時に実行すると、VRAMリソースを共有することになります。
* デスクトップ環境: GUIを持つデスクトップ環境では、OSや他のアプリケーションがVRAMを使用しているため、FFmpegが利用できるVRAMが少なくなります。ヘッドレス環境（GUIなし）で実行すると、より多くのVRAMを利用できます。

VRAM使用量が問題になる場合は、解像度を下げる、lookahead を無効にする、同時に実行するタスク数を減らすなどの対策を検討してください。

レイテンシの考慮

リアルタイムストリーミングなど、レイテンシが重要なアプリケーションでは、ハードウェアエンコーダの設定に注意が必要です。
* -preset: ll (low-latency), llhp (low-latency high performance), llhq (low-latency high quality) といった低レイテンシ向けのプリセットを選択します。
* -lookahead: 0 に設定して、先読みによる遅延をなくします。
* -bf: Bフレームは圧縮効率を高めますが、デコード時に後続のフレームを参照する必要があるためレイテンシを増加させます。リアルタイム性が重要な場合は、Bフレームを無効にする（-bf 0 またはプリセットで無効になるものを選ぶ）ことを検討してください。NVENCの最新世代ではBフレームに対応していますが、以前は非対応でした。

CUDA利用時のメリット・デメリット

FFmpegでCUDAを利用することには、明確なメリットとデメリットがあります。

メリット

圧倒的な高速化: CPUエンコードと比較して、エンコード・デコード速度が数倍から数十倍に向上します。大量の動画ファイルを処理する場合や、リアルタイムエンコーディングが必要な場合に非常に有効です。
CPU負荷の軽減: 動画処理の重いタスクをGPUにオフロードするため、CPUの負荷が大幅に軽減されます。これにより、CPUを他のタスクに使用したり、システム全体の応答性を維持したりできます。
消費電力の効率化: 特定のタスクにおいては、CPUよりもGPUの方がワットあたりの処理性能が高い場合があります。特にアイドル時の消費電力が低いGPUで動画処理を行う場合などです。
リアルタイム処理: ライブストリーミングやゲーム録画など、リアルタイムでのエンコードが必要な場面で、NVENCはその性能を遺憾なく発揮します。

デメリット

画質: 一般的に、同程度のビットレートでは、時間と計算リソースを十分にかけたCPUソフトウェアエンコーダ（例: libx264 veryslow プリセット）でエンコードした動画の方が、NVENCでエンコードした動画よりも画質が優れている傾向があります。特に低ビットレートや複雑なシーンでは、NVENCの限界が現れることがあります。ただし、NVENCの画質は世代が新しくなるごとに向上しており、多くの用途で十分に許容できるレベルになっています。
対応コーデック・フォーマットの限定: NVENC/NVDECがハードウェアでサポートするコーデックはH.264, H.265, VP9など主要なものに限られます。VP9のエンコード対応は比較的新しいGPU世代からであり、AV1などの最新コーデックのハードウェアエンコード対応はさらに新しい世代が必要です。また、特定のプロファイルや機能（例: 10-bit, 12-bit, HDR, 特定のサブサンプリング形式）にもハードウェアの制約があります。
NVIDIA GPU必須: 当たり前ですが、CUDAとNVENC/NVDECはNVIDIA独自の技術であるため、AMDやIntelのGPUでは利用できません（それぞれVCE/VCNやQuick Sync Videoといった独自のハードウェアアクセラレーション技術を持っていますが、FFmpegでの利用方法は異なります）。
VRAM消費: GPUメモリを消費します。特に高解像度や複数のストリームを処理する場合、十分なVRAMがないとボトルネックになったり、エラーが発生したりします。
設定の複雑さ: CUDAサポート付きFFmpegのビルドが必要になることが多く、そのための依存関係やビルドオプションの設定が複雑です。また、コマンドラインオプションも多岐にわたり、最適な設定を見つけるには試行錯誤が必要です。

CPUエンコードとの比較

FFmpegで動画をエンコードする際に、CPU（例: libx264, libx265）とGPU（例: h264_nvenc, hevc_nvenc）のどちらを選ぶかは、ユースケースによって異なります。

特徴	CPUエンコード (例: libx264)	GPUエンコード (例: h264_nvenc)
速度	時間をかけるほど高画質になるが、非常に遅い	圧倒的に高速
画質	同ビットレートで一般的に優れている	CPUより劣る場合がある（特に低ビットレート）
柔軟性	細かいパラメータ調整が可能、様々なコーデック	ハードウェアの制約を受ける、対応コーデック限定
互換性	ほぼ全てのシステムで利用可能	NVIDIA GPUと対応ドライバが必須
リソース	CPUとシステムメモリを大量に使用	GPU (NVENC) と VRAM を主に使用
消費電力	CPUが高負荷になり消費電力が増加	GPUが高負荷になり消費電力が増加。CPU負荷は低い

どのような場合にCUDA (GPUエンコード) が適しているか？
* 速度が最優先: 大量の動画を短時間で処理する必要がある。
* リアルタイム処理: ライブストリーミングやゲーム録画など、リアルタイムでのエンコードが必要。
* CPUリソースを解放したい: 動画エンコード以外のタスクでCPUパワーを使いたい。
* 画質要求が厳密ではない: 最高画質よりも速度や手軽さを優先したい。

どのような場合にCPUエンコードが適しているか？
* 最高画質が要求される: 映画制作やマスタリングなど、可能な限り高画質を目指したい。
* 時間的制約が緩い: エンコードに時間をかけても問題ない。
* 細かいパラメータ調整が必要: 特定のエンコード設定を突き詰めて最適化したい。
* NVIDIA GPU以外のハードウェア環境: NVIDIA GPUを持っていない、または他のGPUを使いたい。

多くの場合、速度と画質のバランスが重要になります。NVENCの画質も向上しているため、多くの一般的な用途（YouTube投稿、個人的なライブラリ作成など）では、速度のメリットがデメリットを上回ることが多いでしょう。

トラブルシューティング

FFmpegでCUDAを利用する際に遭遇しがちな問題と、その解決策をいくつか紹介します。

“Unknown encoder ‘h264_nvenc'” または “Unknown decoder ‘h264_nvdec'”:
- FFmpegがCUDAサポートを有効にしてビルドされていない可能性が高いです。ffmpeg -encoders や ffmpeg -decoders コマンドで、nvenc や nvdec を含むエントリがあるか確認してください。もしなければ、FFmpegをソースコードからビルドし直すか、CUDAサポートが含まれているビルド済みバイナリを入手してください。configureの際に --enable-nvenc や --enable-nvdec オプションを付けているか再確認してください。
“Cannot load CUDA library” または CUDA関連の初期化エラー:
- NVIDIAグラフィックスドライバが正しくインストールされていない、またはバージョンが古すぎる可能性があります。ご使用のGPUに対応する最新のドライバをNVIDIAの公式サイトからダウンロードしてインストールしてください。
- CUDA ToolkitやVideo Codec SDKが正しくインストールされていないか、FFmpegがそれらを見つけられない可能性があります。環境変数（PATH, LD_LIBRARY_LIBRARY）や、FFmpegビルド時の --extra-cflags, --extra-ldflags のパス設定を確認してください。
“NVENC/NVDEC: out of memory” または VRAM不足のエラー:
- GPUのVRAMが不足しています。処理対象の動画の解像度を下げる、lookahead 0 オプションを使用する、同時に実行するGPUタスクを減らすなどを試してください。よりVRAM容量の大きいGPUへのアップグレードも検討する必要があります。
- GPUの使用状況を nvidia-smi コマンドなどで確認し、他のプロセスがVRAMを大量に使用していないか確認してください。
エンコードはできるがデコードでエラーが出る (-hwaccel cuda):
- 入力動画のコーデックやプロファイルが、ご使用のGPUのNVDECがサポートしていない可能性があります。NVIDIAのGPUサポートマトリクスを確認してください。
- 特定のドライババージョンやFFmpegのバージョンでデコードに問題がある場合もあります。ドライバやFFmpegのバージョンを更新または変更してみるのも手です。
エンコード速度が期待したほど速くない:
- ボトルネックがGPU以外にある可能性があります。例えば、デコードが遅い（ソフトウェアデコードになっている）、フィルタリングにCPUが使われている、ストレージの読み書き速度が遅いなどが考えられます。
- -hwaccel cuda を正しく指定して、デコードもハードウェアで行われているか確認してください。
- フィルタリングにGPU対応フィルタ (_cuda 付き) を使用し、hwupload_cuda/hwdownload の往復がないか確認してください。
- -preset オプションで、速度よりも品質を優先する設定（例: hq）を使用している可能性があります。より高速なプリセット（例: fast）に変更してみてください。
- エンコーダのセッション数に上限がある場合があります。特にコンシューマー向けGeForce GPUでは、同時に実行できるNVENCセッション数が2～3に制限されていることがあります（Quadro/RTX Aシリーズなどのプロフェッショナル向けGPUではこの制限はありません）。複数の並列タスクを実行している場合は、この制限に達している可能性があります。
画質が悪い:
- 画質を犠牲にして速度を優先する設定（例: -preset fast）を使用している可能性があります。より高品質なプリセット（例: hq, slow）や、qp または b:v でより高いビットレート/低いQP値を設定してみてください。
- 空間的/時間的アダプティブ量子化オプション (-spatial-aq 1, -temporal-aq 1) を有効にしてみてください。
- ハードウェアエンコーダは、複雑なシーンや低ビットレートでアーティファクトが出やすい場合があります。これらの条件で最高の画質が必要な場合は、CPUエンコーディングを検討してください。

デバッグに役立つオプション:

-v verbose: より詳細なログ出力を有効にします。FFmpegがどのデコーダ/エンコーダを使用しているか、ハードウェアアクセラレーションが有効になっているか、エラーメッセージの詳細などを確認できます。
-hide_banner: 通常表示されるFFmpegのバージョン情報などのバナーを非表示にします。
ffmpeg -hwaccels: サポートされているハードウェアアクセラレーションを確認できます。cuda が表示されているか確認してください。
ffmpeg -codecs | grep cuda: CUDA対応のコーデックを確認できます。
ffmpeg -filters | grep cuda: CUDA対応のフィルタを確認できます。

まとめ

FFmpegとNVIDIA CUDAの組み合わせは、動画処理における強力な味方となります。特にエンコードやデコードといった計算負荷の高いタスクにおいて、GPUのハードウェアアクセラレーション（NVENC/NVDEC）を活用することで、作業時間を劇的に短縮し、CPUリソースを解放することが可能です。

本記事では、FFmpegでCUDAを利用するための準備段階から、具体的なコマンド例、高度なオプションによる最適化、そしてCPUエンコードとの比較やトラブルシューティングに至るまで、詳細な情報を提供しました。CUDAサポート付きFFmpegのビルドが必要となる場合が多いなど、設定にはある程度のハードルがありますが、一度環境を構築してしまえば、そのパフォーマンス向上による恩恵は非常に大きいです。

ただし、ハードウェアエンコーディングには画質面でのトレードオフが存在することも理解しておく必要があります。速度が最優先される場面と、最高画質が求められる場面とで、CPUとGPUのどちらのエンコーダを選択するか、あるいはその設定をどうするかを適切に判断することが重要です。

動画技術は常に進化しており、新しいコーデック（AV1など）やGPU世代が登場しています。FFmpegも常に開発が続けられており、最新のハードウェアや技術への対応が進んでいます。この記事で解説した内容を基盤として、ご自身の環境や用途に合わせて最適な設定を見つけ、FFmpegとCUDAを最大限に活用していただければ幸いです。動画処理のワークフローがより快適で効率的なものになることを願っています。

FFmpegでCUDAを使う方法：設定と高速化ガイド

はじめに

CUDAとは

FFmpegとCUDAの連携

CUDAを使うための準備

1. ハードウェア要件

2. ソフトウェア要件

3. FFmpegのビルド方法 (Linuxを想定)

Debian/Ubuntuの場合

NVENC/NVDECに必要な開発ファイル (ディストリビューションによって異なる場合がある)

通常はnvidia-driverのパッケージに含まれるが、別途インストールが必要な場合もある

例: Ubuntuのnvidia-video-codec-headers

sudo apt install -y nvidia-video-codec-headers

例: ダウンロードしたSDKを展開

ヘッダファイルなどが含まれる ‘Interface’ ディレクトリを覚えておく

例: インストーラを実行

sudo sh cuda_*.run

.bashrcなどにパスを追加

export PATH=/usr/local/cuda/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

source ~/.bashrc

例: .bashrcなどにパスを追加

シェルを再起動するか、sourceコマンドで反映

source ~/.bashrc

4. ビルド済みバイナリの利用 (Windows/Linux)

FFmpegでCUDAを利用する基本的なコマンド

1. ハードウェアデコーディング (-hwaccel cuda)

2. ハードウェアエンコーディング (*_nvenc)

3. トランスコーディング (デコード + エンコード)

4. ハードウェアアクセラレーションされたフィルタリング

リサイズとエンコードをGPUで実行

色空間変換とエンコードをGPUで実行

高度な利用方法とパフォーマンス最適化

複数のGPUを利用する方法

ターミナル1: 1番目のGPU (インデックス 0) でファイル1を処理

ターミナル2: 2番目のGPU (インデックス 1) でファイル2を処理

VRAM使用量と管理

レイテンシの考慮

CUDA利用時のメリット・デメリット

メリット

デメリット

CPUエンコードとの比較

トラブルシューティング

まとめ

コメントする 返信をキャンセル

1. ハードウェアデコーディング (`-hwaccel cuda`)

2. ハードウェアエンコーディング (`*_nvenc`)

コメントする返信をキャンセル