はい、承知いたしました。WHEA UNCORRECTABLE ERRORの原因特定と解決方法について、約5000語の詳細な解説を含む記事を作成します。
【完全ガイド】WHEA UNCORRECTABLE ERRORの原因特定と解決方法
はじめに:恐るべきブルースクリーン、WHEA UNCORRECTABLE ERRORとは?
Windowsを使用している際に、突然画面が真っ青になり、白い文字でエラーメッセージが表示される現象、通称「ブルースクリーン・オブ・デス(BSOD)」に遭遇した経験があるかもしれません。数あるブルースクリーンの中でも、特にPCユーザーを悩ませる深刻なエラーの一つに「WHEA UNCORRECTABLE ERROR」があります。
このエラーメッセージは、システムが回復不能なハードウェアエラーを検出した際に表示されます。WHEAとは「Windows Hardware Error Architecture」の略称で、Windowsがハードウェアのエラーを検出・報告するための仕組みです。そして、「UNCORRECTABLE」とは、「修正不可能」という意味。つまり、WHEA UNCORRECTABLE ERRORは、PCのハードウェアに発生した、OSやソフトウェアの力では修復できない致命的な問題を示唆しているのです。
他のブルースクリーンエラーコード(例: PAGE_FAULT_IN_NONPAGED_AREAやKERNEL_MODE_TRAPなど)が、ドライバーの不具合や特定のソフトウェアの競合など、比較的ソフトウェア側に原因がある場合が多いのに対し、WHEA UNCORRECTABLE ERRORは、その性質上、CPU、メモリ、マザーボード、ストレージ、電源ユニットといったPCの根幹をなすハードウェアそのもの、あるいはそのファームウェアに深刻な問題がある可能性が極めて高いです。
このエラーは、PCのクラッシュ、予期せぬシャットダウン、フリーズなどを引き起こし、最悪の場合、データの損失やハードウェアの物理的な故障につながることもあります。そのため、このエラーに遭遇した場合は、問題を放置せず、速やかに原因を特定し、適切な対処を行うことが非常に重要です。
本記事では、WHEA UNCORRECTABLE ERRORが発生するメカニズム、一般的な原因、そして原因を特定し解決するための詳細なステップバイステップガイドを、約5000語にわたって徹底的に解説します。PCのトラブルシューティングに不慣れな方でも理解できるよう、専門用語を避けつつ、具体的な手順を丁寧に説明していきます。このガイドが、WHEA UNCORRECTABLE ERRORの解決、そして安定したPC環境の実現の一助となれば幸いです。
WHEA UNCORRECTABLE ERRORが発生する仕組み:Windows Hardware Error Architecture(WHEA)とは
WHEA UNCORRECTABLE ERRORを理解するためには、まずWindowsがどのようにハードウェアエラーを扱っているかを知る必要があります。ここで登場するのがWindows Hardware Error Architecture (WHEA)です。
WHEAは、Windows Vista以降に導入された、OSとハードウェア間で発生したエラー情報をやり取りするための標準的なフレームワークです。プロセッサ、メモリ、PCI Expressデバイスなど、様々なハードウェアで発生したエラーを検出し、OSに報告する役割を担います。
ハードウェアエラーには、大きく分けて二つの種類があります。
- Corrected Error (修正可能エラー): ハードウェア自体が内部的にエラーを検出し、修正できたエラーです。例えば、メモリコントローラーがエラー訂正コード(ECC)によってメモリのビットエラーを修正した場合などです。このようなエラーはシステムの動作には影響を与えませんが、将来的な故障の前兆である可能性もあるため、WHEAはこれらのエラーも記録します。
- Uncorrected Error (修正不可能エラー): ハードウェアが検出したが、自身では修正できなかったエラーです。これは通常、より深刻な問題を示しています。例えば、CPUのキャッシュで検出された致命的なエラーや、メモリ上のデータがECCでも修正できないほど破損している場合などです。システムはこのエラーを無視して処理を続行することができないため、OSは予期せぬ動作を防ぐためにシステムを停止させます。この「システムの停止」が、WHEA UNCORRECTABLE ERRORを伴うブルースクリーンとして現れるのです。
WHEA UNCORRECTABLE ERRORが表示されるとき、Windowsはハードウェアから「このエラーは修正できませんでした。システムの安定性を保つために停止が必要です」という通知を受け取った状態です。STOPコード 0x00000124 がこれに該当し、その後に続く4つのパラメータ (Parameter 1 ~ Parameter 4) には、エラーに関する詳細な情報(エラータイプ、エラーを報告したコンポーネント、エラー情報のアドレスなど)が含まれています。これらのパラメータを解析することで、どの種類のハードウェアエラーが発生したのか、ある程度の推測が可能になりますが、一般のユーザーが直接これらのパラメータから原因を特定するのは難しい場合があります。
重要なのは、WHEA UNCORRECTABLE ERRORは、OSやアプリケーションの問題ではなく、その土台となるハードウェアレベルで発生した根本的な問題であることを理解することです。
WHEA UNCORRECTABLE ERRORの一般的な症状
WHEA UNCORRECTABLE ERRORが発生する際の最も顕著な症状は、もちろんブルースクリーンですが、それ以外にもいくつかの前兆や関連症状が見られることがあります。
- ブルースクリーンの発生:
- 最も直接的な症状です。「:( お使いのPCは問題が発生したため、再起動する必要があります。」というメッセージとともに、STOPコードとして「WHEA UNCORRECTABLE ERROR」または
0x00000124が表示されます。 - 発生頻度は様々です。起動直後に発生する場合、PCの使用中に突然発生する場合、特定のアプリケーション(特に負荷の高いゲームや動画編集ソフトなど)を実行中に発生する場合などがあります。
- 最も直接的な症状です。「:( お使いのPCは問題が発生したため、再起動する必要があります。」というメッセージとともに、STOPコードとして「WHEA UNCORRECTABLE ERROR」または
- 予期せぬシステムのシャットダウンまたは再起動:
- ブルースクリーンが表示されることなく、突然PCの電源が落ちたり、再起動したりすることがあります。これもWHEAエラーが原因である可能性があります。
- システムのフリーズまたはスタッター(カクつき):
- システムが応答しなくなったり、マウスカーソルや画面の更新が非常に遅くなったりする症状。ハードウェアエラーが原因でシステム全体が不安定になっている可能性があります。
- パフォーマンスの低下:
- 以前は快適に動作していたアプリケーションが遅くなったり、全体のレスポンスが悪くなったりします。ハードウェアが不安定になっている、あるいはエラー訂正のために処理能力を消費している可能性があります。
- ハードウェアの異音や異常な熱:
- ファンが異常に高速回転する、異音がするなど。これは過熱が原因の場合によく見られますが、過熱はWHEAエラーの一因となります。
- OSやアプリケーションのクラッシュ:
- 特定のアプリケーションだけでなく、Windows自体が頻繁にクラッシュするようになります。
これらの症状が見られる場合、特にブルースクリーンでWHEA UNCORRECTABLE ERRORが表示された場合は、ハードウェアの問題を疑って詳細な診断と対処を開始する必要があります。
WHEA UNCORRECTABLE ERRORの考えられる原因(詳細)
WHEA UNCORRECTABLE ERRORはハードウェアエラーを示唆するため、その原因は多岐にわたります。ここでは、考えられる主な原因をコンポーネント別に詳しく解説します。
-
CPU(中央演算処理装置)の問題:
- 過熱: CPUは高性能化に伴い発熱も大きくなっています。冷却が不十分だと、CPUの温度が許容範囲を超え、計算エラーが発生しやすくなります。これがWHEAエラーの一般的な原因の一つです。特にCPUに高い負荷がかかる処理(ゲーム、エンコード、科学計算など)を実行中に発生しやすいです。
- 電圧供給の不安定: CPUへの供給電圧が不安定だったり、不足していたりすると、正常な演算ができずエラーが発生します。マザーボードのVRM(Voltage Regulator Module)の故障や、電源ユニット(PSU)の不安定さが原因となることがあります。
- オーバークロック: CPUを定格以上の周波数で動作させるオーバークロックは、性能を向上させる一方で、CPUに定格以上の負荷をかけ、消費電力と発熱を増加させます。不安定なオーバークロック設定は、WHEAエラーの最も一般的な原因の一つです。過剰な周波数、不十分な電圧、または適切なストレステストを行わずに設定した場合に発生しやすいです。
- ハードウェアの劣化または故障: CPU自体の内部コンポーネント(キャッシュ、演算ユニット、メモリコントローラーなど)が物理的に劣化したり故障したりしている場合。これは稀ですが、古いCPUや、過去に過酷な環境で使用されたCPUで発生する可能性があります。製造上の初期不良であることもゼロではありません。
- ファームウェア/マイクロコードの問題: CPUを制御するマイクロコードにバグがある場合。これは通常、BIOS/UEFIのアップデートで修正されますが、古いバージョンや特定の組み合わせで問題が発生することがあります。
-
RAM(ランダムアクセスメモリ)の問題:
- メモリ自体の故障: メモリモジュールの一部または全体が物理的に故障している場合。メモリセルがデータを正しく保持できなくなると、読み書きエラーが発生します。WHEAエラーでメモリが原因の場合、ブルースクリーンメッセージのパラメータにメモリ関連の情報が含まれることがあります。
- 互換性の問題: マザーボードやCPUとのメモリの互換性がない場合。特に、マザーボードメーカーがサポートリストに載せていないメモリを使用した場合や、異なるメーカー・速度・容量のメモリを混在させた場合に問題が発生しやすいです。
- 設定(周波数、タイミング、電圧)の不適切: BIOS/UEFIで設定されているメモリの周波数、タイミング(CL値など)、または電圧が、メモリの仕様やシステム全体の安定性に対して適切でない場合。特にXMP (Extreme Memory Profile) やDOCP (DRAM Overclocking Profile) といった自動設定プロファイルが、環境によっては不安定になることがあります。オーバークロックと同様、メモリ設定を定格以上に変更した場合も不安定さが増します。
- 物理的な接続不良: メモリモジュールがメモリスロットにしっかり挿入されていない、またはスロット自体に問題がある場合。ホコリや酸化による接触不良も原因となります。
- 過熱: メモリ自体が過熱することは比較的少ないですが、周囲のコンポーネント(CPUやGPU)からの熱や、ケース内のエアフローの悪さによって過熱し、エラーが発生する可能性があります。
-
マザーボードの問題:
- VRM(電圧レギュレータモジュール)の故障または不十分な設計: CPUやメモリなどに安定した電力を供給するVRMが故障したり、負荷に対して設計が貧弱だったりすると、電圧が不安定になり、WHEAエラーを引き起こします。特にハイエンドなCPUを使用している場合やオーバークロックを行っている場合に重要になります。VRMが過熱することも問題となります。
- チップセットの故障またはドライバの問題: マザーボード上のチップセット(CPU、メモリ、ストレージ、PCIeデバイスなどを接続するハブ)が故障したり、チップセットドライバーに問題があったりする場合。チップセットは様々なコンポーネント間の通信を仲介するため、ここでのエラーはシステム全体に影響します。
- PCI Expressバスの問題: グラフィックカードや拡張カードを接続するPCI Expressスロットやバス自体に問題がある場合。カードの接続不良、スロットの故障、またはデバイスとの互換性問題がWHEAエラーとして報告されることがあります。
- BIOS/UEFIのバグまたは設定ミス: マザーボードのファームウェアであるBIOS/UEFIにバグがある場合や、設定(特に電圧、周波数、電力制限など)が不適切な場合。最新版へのアップデートや設定のリセットが必要となることがあります。
- 物理的な損傷: コンデンサの膨張、回路の焼損、物理的な接触不良など、マザーボード自体の物理的な故障。
-
ストレージデバイス(SSD/HDD)の問題:
- S.M.A.R.T.エラーまたは物理的な故障: ストレージデバイス(特にSSD)のコントローラーやNANDフラッシュ/プラッターに物理的な問題がある場合。読み書きエラーやデータ破損が発生し、OSが必要なファイルを読み込めなくなるとWHEAエラーや他の種類のブルースクリーンが発生することがあります。S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology) 情報でドライブの状態を確認することが重要です。
- 接続の問題: SATAケーブルやM.2スロットでの接続不良、またはケーブル自体の劣化や損傷。
- ファームウェアのバグ: SSDのファームウェアに既知の問題がある場合。メーカーが提供する最新ファームウェアへのアップデートで解決することがあります。
- ドライバーの問題: ストレージコントローラー(SATA/NVMe)のドライバーが古い、または破損している場合。特にNVMe SSDを使用している場合は、専用ドライバーのインストールや更新が重要です。
-
電源ユニット(PSU)の問題:
- 電力供給の不足: システム全体の消費電力に対して、PSUの最大出力が不足している場合。特に高性能なCPUやGPUを搭載しているシステム、または多くのストレージデバイスや拡張カードを接続している場合に発生しやすいです。
- 電圧の不安定: PSUから各コンポーネントへ供給される電圧が不安定な場合(リップルノイズが大きい、電圧が変動するなど)。特に負荷がかかった際に電圧が大きく変動すると、CPUやGPU、ストレージなどが正常に動作できなくなり、エラーが発生します。古いPSUや品質の低いPSUで発生しやすい問題です。
- PSU自体の故障または劣化: PSU内部のコンデンサなどの部品が劣化したり故障したりしている場合。これは比較的古いPSUによく見られますが、新しいPSUでも発生しないとは限りません。
- ケーブルの接続不良: PSUからマザーボードやグラフィックカードへの電源ケーブルがしっかり接続されていない、またはケーブル自体に問題がある場合。
-
GPU(グラフィック処理装置)の問題:
- GPU自体の過熱や故障は、通常、特定のグラフィックエラーコード(例: VIDEO_TDR_TIMEOUT_DETECTED)を伴うことが多いですが、稀にGPUの不安定さがシステム全体のWHEAエラーを引き起こすこともあります。特にGPUのメモリ(VRAM)やPCIeインターフェースの問題がWHEAとして報告される可能性があります。
- ドライバーの問題: グラフィックドライバーのバグや破損。これはWHEA以外のエラーの原因としても非常に一般的ですが、システム全体の不安定化を通じてWHEAを誘発する可能性もゼロではありません。
-
その他のハードウェア/ソフトウェアの問題:
- 周辺機器: 外部接続されたUSBデバイスや、内部に増設された拡張カード(サウンドカード、ネットワークカードなど)の不具合や互換性問題が、システムバスに影響を与え、WHEAエラーを引き起こすことがあります。
- Windows OSの破損: OSシステムファイル自体が破損している場合。これはハードウェアエラーが原因でOSファイルが破損した結果であることも多いですが、まれにOS側の問題がハードウェアエラーとして誤って報告されることもあります。
- マルウェア感染: 非常に稀ですが、深刻なマルウェアがシステムに深いレベルで影響を与え、ハードウェアエラーのような症状を引き起こす可能性も理論上は存在します。
これらの原因の中から、自分のPCで発生しているWHEA UNCORRECTABLE ERRORの根本原因を特定するには、系統立てたトラブルシューティングが必要となります。
トラブルシューティングの準備と心構え
WHEA UNCORRECTABLE ERRORに立ち向かう前に、いくつかの準備と心構えが必要です。
- 慌てない: ブルースクリーンは怖いものですが、WHEAエラーは多くの場合、適切な診断と対処で解決可能です。冷静に手順を踏みましょう。
- 情報の収集: ブルースクリーンが表示されたら、エラーコード (
0x00000124) とその下に表示される4つのパラメータをメモするか、写真を撮っておきましょう。これは原因特定の手がかりになる可能性があります。また、エラーがどのような状況(起動時、アイドル時、特定のアプリ使用時など)で発生するか、その頻度も記録しておくと役立ちます。 - データのバックアップ: 可能であれば、重要なデータを外部ストレージなどにバックアップしてください。ハードウェアの問題は、最悪の場合データ損失につながる可能性があるため、念のための対策です。エラー発生頻度が高い場合は、Windowsが起動しない可能性も考慮し、別のPCやLinux Live USBなどからアクセスしてデータを救出する方法も検討します。
- Windowsインストールメディアの準備: Windowsのシステム修復機能やクリーンインストールが必要になる場合に備え、USBメモリなどでWindowsのインストールメディアを作成しておくと安心です。
- セーフモードの活用: 通常起動が難しい場合や、問題の原因がソフトウェアやドライバーにある可能性も考慮して、必要に応じてWindowsをセーフモードで起動できるようにしておきます。セーフモードでは最低限のドライバーとサービスのみがロードされるため、多くのソフトウェアや周辺機器が原因である可能性を排除できます。
- Windowsが複数回正常に起動しない場合、自動的に「Windows回復環境」に入ります。そこから「トラブルシューティング」>「詳細オプション」>「スタートアップ設定」>「再起動」と進み、起動時のオプションで「セーフモードを有効にする」を選択できます。
- 必要なツールの準備: ハードウェア診断ツールやシステム情報ツールなど、後述するトラブルシューティングで使用する可能性のあるツールを、別のPCを使ってダウンロードしておくとスムーズです。
- PC内部へのアクセス: 一部のトラブルシューティング手順では、PCケースを開けてハードウェアに物理的に触る必要があります。静電気防止策を講じ、適切なドライバーを用意するなど、安全に作業できる環境を整えてください。PC内部の作業に自信がない場合は、信頼できる友人に手伝ってもらうか、専門業者への依頼も検討しましょう。
これらの準備を整えたら、いよいよ詳細なトラブルシューティングに進みます。
WHEA UNCORRECTABLE ERRORの原因特定と解決方法:ステップバイステップガイド
ここから、WHEA UNCORRECTABLE ERRORの原因を特定し、解決するための具体的な手順を解説します。基本的には、原因の可能性が高いものから順に、あるいは比較的簡単に試せるものから試していく「原因の切り分け」のアプローチを取ります。
ステップ1:エラー情報の収集と基本的な確認
まず、エラーに関する詳細な情報を収集し、物理的な基本的な確認を行います。
-
ブルースクリーンエラーコードとパラメータの記録:
- 前述の通り、ブルースクリーンが表示された際に記録したエラーコード(0x00000124)と4つのパラメータを確認します。これらのパラメータは、エラーの種類に関するヒントを与えてくれます(例: Parameter 1が0x10であれば、CPU/プロセッサに関するエラーの可能性が高いなど)。ただし、これらのパラメータの解釈は専門的であり、決定的な原因を特定するには至らない場合が多いです。
-
Windowsのイベントビューアーを確認する:
- WHEAエラーが発生すると、Windowsはイベントログにその情報を記録します。イベントビューアーを確認することで、エラーが発生した正確な日時や、より詳細なエラー情報(ある場合)を得られます。
Windowsキー + Rを押し、「ファイル名を指定して実行」ダイアログにeventvwr.mscと入力してEnterキーを押します。- 「イベントビューアー」ウィンドウが開いたら、左側のペインで「Windowsログ」>「System」を選択します。
- 中央のペインで、エラーが発生した日時の周辺にある「エラー」または「重大」レベルのイベントを探します。
- ソースが「Microsoft-Windows-Kernel-WHEA」となっているイベントがあれば、それがWHEAエラーの記録です。そのイベントをクリックして詳細を確認します。説明文の中に、どのハードウェアコンポーネントでエラーが検出されたか、あるいはエラーの種類(例: Cache Hierarchy Error, TLB Error, Bus Errorなど)が記されている場合があります。これは原因特定に非常に役立ちます。
- イベントIDが18や19の場合、一般的にWHEA関連のプロセッサハードウェアエラーを示します。
-
ミニダンプファイルの解析(任意・上級者向け):
- ブルースクリーン発生時、システムはミニダンプファイル(メモリのごく一部を保存したファイル)を作成することがあります。このファイルを解析することで、エラー発生時のシステム状態や関連するドライバーなどの情報を得られます。
- ミニダンプファイルは通常
C:\Windows\Minidumpフォルダに保存されています。 - 解析には、Microsoftのデバッグツール (
WinDbg) や、より簡単なサードパーティ製ツール (BlueScreenViewなど) があります。 BlueScreenViewは、ミニダンプファイルを自動でスキャンし、エラーコード、エラーを発生させた可能性のあるドライバーファイルなどを一覧で表示してくれます。これを参考に、どのドライバーやコンポーネントが関連しているか推測できます。WinDbgはより強力ですが、使用にはコマンドライン操作とある程度の知識が必要です。!analyze -vコマンドを実行することで、エラーの詳細な解析結果が表示されます。この結果の中に、エラーの種類や関連するモジュール(ドライバーやハードウェア)に関する情報が含まれています。例えば、「PROCESSOR_INFO」セクションや「WHEA_ERROR_SOURCE」セクションなどが原因特定の手がかりになります。- ダンプファイル解析は難易度が高いため、自信がなければスキップしても構いませんが、原因特定には非常に有効な手段です。
-
信頼性モニターを確認する:
- 信頼性モニターは、システムの問題履歴(アプリケーションのクラッシュ、Windowsの停止、ハードウェアエラーなど)を時系列でグラフ表示してくれるツールです。
- Windowsの検索バーに「信頼性モニター」と入力して起動します。
- WHEAエラーが発生した日付に、赤い「×」が表示されているはずです。その詳細を確認することで、イベントビューアーと同様にエラー情報を得られることがあります。
-
物理的な接続確認と清掃:
- PCの電源を完全に落とし、電源ケーブルを抜きます。
- PCケースを開け、内部にホコリが溜まっていないか確認します。特にファンやヒートシンク(CPUクーラー、GPUクーラーなど)にホコリが詰まっていると、冷却効率が大幅に低下し、過熱の原因となります。エアダスターなどを使って清掃します。
- 主要なコンポーネント(メモリ、グラフィックカード、ストレージのSATA/電源ケーブル)がしっかり挿入されているか、抜けていないか確認します。一度抜いて挿し直してみる「再装着(Reseating)」も有効な場合があります。特にメモリは、一度すべてのモジュールを抜き、再度奥までしっかりカチッと音がするまで挿し直してみてください。
- マザーボード上のケーブル(メイン24ピン、CPU補助電源8ピン/4ピンなど)がしっかり接続されているかも確認します。
ステップ2:ソフトウェアとファームウェアの更新・確認
ハードウェアエラーであっても、古いドライバーやファームウェアのバグが原因であることも少なくありません。まずはソフトウェア側の問題を排除します。
-
Windows Updateを実行する:
- Windows OS自体のバグがエラーに関連している可能性もあります。最新のWindows Updateをすべて適用し、OSを最新の状態にしてください。
- 「設定」>「更新とセキュリティ」>「Windows Update」から更新を確認し、適用します。
-
ドライバーを更新する:
- ハードウェアとOSの間の通信を仲介するドライバーに問題があると、ハードウェアエラーが発生したかのように見えることがあります。特に以下の重要なドライバーを最新版に更新します。
- チップセットドライバー: マザーボードのメーカー(ASUS, Gigabyte, MSI, ASRockなど)のウェブサイトから、お使いのマザーボードのモデルに合った最新のチップセットドライバーをダウンロードしてインストールします。IntelまたはAMDのウェブサイトから直接ダウンロードできる場合もあります。
- ストレージコントローラードライバー(SATA/NVMe): チップセットドライバーに含まれることが多いですが、ストレージメーカー(Samsung, Crucial, WDなど)やNVMeコントローラーメーカー(Intel, Samsung, Phisonなど)から専用ドライバーが提供されている場合は、そちらも確認します。
- グラフィックドライバー: NVIDIA (GeForce), AMD (Radeon), Intel (Intel HD/UHD/Iris Graphics) のウェブサイトから、お使いのGPUの最新ドライバーをダウンロードしてクリーンインストールします。Display Driver Uninstaller (DDU) などのツールを使って既存のドライバーを完全に削除してからインストールすると、トラブルが少ないです。
- その他重要なドライバー: ネットワークアダプター、サウンドカード、その他の拡張カードなど、使用しているハードウェアのドライバーもメーカーサイトから最新版を確認・インストールします。
デバイスマネージャーを開いて、エラーマーク(黄色の三角形に!)が付いているデバイスがないかも確認し、必要に応じてドライバーを更新または再インストールします。
- ハードウェアとOSの間の通信を仲介するドライバーに問題があると、ハードウェアエラーが発生したかのように見えることがあります。特に以下の重要なドライバーを最新版に更新します。
-
BIOS/UEFIを更新する:
- マザーボードのファームウェアであるBIOS/UEFIにバグがあり、ハードウェアの認識や制御に問題を引き起こしている可能性があります。最新のBIOS/UEFIに更新することで、CPU、メモリ、ストレージなどの互換性や安定性が向上することがあります。
- 注意: BIOS/UEFIの更新は非常に慎重に行う必要があります。更新中にPCの電源が切れると、マザーボードが起動不能になる「文鎮化」するリスクがあります。手順をよく確認し、安定した電源環境で行ってください。自信がない場合はスキップするか、専門家への依頼を検討してください。
- マザーボードのメーカー(ASUS, Gigabyte, MSI, ASRockなど)の公式ウェブサイトにアクセスし、お使いのマザーボードの正確なモデル(例: ASUS ROG STRIX Z690-A GAMING WIFI D4)を入力してサポートページを見つけます。
- ダウンロードセクションから最新のBIOSファイルをダウンロードします。通常はZIP形式で圧縮されています。
- マザーボードの取扱説明書やメーカーウェブサイトのガイドに従って、BIOSを更新します。一般的には、USBメモリにBIOSファイルを保存し、PCを起動してBIOSメニューに入り、そこから更新ツールを実行する手順が多いです。最近のマザーボードには、OS上から更新できるツールや、電源を入れるだけで特定のUSBポートから更新できる機能(ASUSのBIOS Flashbackなど)もあります。
- BIOS更新後: BIOSの設定が工場出荷時のデフォルトに戻ることがあります。もしカスタマイズした設定(ブート順、ファン設定など)がある場合は、再度設定し直す必要があります。また、後述するオーバークロック設定やXMP/DOCPプロファイルがリセットされていることを確認してください。
-
システムファイルチェッカー (SFC) と DISM を実行する:
- Windowsのシステムファイル自体が破損している場合、ハードウェアエラーと似た症状を引き起こすことがあります。これらのコマンドは、システムファイルの整合性をチェックし、必要に応じて修復します。
- 管理者権限でコマンドプロンプトまたはPowerShellを起動します。
- まず、DISMコマンドを実行します。これはWindowsイメージを修復し、SFCが参照するファイルを正常な状態に戻すのに役立ちます。
DISM /Online /Cleanup-Image /RestoreHealth - 処理が完了したら、SFCコマンドを実行します。
sfc /scannow - コマンドの完了を待ち、結果を確認します。システムファイルが見つかった、または修復された場合は、PCを再起動して症状が改善するか確認します。
ステップ3:ハードウェア診断とテスト
ソフトウェア・ファームウェアの問題を排除したら、次に具体的なハードウェアの診断に移ります。これは原因特定のための最も重要なステップですが、時間がかかる場合があります。
-
オーバークロック設定を無効にする:
- CPU、メモリ、GPUのオーバークロックは、WHEA UNCORRECTABLE ERRORの非常に一般的な原因です。たとえ以前は安定していた設定でも、ハードウェアの経年劣化や温度変化などで不安定になることがあります。
- BIOS/UEFI設定に入り、CPUのクロック倍率、バススピード、電圧設定、メモリのXMP/DOCPプロファイル、GPUのオーバークロックツール(MSI Afterburner, ASUS GPU Tweakなど)による設定をすべて無効にし、工場出荷時のデフォルト設定に戻してください。
- デフォルト設定でシステムが安定して動作するか確認します。もしデフォルト設定で安定するなら、オーバークロック設定が原因であった可能性が極めて高いです。安定性を取り戻したい場合は、オーバークロックを諦めるか、より控えめで慎重な設定を、徹底的な安定性テスト(後述)を行いながら探し直す必要があります。
-
ハードウェアの温度を確認する:
- 過熱はハードウェアエラーの直接的な原因となります。CPUやGPU、マザーボードの温度を監視します。
HWiNFO64、Core Temp、MSI Afterburner(RivaTuner Statistics Serverと連携) といったハードウェア監視ツールをインストールします。- アイドル時と、CPUやGPUに負荷をかけた際(ゲーム、ベンチマークなど)の温度を確認します。
- CPU: 一般的に、アイドル時で30℃~50℃、負荷時で70℃~90℃程度が目安です。90℃を超える、特に100℃に近づく場合は明らかな過熱です。
- GPU: アイドル時で30℃~50℃、負荷時で60℃~80℃程度が目安です。90℃を超える場合は過熱の可能性が高いです。
- マザーボード (特にVRM): 負荷時でも60℃~80℃程度が望ましいです。90℃を超える場合はVRMの過熱が考えられます。
- 温度が高い場合は、PC内部の清掃(特にファンやヒートシンク)、ケースファンの追加や配置見直し、CPUクーラーの交換、熱伝導グリスの塗り直しなどを検討してください。
-
メモリ(RAM)の診断を行う:
- メモリの問題はWHEAエラーの一般的な原因の一つです。メモリ診断ツールを使用して、エラーがないか徹底的にテストします。
- Windowsメモリ診断: Windowsに標準搭載されているツールです。検索バーに「メモリ診断」と入力して起動し、「今すぐ再起動して、問題の有無を確認する(推奨)」を選択します。PCが再起動し、メモリテストが実行されます。テスト完了後、Windowsが起動したら、イベントビューアーの「Windowsログ」>「System」で、Sourceが「MemoryDiagnostics-Results」となっているイベントを探し、テスト結果を確認します。
- MemTest86: より強力で信頼性の高いメモリ診断ツールです。USBメモリからPCを起動してテストを実行するため、Windows環境に依存しません。MemTest86の公式ウェブサイトからツールをダウンロードし、別のPCでUSBメモリに書き込みます。テスト対象のPCにUSBメモリを挿入し、USBから起動するようにBIOS設定を変更します。
- MemTest86を実行する際は、最低でも4パス(Pass)以上行うことを強く推奨します。1パスでは検出されないエラーが、複数パスで検出されることがあります。エラーが検出された場合、どのメモリモジュールに問題があるか特定するために、以下の手順を試します(複数のメモリモジュールを搭載している場合)。
- すべてのメモリモジュールを取り外し、1枚だけをマザーボードのマニュアルで指定されているプライマリスロットに挿入します。
- その状態でMemTest86を実行します。エラーが検出されなければ、そのモジュールとスロットは正常である可能性が高いです。
- テスト済みのモジュールを取り外し、別のモジュールを同じスロットに挿入してテストします。これをすべてのモジュールで繰り返します。
- 次に、問題ないと判断されたモジュールを1枚だけ挿入し、別のメモリスロットに順番に挿入してテストします。これにより、特定のメモリスロットに問題がないかを確認できます。
- もし特定のモジュールでエラーが頻繁に発生する場合、そのモジュールが故障している可能性が高いです。交換が必要です。複数のモジュールでエラーが出る場合は、マザーボードのメモリスロットまたはメモリコントローラー(CPU内部にある場合が多い)に問題があるか、互換性、電圧設定の問題が考えられます。
- XMP/DOCPプロファイルを使用している場合は、一度無効(Autoまたはデフォルト)にして、メモリの定格速度でテストしてみてください。定格速度で安定するがXMP/DOCPでエラーが出る場合、プロファイル設定が不安定であるか、メモリまたはCPUがその設定に耐えられない可能性があります。
-
CPUのストレステストを行う:
- CPU自体、またはCPUへの電力供給(マザーボードのVRMやPSU)に問題がないか確認するために、CPUに高い負荷をかけるストレステストツールを使用します。
- Prime95: CPUの演算機能に非常に高い負荷をかけます。Small FFTsテストはCPUのキャッシュを、Large FFTsテストはCPU全体とメモリを、BlendテストはCPUとメモリに様々な負荷をかけます。Blendテストは特にWHEAエラーの原因となりやすいメモリコントローラーやCPUキャッシュのエラーを検出するのに有効な場合があります。テスト中にWHEAエラーが発生しないか、温度が異常に上昇しないか監視します。
- IntelBurnTest / OCCT: これらもCPUに高い負荷をかけるツールです。OCCTはCPUだけでなく、GPUやPSUのテストモードも備えており、ハードウェア監視機能も充実しています。OCCTのCPUテスト(特にLarge Data SetモードやAVX対応モード)はCPUの安定性チェックに非常に強力です。
- ストレステストは、数時間(最低でも30分~1時間)連続して実行し、WHEAエラーが発生しないか、あるいは温度が異常に上昇しないかを確認します。テスト開始後すぐにエラーが発生する場合、CPU、マザーボード、PSUのいずれかに深刻な問題がある可能性が高いです。
- テスト中に温度が問題ない範囲に収まっているにも関わらずエラーが発生する場合、CPU自体の劣化/故障、電圧供給の不安定さ、またはマザーボードのVRMやチップセットの問題の可能性が高まります。
-
ストレージデバイス(SSD/HDD)の診断を行う:
- ストレージデバイスの健康状態を確認します。
- CrystalDiskInfo: ストレージのS.M.A.R.T.情報を簡単に確認できるツールです。健康状態が「正常」以外(注意、危険)と表示されている場合、ドライブに問題がある可能性が高いです。代替処理済のセクター数、回復不可能セクター数、CRCエラーカウントといった項目に異常がないか確認します。
- メーカー純正診断ツール: SSDやHDDのメーカー(例: Samsung Magician, Crucial Storage Executive, Western Digital Dashboard, SeaToolsなど)が提供している診断ツールがあれば、それを使用して詳細なテストを実行します。
- CHKDSK: Windowsに標準搭載されているファイルシステムおよびディスクエラーチェックツールです。管理者権限でコマンドプロンプトを開き、
chkdsk C: /f /r(Cドライブの場合) を実行します。次回起動時に実行されるようにスケジュールされます。ファイルシステムのエラーや物理的なバッドセクターを検出・修復しようとします。ただし、ストレージ自体の物理的な故障を完全に診断するツールではありません。 - ストレージに異常が見られる場合、重要なデータをすぐにバックアップし、ドライブの交換を検討してください。
-
電源ユニット(PSU)をテストする:
- PSUの故障や電力不足は、システム全体の不安定化、特に高負荷時のエラーの原因となります。PSUのテストは他のコンポーネントよりも難しい場合があります。
- 電圧監視: マザーボード付属の監視ユーティリティやHWiNFO64などのツールで、+12V, +5V, +3.3Vの各ラインの電圧を監視します。電圧が仕様から大きく外れている(±5%以上など)場合や、負荷がかかった際に大きく変動する場合は、PSUの不安定さが疑われます。ただし、ソフトウェアでの監視は必ずしも正確でないことに注意が必要です。
- PSUテスター: 安価なPSUテスターを使用すると、各ピンの電圧が出力されているか簡易的に確認できますが、これはPSUが高負荷時に安定した電圧を供給できるかをテストするものではありません。
- 負荷テスト: CPUストレステスト(Prime95, OCCT)とGPUストレステスト(FurMark, Unigine Heaven/Superposition)を同時に実行することで、システム全体に高い負荷をかけ、PSUの能力をテストできます。OCCTにはPSU専用のテストモードもあります。テスト中にエラーが発生したり、電圧が不安定になったりする場合、PSUの電力不足または故障が疑われます。
- 代替PSUとの交換: 最も確実なテスト方法は、容量が十分で動作が確認されている別のPSUに交換してみることです。交換後にWHEAエラーが発生しなくなる場合、元のPSUが原因であった可能性が高いです。PSUの交換は、PCのすべてのコンポーネントに接続されている多数のケーブルを扱うため、PC内部作業の中でもやや難易度が高い部類に入ります。
-
マザーボードの問題を特定する:
- 上記のテストでCPU、メモリ、ストレージ、PSUに異常が見られない場合、マザーボード自体に問題がある可能性が高まります。マザーボードのVRMの故障、チップセットの故障、PCIeスロットの不良などが考えられます。
- マザーボードの故障は、特定の診断ツールでピンポイントに特定するのが困難な場合があります。外見上の損傷(コンデンサの膨張や液漏れ、焦げ付きなど)がないか目視で確認します。
- 原因がマザーボードであると強く疑われる場合、他のコンポーネント(特にCPUとメモリ)が正常であることを確認した上で、マザーボードの交換を検討する必要があります。これはPCの主要パーツ交換となるため、専門的な知識と技術が必要となります。
-
周辺機器を外してみる:
- 外付けのUSBデバイス(特にハブ、サウンドカード、キャプチャーボードなど)や、内部に増設した拡張カード(サウンドカード、ネットワークカードなど)が原因で、システムバスに干渉しWHEAエラーを引き起こすことがあります。
- 必要最低限のデバイス(キーボード、マウス、モニター)以外、すべての周辺機器を取り外してPCを起動し、安定するか確認します。
- 安定する場合、取り外した周辺機器のいずれかが原因です。一つずつ再接続して、どのデバイスで問題が再発するか特定します。
- 内部の拡張カードも同様に、一度取り外して確認してみる価値があります。
ステップ4:最終手段と予防策
上記のステップで原因が特定できなかった場合や、ハードウェア交換が必要になった場合の対応、そして今後の予防策について説明します。
-
Windowsのシステム復元またはリフレッシュ/クリーンインストール:
- ハードウェアの問題と断定する前に、OS側の問題を完全に排除するための最終手段として、Windowsのシステム復元またはリフレッシュ/クリーンインストールを検討します。
- システム復元: エラーが発生するようになった時期よりも前の復元ポイントに戻すことで、システムファイルの破損やドライバーの変更が原因であった場合に問題を解決できる可能性があります。「システム復元」を検索して起動します。
- PCをリフレッシュ/初期状態に戻す: 個人用ファイルを保持したままWindowsを再インストールするオプションです。「設定」>「更新とセキュリティ」>「回復」から実行できます。これにより、OSのシステムファイルやドライバーがクリーンな状態に戻ります。
- Windowsのクリーンインストール: ディスクをフォーマットし、Windowsをゼロから再インストールします。最も確実な方法ですが、すべてのアプリケーションを再インストールし、データを復元する必要があります。事前に必ず必要なデータのバックアップを行ってください。
-
ハードウェアの交換:
- 診断の結果、特定のハードウェア(CPU、メモリ、マザーボード、PSU、ストレージなど)の故障が強く疑われる場合は、そのパーツを交換する必要があります。
- 保証期間内であれば、メーカーや購入店に連絡して修理または交換を依頼します。
- 保証期間外の場合、新品のパーツを購入して交換するか、PC修理業者に依頼することになります。パーツの交換は、特にCPUやマザーボード、PSUはPCの組み立て知識が必要になります。
-
専門業者への依頼:
- ご自身でのトラブルシューティングやハードウェア交換に自信がない場合、あるいはここまでの手順を試しても解決しない場合は、PC修理の専門業者に依頼することを検討しましょう。プロの技術と設備があれば、原因特定と修理をより確実に行えます。
-
WHEA UNCORRECTABLE ERRORの予防策:
- 一度解決しても、将来再び発生する可能性を減らすために、以下の予防策を講じることを推奨します。
- 適切な冷却: PCケース内のエアフローを確保し、CPUやGPU、マザーボードの温度が適切に保たれているか定期的に監視します。必要に応じてファンを追加したり、クーラーを高性能なものに交換したりします。PC内部の清掃を定期的に行い、ホコリを取り除きます。
- 安定した電力供給: 品質が高く、システムの最大消費電力に対して十分な容量を持つ電源ユニットを選びます。可能であれば、瞬断や電圧変動からPCを保護するためにUPS(無停電電源装置)の使用を検討します。
- 過度なオーバークロックを避ける: オーバークロックを行う際は、十分な知識を持ち、電圧を過度に上げすぎず、徹底的な安定性テストを行ってください。安定しない場合は設定を下げるか、無効にすることをためらわないでください。
- ドライバーとBIOSの適度な更新: 最新版が常に最良とは限りませんが、重要なバグ修正や互換性向上が含まれている場合は更新を検討します。ただし、更新前には変更内容や既知の問題を確認し、慎重に行います。
- 信頼できるメーカーのハードウェアを選択: 安価すぎる、無名のメーカーのパーツは品質が安定しない場合があります。主要なPCパーツメーカーの信頼性の高い製品を選ぶことで、ハードウェア自体の初期不良や早期故障のリスクを減らせます。
- 定期的なハードウェア診断: MemTest86やストレージ診断ツールなどを定期的に実行し、ハードウェアの異常を早期に発見するよう努めます。
- S.M.A.R.T.情報の監視: CrystalDiskInfoなどのツールでストレージのS.M.A.R.T.情報を定期的に確認し、「注意」や「危険」の兆候が見られたら、重要なデータをバックアップし、早期の交換を計画します。
- 一度解決しても、将来再び発生する可能性を減らすために、以下の予防策を講じることを推奨します。
まとめ:諦めずに、系統立てて対処しよう
WHEA UNCORRECTABLE ERRORは、確かにPCのハードウェアに起因する深刻なエラーです。しかし、その多くは原因を特定し、適切な対処を行うことで解決可能です。
このエラーに遭遇したら、まず慌てずに、エラーコードやイベントログから手がかりを探しましょう。次に、オーバークロックの無効化、温度確認、ドライバー・BIOSの更新といった比較的簡単なソフトウェア・ファームウェアからのアプローチを試します。それでも解決しない場合は、メモリ診断、CPUストレステスト、ストレージ診断、PSUテストといったハードウェア診断を系統立てて実行し、問題のあるコンポーネントを特定していきます。
原因が特定できれば、そのパーツを交換することで問題は解決するはずです。原因特定が難しい場合や、ハードウェア交換に自信がない場合は、迷わず専門業者に相談してください。
PCの安定性は、ハードウェア、ファームウェア、OS、ドライバーといった様々な要素が組み合わさって成り立っています。WHEA UNCORRECTABLE ERRORは、その中でも最も根幹に近いハードウェアレベルでの不協和音を示しています。本記事で紹介した手順を参考に、一つずつ可能性を潰していくことで、きっと解決の糸口が見つかるはずです。根気強く、そして安全にトラブルシューティングを進めてください。
安定したPC環境を取り戻し、快適なデジタルライフを送れるようになることを願っています。