PCの不調の切り分け

PCの調子が悪いとき、それがハードウェアの故障によるものか、そうではなくOSの再インストールで復旧するのか、切り分けたいときがある。実際に再インストールしたら切り分けられるが、できればその手間を掛けずに切り分けたい。

なお、この記事では、オーバークロックは想定していない。
「メーカ製PCを買ってそのまま使い続けていたら不調になった」という、身の回りで一番あり得るパターンを念頭に置いている。

PCメーカ独自のハードウェア検査ツールを使う
「Diagnostic」などと言われているツールを使う。

利点

ツールが標準装備であれば、簡単に実行可能

欠点

汎用的では無い。そういったツールがあるかはメーカ、機種次第。
個人的な経験として、この手のツールで診断してエラー無しで、OS再セットアップしても不調が継続した、というパターンもあるので、あんまり信用できないかもしれない。

商用の検査ツールを使う
おそらくあると思うが、個人で気軽に利用できる金額では無いのだろう。
フリーのツールを使う

利点

フリー

欠点

それなりに手間とスキルが必要。


以下にフリーのツールを列挙する。具体的な使い方はググること。

Prime95(CPU、メモリ周り)

オーバークロッカー御用達のため、ググるオーバークロックを前提とした記事が多くヒットするが、定格動作の場合は以下のような感じの判断基準でよいと思う。

Prime95の起動時のデフォルト(Blend)でテスト

一般に数時間以上テストすることが望ましいらしいが、本当に不調なPCだと数秒から数分でFATAL ERRORが出るのでまずはその程度持つかどうかで切り分けられるかもしれない。
エラーが出た場合は間違いなく何らかの問題がある。しかし、これだけではハードウェアの問題とは言い切れないようだ。

デバイスドライバに起因する障害

Prime95がエラーを出す原因として、デバイスドライバが考えられる。全てのデバイスを外しセーフモードで起動してPrime95を実行してどうなるか?
それでエラーが出ない場合、ハードには異常が無い(かもしれない)。エラーが出た場合、Memtest86でもテストし、それでエラーが出た場合はメモリが怪しい。Memtestが異常ない場合はCPUやマザーボード、あるいは電源が怪しい。(しかし、CPUが壊れることは滅多に無い。マザーボードコンデンサは劣化しやすい)

2018/1/12 追記
Microsoft Message Analyzerを導入した環境にて、Prime95実行時にエラーが発生する事例を確認。同時にイベントログにstunnelのエラーが大量に出力されていた。
アンインストールすると改善したため、Message Analyzerが原因なのは確実だが、環境依存なのかは不明。

Memtest86(メモリ)

日常用途で不安定になっているような事象について本当にそれがメモリ起因なのを調べるのであれば、1周だけで充分だと思う。
メモリ自体が壊れることはあんまり無いらしい(つまりメモリの相性問題の洗い出しが主用途)ので、メーカ製PCでメモリ交換、増設をしてない場合はあんまり意味が無いかも。

ddコマンドでゼロフィル(ディスク)

ディスク全領域に「書き込めること」を確認する。ブロックサイズは適切な大きさにすること(時間が掛かるため)。回数は1回でよい。
もちろん、全データが消去されるので、バックアップ必須。OS再インストール直前に、念のために行っておく、といった位置づけか。
なお、最近のメーカ製PCはディスク上にリカバリイメージを配置している場合が多いため、あらかじめリカバリメディアを作成しておくこと。

負荷を掛けて検査する、という行為について

高負荷を掛けるのに特化したツールとはいえ、一ソフトウェアを実行した結果ハードウェア自体が故障することは滅多に無いしむしろあってはならない(定格動作の場合)。もし高負荷を掛けた結果故障したというのであれば、それは元々壊れかけだったというわけで、少し寿命を早めただけと言える。データのバックアップだけは取っておく必要があるが、必要以上に故障することを危惧しても仕方ない。むしろ、壊れかけのPCを使い続ける方がストレスが増え生産性が落ちるとも考えられる。
※個人の見解です

参考

BSODs and Prime95 failures - Super User http://superuser.com/questions/109738/bsods-and-prime95-failures