サーバー機のディスク障害でブルースクリーン

  • 投稿日:
  • by
  • カテゴリ:

7/30にOSを入れたSSDをPM953に交換したばかりなのに、昨日の朝起きてきたら、サーバーの電源が落ちて静かになってました。電源入れても0xc000000eのブルースクリーンで、必要なファイルが読み込めないっていうエラーで起動しません。

SSDの故障を一瞬疑いましたが、交換した時点でヘルスは100%だったので、恐らくSSDは白でしょう。電源を入れても、SSDを乗せたPCI-eのボード上のLEDが点かなかったので、故障の原因はnvmeのアダプターカードだと判断し、即座にAmazonで注文しての今日というわけです。

IMG20230907195434.jpg

この判断に行きつくまでの流れとしては、

  1. 古いSSD(950 PRO)に交換しても同じエラーで起動しないこと
  2. 別のPCI-eのnvmeアダプターだったら若干状況が違っていること(それでも起動はせず)
  3. EFIの再構築を行ったら、古いSSDでは起動できたこと

という感じです。

結局のところ、EFIは破損してしまっていたので、Win10インストール用のUSBメモリーで起動してコマンドプロンプトから修復する必要があったわけですが、アダプターが破損していることも確かなので、一旦は256GBのSSDで起動して、代わりのアダプターの到着を待ちました。

ベストなのは、直前まで動いていたSSDでそのまま起動できることでしたが、しばらくもがいてもそれはできなくて、2枚あるうち、2年くらい前の古い950 PROだけが起動できたので、それをベースにシステムを再構だ築することで対処せざるを得ませんでした。この950 PROは、恐らく昔使っていた第2世代Xeonのときのもので、チップセットドライバーが全然合っていませんでした。
てっきり7/30に交換した950 Proだと思っていたのが、それ以外にも持っていたとはすっかり記憶から消えていて。

ただ、起動ドライブにはMy Documentsやダウンロードフォルダーも含めて何も入ってなくて、OSと最低限のアプリだけがインストールされているので、VMWareやThunderbirdをバージョンアップする程度で最新の構成と同じくらいまで復旧できたのが幸いでした。

256GBのSSDで環境を整備して、改めてminitoolのShadowMakerを使ってPM953にドライブの中身全部をコピーして復旧完了です。
アクセス時のLEDくらいしかボード上に回路が見当たらないのに、まさかあんなものが壊れるとは思ってもみませんでした。たった1カ月半で破損って、どういうこと?

IMG20230907212907.jpg

今回の障害をきっかけに、このサーバーを維持するのはやめようかとも思っていて、DELLの7920か、HPのZ6 G4あたりのSkylake、Cascade Lake世代の出来合いのワークステーションに目を付けています。Cascade LakeであればWin11に対応しているので。
Intel CPUでmac OSのエミュレーションはBig Surくらいまでが限界なので、ARMベースのmacはmac miniでも買ったほうが簡単でしょう。VMWareにパッチを当て続けるのも終わりってことで。