本回はHDD故障時にどのような対応が必要なのか調べていきたいと思います。
TrueNAS-13.0-U3.1
現在の構成
現在はプールをHDD2台でMirorし構成しております。
Mirorなので1台が故障すれば交換で問題ありませんが2台が駄目になれば終わりです。
ファイルサーバーのバックアップは別に必要になります。
1台を故障させる
流れとしては単純に通電不可になったとしてHDDを1台外して起動します。
HDDが死んでる場合の管理画面上での操作をやってみます。
公式ドキュメントの手順では「故障したHDDをオフラインにしてから新HDDを接続しリプレイスメントで新HDDをメンバーに加える」だそうです。これで自動的にresilverが走りステータスが健康状態へと移行します。
HDDを外して起動
管理画面上の確認
ログインして管理画面を開くと右上の鈴のマークの箇所と、Poolのセクションで違いが見られます。
鈴のマークはお知らせ機能のようでクリックして開くと日時はマスキングしていますが下記のような通知が記載されています。要はプールがDEGRADED状態ですよと教えてくれています。
ちなみに他の通知は「Dismss」または「Dismss All Alerts」をクリックすると消えますが、DEGRADEDの通知は消えずにグレー表示になりますが残ります。
次にプールの状態を見てみます。Poolセクションの右側緑枠内の「>」をクリックするとステータスが順番に見れます。ada0がONLINEで「ada1」が行方不明ですね。
ストレージ[Storage]/Pools
ギアマークをクリックして「Status」を選択しプールステータスを確認します。
HDD交換
前準備
システムを停止する前に故障HDDをオフラインにします。
ストレージ[Storage]/Pools/Pool Status
「Status」が「UNAVAIL」と表示されているHDDの「︙」をクリックし「Offline」を選択。「Status」が「Offline」と切り替われば電源を落とします。
一応マザーボードはホットプラグ設定にしているので活線挿抜できそうですが、とりあえず今回は電源を落としてHDDを交換します。
交換
故障HDDを新HDDへ交換し電源を投入します。
確認
ストレージ[Storage]/Pools/Pool Status
とりあえずプールの状態を確認。電源を落とす前と同じく「Offline」表記があります。
ストレージ[Storage]/ディスク
次にディスクを見ます。「Pool」「tank」に属していない「ada0」HDDが今回交換したHDDです。
起動時に名称が入れ替わって起動前は「ada1」でしたが起動後は「ada0」です。間違えないように記憶します。とはいえ後の選択肢には「ada1」は出てこないので安心です。
これを「tank」へ追加します。
交換
ストレージ[Storage]/Pools/Pool Status
Pool Statusで「Offline」になっているHDDを「Replace」選択します。MemberDiskを選ぶようになるので先程確認した「ada0」を選択して「Force」にチェックを入れて「Replace Disk」をクリックします。これ以降は自動でresilverまで走ります。
自動で追加作業が始まります。
追加作業が終わると完了ダイアログの表示と共にresilverが始まります。完了ダイアログは「閉じる」で消しておきましょう。容量にもよりますが今回はそんなに容量も追加していないので数分で終わりました。
無事resilverも完了し「ada0」HDDは「ONLINE」表記へ変わりました。
管理画面トップページのPoolセクションも見てみましょう。正常にプールへHDDが追加できたようです。共有されているデータももちろんそのまま無事に存在しています。
最後に
今回はHDDが故障時の作業の流れをやってみましたが、簡単に迷うこともなく交換からresilver(再構築)までが出来ました。WEBGUIがあるのでおそらくマニュアル化すれば一般の人でも交換作業は出来てしまいそうです。
QNAPでは交換時にビープ音が鳴ったりするのでびっくりします。設定でOFFにも出来ますが、OFFのままだと他のイベント時にも鳴らなくなってしまうので困りものです。設定を戻す作業もHDD交換とはあまり関係のない工程になってしまうので忘れがちです。本当に周りに配慮が必要な音量で鳴るのでTrueNASの無音交換は少し魅力的ですね。
TrueNAS本当によく出来ていて、ハードウェアの知識(自作PC程度)あれば市販のNAS製品はもう必要ないレベルに思えます。ただベースがFreeBSDというOS用なのが若干懸念点でしょうか、LINUXならクラウドやサーバーで触る機会も多いですがFreeBSDは触る機会が無いです。FreeNASから続く実績のあるTrueNASなのでファイルサーバー程度であればそもそも市販NASだって用意されたGUI以外は触れることないでしょうから問題ありませんが、今回はCPU的にまだ余裕ありそうなので仮想化も……なんて考えると影響してくるところではあります。
もう少し遊んでみたいのでまだ続きます。
参考リンク
HDD故障時の公式ドキュメント(英語ですが最近のブラウザは翻訳機能がついて便利ですね)