最近、自宅サーバーを新しいケースに移植するという難しいプロセスを経て、それに伴い、さらにストレージをインストールすることにしました。単なるストレージではなく、中古のエンタープライズ SAS ドライブと、eBay で 40 ドルで見つけた LSI カードを備えたものでした。私はこれらのドライブに関する実際的な経験がほとんどなく、この方法を選択することで、潜在的に苦痛を伴うトラブルシューティングに取り組むことになることはわかっていましたが、修正されるとは予想していませんでした。ハードウェアの問題に対してソフトウェア ソリューションを数時間費やした後、電気テープの形でヘイル メアリーを特定の PCIe ピンに投げました。それは私が必要としていた奇跡的な解決策でした。

HBA カードをまだお持ちでない場合は、HBA カードをホーム サーバーに追加すると便利です。
ストレージを追加するための信頼できる方法
電気が最初の問題だった
これは良い初期症状ではありませんが、信じられないほど明らかな症状でもありません。
最初に遭遇した問題は実際には問題ではありませんでしたが、心強いものでもありませんでした。 HBA カードが取り付けられた状態でコールド ブートが試行されるたびに、システムは過電流になり、最終的に再起動するまでに何度も電源を入れ直します。これは心強いことではありませんが、同時に、私の 650W PSU は補助電源なしで 2 台の SAS ドライブと 1 枚の HBA カードを処理できるはずです。これは今後の事態の最初の兆候であり、残りのトラブルシューティングの取り組みを台無しにすることになります。私の PSU が実際に原因かどうかはわかりませんでした。かなり古いもので、間違いなく交換できるのですが、できるだけ早くこのシステムを稼働させたかったので、時間がありませんでした。

余った PCIe スロットを退屈なことに使用したところ、それが私のお気に入りの PC アップグレードになりました
これで最大のネットワーク問題が解決しました
HBA オプション ROM が次のハードルでした
あるいはそう思いました
システムが実際に起動すると、起動後の BIOS スプラッシュ画面をスキップして LSI カードの ROM に直接進み、ドライブ数が表示され、カードが機能していると報告され、構成メニューに入ることができます。 Proxmox で起動しようとすると、次の BIOS スプラッシュ画面でフリーズします。ハードクラッシュやエラーはなく、完全にロックアップするだけです。
このため、システムがそこから起動しないように、カードからオプション ROM を消去する必要があるのではないかと考えました。最初に CSM を無効にして、システムが ROM から起動しようとするパスをブロックしようとしましたが、何も機能しませんでした。おそらく CMOS バッテリーが切れたため、BIOS 設定が起動間で適切に機能しませんでした。
ROM を消去するために、カードをフラッシュするためにさまざまな方法を数時間実行する必要がありましたが、最終的に機能したのは 1 つだけでした。フラッシュ ツールは、修正された EFI シェルと sas2flash を介して ROM をクリアするまで、4 つの異なる環境で苦労しました。 SAS アドレスを使用してカードを再フラッシュし、再起動しました。スプラッシュ画面が表示され、停止しました。 絶対に 同じ場所です。振り出しに戻る。

N100 Mini PC はホームサーバー用として Raspberry Pi を静かに上回る
Raspberry Pi ホームサーバーが廃止されました。その理由は N100 です
HBA カードで実際に何が起こっていたのか
これはあなたにも起こるかもしれません
ここで実際に何が起こっていたのか。 PCIe スロットには、誰もが思い浮かべる高速データ レーンとともに、SMBus と呼ばれる小さくて遅いサイドチャネルが隠されています。これは管理バスであり、データを転送するためではなく、センサーの読み取りやカードの識別などのハウスキーピングのために存在します。
HBA とマザーボードの両方が POST の最初の瞬間にそのバスを使用しようとしていたため、お互いにひどく衝突し、ブート全体が停止してしまいました。これは、すべてのカードとマザーボードの組み合わせで発生するわけではありませんが、消費者向けマザーボードの一般的な LSI カードではよく発生します。私のワークステーション PC は、カードを取り付けても問題なく起動します。 実際には Art of Servers の非常に有益なビデオを見つけるまで、私は混乱していました。このビデオでは、特定のカード用のテープ MOD が示され、私が経験した障害モードが説明されていました。
私は何を失う必要がありましたか?他のすべてが機能しなかったので、電気テープを取り出し、非常に小さなストリップを切り取り、説明されているピンにテープで貼り付けたところ、LSI カードと SAS ドライブが検出された状態で Proxmox が起動されました。
それが機能する理由は非常に簡単です。コネクタ上の 2 つの SMBus ピン (位置 B5 と B6) は、PCI-SIG によってオプションとして定義されており、アドイン カードがハングした場合には必須の動作はありません。カード上のこれら 2 つのピンをカバーするだけで、起動時の競合が解決されます。これを行うにはカプトンテープが推奨されますが、効果を高めるために通常の電気テープを使用しました。

自宅研究室用に中古の Nvidia Tesla GPU を購入するところだったので、所有者が実際に何をしているかを読んだ
VRAM を考慮すると Tesla カードが最もお得ですが、その他の点で少し面倒になります
続行する前に、時間をかけてハードウェアの仕様を読んでください。
購入した LSI カードについてもう少し調べていれば、この話全体は避けられたかもしれません。私はドライブについて多くの調査を行っており、何が起こるかを知っていましたが、このような潜在的な癖について十分な事前調査を怠っていました。この問題は非常に一般的なものなので、トラブルシューティングに何時間も費やす必要がなくなりました。それでも、NAS に SAS ドライブを選択したことを今でも後悔していません。HBA により、将来的には安価なエンタープライズ ストレージを使用できる十分なスペースが得られるからです。









Leave a Reply