SupermicroにおけるRedundant電源の冗長性

目次

冗長化とは?

サーバーは、停止してしまうと、業務が止まるなどの損害が発生してしまうため、一般家庭にあるパソコンやスマホなどの電化製品と異なり、業務内容が許す妥当な範囲で、可能な限り止まらないこと、つまり高可用性が求められます

では壊れても動作し続けるためにはどうしたらよいでしょうか?簡単なのは、予備の部品を内蔵しておくことです。壊れやすい部品を予め複数内蔵しておけば、壊れても正常な部品で動作し続けることができます。このような、本来必要な数以上の部品を搭載することで信頼性を高める工夫を冗長設計とか冗長化といいます。「冗長」とは無駄のあるという意味です。予備部品を含める設計は壊れるまでは無駄になってしまうので冗長だという訳です。
このような理由から、冗長する場合にはコストを抑えるため「寿命部品」を中心に冗長させることが多いです。「寿命部品」というのは、使っているといずれ必ず壊れることが予めわかっている、寿命が存在する部品のことです。例えばFANは寿命部品です。FANをスムーズに回転させるために必要な油であるグリスが、空気中の酸素と結合し、徐々に酸化することで、硬くなってきます。なめらかだったグリスはやがて硬くなり、FANをスムーズに回転させる機能を失った時点で軸が回転しなくなります。
これを固着といいます。FANが回転しなくなれば空気を送れなくなり、この時点でFANの故障となります。これは防ぐことが困難です。酸素が原因とはいえ、酸素が無い環境でサーバーを使う訳にはいかないからです。そこで、縦にFANを2つ直列に並べる方法を採ります。こうすれば片方のFANが壊れても、残りのFANで風を送り続けることができますし、風が逆流してしまうこともありません。こうして1個のFANで耐えている間に予備部品を用意し、準備ができたら交換します。FANは有寿命部品ですから対策を取っておくことは効果的ですし、部品単価で考えるとFANはCPU等に比べて安いので経済合理性があります。このためFANについてはこのような方法が取られるのです。
HDDも寿命部品です。高速回転する円盤や、円盤を回すためのモーター、円盤の上を動きデータを読み書きするヘッドなどの部品など、物理的に稼働する機械構造のある部品が多数あるため壊れやすいのです。このため、壊れても問題ないようRAID1やRAID5/6などを構成します。RAID6ならHDDが2台壊れても動作を維持できます。RAIDはレベルに応じたHDDの故障に耐える冗長性を与える技術です。

冗長電源とは?

電源も寿命部品です。電源は前述のFANの他にも、有寿命部品である大型の電解コンデンサーを含みます。電解コンデンサーは化学変化によって電気を蓄える部品で、電解液が枯渇するなど、物理的な寿命があります。長時間使っていると温度に依存して電解液が無くなったり、静電容量抜けを起こし、性能が維持できなくなったります。このようにコンデンサーが故障すると、安定した電圧が出力できなくなり、電源の故障となります。

ここでは電源ユニットを複数搭載して電源ユニットの偶発故障や寿命による劣化での故障が発生した場合でも予備側の電源が動作することで継続稼働を可能にする「冗長電源」という構成について解説します。特に、冗長構成の場合に複数の電源ユニットをまとめた場合の出力などは複雑なので、この点を特に詳しく解説します。

Redundant/冗長とは?

Redundant、は、直訳では過剰、余剰、冗長といった意味合いになります。電源の場合は「冗長」と翻訳します。冗長電源というのは、RAIDやHDDでいえばホットスペアのようなもので、電源が入った状態で待機している予備電源のことです。予備なので、仮に本番系の電源が壊れた場合、冗長電源が刺さっている配電基板 (PDB) が異常を検知し、即座に予備系の電源ユニットに切り替えを行います。このような動作をすることで電源ユニットの可用性を高めています。

冗長電源の1+1とか2+2とか2+1はどういう意味か?

これは、

  • 前の数字が実際に稼働している電源の数
  • 後の数字が冗長(予備)側の電源の数

になります。

冗長電源の出力の考え方

1+1の冗長の場合、電源出力は1個分です。仮にその電源が1個1000Wの出力なら、冗長電源自体の最大出力も1000Wです。
2+1もしくは2+2なら、前半の数が2なので、2個の電源ユニットの合計出力が冗長電源としての出力になります。仮に1個1000Wの電源で構成した2+1の冗長電源ならば、1000Wが2個合わさった出力になるので、2000Wが冗長電源全体としての出力ということになります。

消費電力が冗長電源の最大出力を越える場合はどうなるか?

Supermicroの場合、冗長を失う代わりに動作を継続するという動作をします。このような動作をcombine(コンバイン)とか2+0と表現します。

例えば2電源での動作を考えてみます。1個1000Wの電源ユニットで構成された1+1、つまり合計2電源での冗長電源であれば、1000Wまでは1+1なので1電源冗長です。1000Wを越え、2000Wまでであれば、1000Wの2つの電源が共同して電力を供給するため、2000Wまでは冗長無しになる代わりに動作は可能です。予備電源が0個になるので、「2+0の動作」という訳です。もちろん、2000Wを越えると、給電ができなくなりますのでシャットダウンします。

次に3電源での動作を考えてみます。1個1000Wの電源ユニットで構成された2+1、つまり合計3電源での冗長電源の場合、2000Wまでは冗長です。2000Wを越えた場合には冗長を失いますが3000Wまでは出力が可能です。PDBがそのように動作してくれるように設計されているからです。3000Wを越えると通常の電源同様に出力できなくなるため、安全回路が働きます。つまり、突然電源が切れるなど、サーバーとして動作の継続ができなくなります。

冗長性の維持の具体例(7049GP-TRTの場合)

7049GP-TRT

特に人気のある7049GP-TRT(電源PWS-2K20A-1Rを2台搭載した 1+1 のシステム)における電源電圧と冗長性の関係を表にまとめました。

 

コンセントの電圧 電源1台あたり
の最大供給電力
電源2台の合計
最大供給電力
システム全体
の消費電力
電源冗長の可否 システム
動作可否
備考
100V 1200W 2400W ~1000W 冗長動作 電源1個の供給電力内に収まっているため、冗長動作が可能な構成です。
1000~1200W 冗長動作 冗長動作は、計算上OKですが、余裕のない設計は危険です。冗長動作が前提になる場合は200Vでの運用を検討してください。
1200W~2200W Combine(非冗長動作) Combineで動作可能です。電源が片系故障した場合は、給電が間に合わず即座にシステムが停止します。
2200W~2400W Combine(非冗長動作) 計算上はCombineで動作可能ですが、Combineでも給電が間に合わない可能性があるため、100Vでの運用はお勧めできません。200Vでの運用を強くお勧めします
2400W~ - × Combineでも動作できません。100V環境の場合、本システムでは実現できない消費電力です。
200V 1800W 3600W ~1600W 冗長動作 電源1個の供給電力内に収まっているため、冗長動作が可能な構成です。
1600W~1800W 冗長動作 計算上はOKですが、余裕のない設計は危険です。冗長動作が前提になる場合、より強力な他のベアボーンシステムでの利用をお勧めします。
1800W~3000W Combine(非冗長動作) Combineで動作可能です。電源が片系故障した場合は、給電が間に合わず即座にシステムが停止します。
3000W~ - × 配電基盤 (PDB)の出力の最大値が 3000W までとなっているので、これ以上は利用できません。

※冗長・非冗長の切り替えは自動で行われます。
※自動で行われるため、知らぬ間に非冗長で動作しており、自動的にリセットがかかってしまう場合もあるので、ギリギリでの運用はお勧めできません。
※Intelと違い、Supermicroは電源の冗長が失われることを厳しく見ていない(SELに出ない)ので受動的に観測する方法がありません。
※冗長電源搭載システムは、冗長で動作させるのが本来の運用です。お客様がその運用を希望されているなら別ですが、非冗長でも動作できるものの可用性が下がるのでお勧めできません。

各ベア製品の冗長状況を確認する方法

電源が2個構成の場合、かならず1+1になるので分かりやすいですが、3電源・4電源だとすぐに判断できません。これはマニュアルに2+2とか書いてありますのでマニュアルをご確認ください。

FAQ

BMCを見ると、1+1で電源がどちらも消費しているのはなぜですか?

冗長電源は厳密に「電源1が本番電源、電源2が予備電源」のように役割が分かれている訳ではありません。通常からお互いの電源が同時に動作して電力を分割して供給するという動作をしています。つまり、どちらの電源も動いているのです。そして、いざとなったら片方の電源が全電力を供給するという動作をします。ですから、正常動作時でも電源の全てがある程度の電力を消費しており、これが正しい動作となります。

これには理由があります。仮に予備電源が通常は動作していないとします。すると、電源ユニットが故障した場合、瞬時に予備側に切り替える必要があります。当たり前の話に思えますが、これは動作的に大変です。1000Wとか2000Wとかを連続して消費し続けているサーバーに対して、通常は0Wで動作していない電源ユニットが、ミリセコンドのオーダーで0Wから突然1000Wなり2000Wの給電を開始する必要がある訳です。しかもサーバーに全く影響を与えずにこれをこなす必要があります。この動作は実現できない訳ではなく、実際にCold Standbyという形で実装しているメーカーもあります。

しかし、これには2つの問題点があります。
 

  • 上記の通り、動作的に大変なので電源ユニットが突然の出力増に対応する設計になっている必要があり、電源ユニットやPDBが高額となる
  • Cold Standby側の非給電電源が偶発故障していないことを保証することが難しい

このような理由から、Supermicroではどちらも給電をする動作となっていて、BMCで設定することもできません。

冗長電源が半々ずつ電力を給電していませんが問題ないですか?

仮に、システムの消費電力が500Wである場合に、1+1の冗長電源であれば250W/250Wの消費電力になると考えますが、こうした場合に電源1が100W、電源2が400Wのような均等ではない給電になります。これが通常の動作ですので、問題ありません。

このように、可用性を求められるシステムや、消費電力の大きいシステムを使用する時、Supermicroの冗長電源を搭載したベアは、優れた効果を発揮します。

是非Supermicroの冗長電源を搭載したサーバー/ワークステーション製品をご検討下さい!

ビジネスに必要なIT機器の導入をサポートいたします

お問い合わせ・相談する

製品を検索する

製品カテゴリー
製品名
メーカー指定
並び順      
販売状況
販売店情報