冗長システムの交換周期

ポイントはバスタブ曲線の底ですよ。

バスタブ曲線の説明はよそで見ていただくとして、冗長システムのハードウェア交換周期は慎重に決めないといけません。

2台以上同じものを並べて冗長化すると、

2台同時に壊れることはないからシステム全体の信頼性が上がる

ということのようですが、

2台同時に壊れにくいのだから

2台のどちらかが壊れたら交換すればよい

というポリシーは間違っていると考えます。

まともに作られた製品なら、故障発生確率は横軸を時間に取ってバスタブ曲線になるはずで、製品寿命に近づくと故障の発生確率がズズンと上がってしまい、冗長化しても意味のないレベルに達してしまうと考えられるからです。

まったく同じロットの同じ製品を2式以上使うと、寿命も近くばらつきも小さいと考えられるのでへたをすると冗長化の意味がありません。

まず交換周期を想定寿命の6割とか半分で設定し、最初の一台は交換周期の半分経過時点で強制的に交換して交換周期をずらす必要があります。寿命のばらつきで勝手にずれるからあまり問題にならないのかもしれませんが、交換直後は故障発生確率が高いと考えられますので、交換周期をずらす必要があります。

交換周期前に故障が発生した場合に商社に強く文句を言って次回の価格交渉を有利に進めるためにも、この交換周期のポリシーは守るべきです。

壊れるまで使えば、2~3年だとすると、1台10万円のシステムは交換周期を1年とすると、半年ごとに交換なので、1年に2回交換がありますから・・・

1台:3.3~5万円/年

2台:20万円/年(初期費用は除く)

3台の場合はどうでしょうか。交換時期はずらすので年3回になりますが、交換周期は1年なので

3台:30万円/年(初期費用は除く)

こんな感じですかね。

また、安易なコスト圧縮要求などで、

交換周期内に故障が発生していないという過去の実績から

交換周期を25%程度延長しても問題ないのではないか?

というような、根拠不明な要求をのんでしまうと地獄が待っているかもしれないと覚悟した方がよろしいと思います。

壊れたら交換するという考え方は、いかにもベストエフォート的で間違っていると思います。壊れる前に交換するのが工学的だと思います。

もちろんバスタブ曲線などというのは幻想かもしれません。ですが、壊れたら交換するという間抜けな使い方しかできない利用者はそれに対して文句を言える立場にはないでしょう。

特にHDDについては数年ごとに間抜けなレポートが出て話題になりますが、HDDがボード類や電源に比べて壊れやすいというのもまた幻想かもしれませんです。

適切に事前評価しないと、冗長化しないで「壊れたら1日システムを止めればいいじゃん」という運用の方がはるかにコストが小さいケースも考えられます。

交換周期をずらすので冗長化度が上がれば上がるほど、交換回数は増大します。稼働しながら交換できない場合、冗長度をあげるほど稼働率が下がるという間抜けな事態も発生します。

先ほど計算したように、「壊れるまで交換しない」ポリシーなら、壊れるまでは稼働し続けますので、冗長化に多額の金をかけて、運用にも手間をかけて、本当に意味があるかどうかはよく調べたほうがいいです。

りんくる

http://storagemojo.com/2007/02/20/everything-you-know-about-disks-is-wrong/