「にゃお」と「んちば」はおなじひとなのです

NyaoPress 読書と日常

技術

なんとなく使っているモノの裏側

投稿日:

グーグルデータセンターの内側--明らかにされた独自性:スペシャルレポート - CNET Japan

 各クラスタでは1年目に、1000件の個々のマシン故障が発生するのが一般的だ。ハードドライブ故障は数千件起こる。1台の電力配分装置が故障すれば、500〜1000台のマシンが約6時間停止する。20台のラックで異常が発生し、そのたびに40〜80台のマシンがネットワークから切断される。5台のラックが「不安定」になれば、ネットワークパケットの半数が紛失する。ひとたびクラスタの配線を変更すれば、2日間にわたってマシンの5%が影響を受けるとDean氏は言う。さらに、クラスタがオーバーヒートする可能性は約50%あり、ほとんどのサーバが5分以内にダウンし、復旧に1〜2日かかる。

何十万台ものマシンが動いているんだから、常にどこかで故障が起きているはずで、故障をできるだけ局所化して全体の動作を維持するというのは並大抵のことじゃないのだろうなあ。フォールトトレラントな運用ではたぶんGoogleに勝る技術を持った会社は世界中にどこにもないに違いない。
おかげで近い未来にはコンピューティングパワーが完全にインフラになって、水道やガスを使うように必要なだけのリソースがいつでも使えるという状態になるのだろう。
Google App Engineなんか見ると、自前のサーバを立てて秘密主義で仕事をしているのがバカらしくなってくるのだなあ。。。







-技術
-

Copyright© NyaoPress 読書と日常 , 2017 All Rights Reserved.