ITEMS BY CATEGORY
aphorism(2)
biz(11) in english(6) indian food(16) kaneko(17) korea(21) life and love(23) misc(81) salsa(3) soc(71) tech(48) things(22) travel(16)
Topics With Recent Comments
Archives
February 2008 (1)
December 2007 (1) November 2007 (1) October 2007 (2) September 2007 (3) August 2007 (2) June 2007 (2) May 2006 (1) March 2006 (1) February 2006 (3) December 2005 (1) November 2005 (2) October 2005 (1) August 2005 (8) July 2005 (6) June 2005 (8) May 2005 (5) April 2005 (10) March 2005 (9) February 2005 (5) January 2005 (8) December 2004 (6) November 2004 (5) October 2004 (7) September 2004 (5) August 2004 (3) July 2004 (6) June 2004 (3) May 2004 (19) April 2004 (10) March 2004 (20) February 2004 (7) January 2004 (6) December 2003 (6) November 2003 (7) October 2003 (7) September 2003 (5) August 2003 (8) July 2003 (6) June 2003 (12) May 2003 (12) April 2003 (15) March 2003 (14) February 2003 (11) January 2003 (12) December 2002 (14) November 2002 (15) October 2002 (7)
Recent Entries
精神科医薬とサイエントロジー
Asiajin - アジアのITに関する英語ブログ Rozerem - 全く新しい睡眠薬 A380ようやく就航 Animate! 福岡空港の増設・移転 Techcrunch20行きます mockmail.rb Embassy Suites Rails初心者講習会
Search
A-vertisement
|
October 20, 2004Google全体像前回、Google File Systemが話題になりましたが、今回はGoogle Clusterの全体像を取り上げたBarroso et al, Web Search for a Planet: The Google Cluster Architecture, IEEE Micro 2004 March-Aprilから紹介します。 Barrosoは冒頭から「平均して、一つのクエリーに対して、数百MBのデータ読み込みと、数百億(数十ギガ)のCPU Cycleが消費される」と述べています。私が思っているよりも途方もなく大きな数字で度肝を抜かれました。たしかに要約を作成したりするには、それくらいの仕事が要求されるのでしょう。「ピーク時で秒間数千件に上るクエリーを処理するには、最大級のスーパーコンピュータに匹敵するインフラが必要となる」というくだりでは、逆にピーク時の件数の少なさに驚きました。 Googleではその大きな仕事量を徹底して並列化することで、1秒未満の応答速度を確保しています。まずDNSロードバランスによって、地理的に分散したクラスタのうち最適なものに割り当てられます。その後、ハードウェアロードバランサによって一つのGoogle Web Server(GWS)へとリクエストが引き渡されます。 GWSは一つのリクエストを数台のIndex Serverに問い合わせ、スコア付きヒットリストを受け取ります。その後、GWSはDocument Serverに問い合わせて、ヒットしたページのタイトル、要訳、URLなどを受け取り、それをクライアントに返します。 「Document ServerクラスタはWeb全体の低レイテンシのコピーにアクセスできる必要がある。実際、性能と可用性のためにGoogleは数ダースのWebのコピーをクラスタに保持している」ということで、GoogleのなかにはWebがまるごと入っているわけです。たしかにキャッシュなどの動作からもそれは明らかなのですが、それにしても壮大な計画ですね。 あとは高価なハードウェアよりもソフトウェアで性能向上・耐故障性向上ということで、いまの常識的な線が書いてあります。データセンターには特別に冷房と電源を強化しているようです。 Comments
勉強になりました. Posted by: 通りすがり on October 22, 2006 06:43 AMPost a comment
|