OCP | AI時代におけるラックのランダム振動テスト:Googleのオープンソース取り組み

はじめに

AI技術の発展が急速に進む中、データセンターハードウェアに求められる複雑性と小型化の進行が、ラック単位での振動テストの重要性を高めています。本記事では、Googleが開発した「完全搭載ラックのランダム振動テスト」に関する手法や、これをオープンソース化する取り組みを解説します。このプロジェクトは、データセンター内外で使用される機器の信頼性を高める一助となることを目的としています。

完全搭載ラックとは?

「完全搭載ラック(L11)」は、部品がすべて組み込まれた状態で工場から出荷され、データセンターまで一貫してテスト・運搬・設置されるソリューションを指します。この方法はサプライチェーンの簡素化に寄与する一方で、振動テストの複雑化を招いています。

振動による損傷は、部品単位からラック全体まで多層的に発生し得ます。さらに、製造・輸送の過程で累積する微細な損傷が最終的にシステム全体の故障につながる場合があります。

ランダム振動テストの課題

Googleの取り組みは、以下のような課題を解決するために設計されています。

  1. 振動の累積的な影響:振動による損傷は長期間にわたり蓄積し、発見が困難な場合があります。
  2. テストの複雑性:部品レベルからラック全体、さらには輸送条件まで考慮する必要があります。
  3. データの標準化不足:業界全体で共有されるテスト基準やデータが不足しており、各企業が独自の方法で対応しています。

Googleの革新的手法

高精度データ収集

Googleは1秒間に3,000サンプルを記録できるモジュールを開発し、これをトラックやラック、梱包材などに設置することで、膨大なフィールドデータを収集しています。これまでに20億件以上のデータポイントを取得し、振動の頻度、振幅、周期を解析して特定の製品向けにカスタマイズされたテストプロファイルを作成しています。

部品・機器の詳細分析

熱交換器やファンモジュール、メモリなど、振動が影響を与える部品ごとにひずみゲージや変位計を設置して測定を実施。これにより、共振時の曲率や損傷が蓄積するメカニズムを明らかにしました。

振動ストレスの評価

振動ストレスの影響を数値化するために、安全係数を使用しています。この係数は「1以上」であれば安全、「1未満」であれば危険を示します。以下はテスト結果の例です。

道路条件輸送時間安全係数
米国・道路1長距離1.5
米国・道路2短距離18
欧州・道路345分9
欧州・道路45日間7.5

これらの結果から、振動ストレスが輸送方法や道路条件によって大きく変化することが示されました。

オープンソース化の目的

Googleはこれらの手法とデータをオープンソース化し、GitHubを通じて共有する予定です。これにより、業界全体でのコラボレーションと知識の共有が促進されることを期待しています。ホワイトペーパーやサンプルデータが2025年2月に公開される予定であり、誰でもテスト手法を試すことが可能になります。

今後の展望とAI時代の重要性

AI技術はデータセンターを越えて、エッジコンピューティングや自動運転車、ロボティクスなどの分野に広がりつつあります。これらの機器は、データセンター以上に厳しい機械的・熱的ストレスにさらされるため、Googleの取り組みはこれらの分野にも応用可能です。

オープンソース化された振動テスト手法は、業界全体の標準化に寄与し、長期的にはデータセンター内外での機器の信頼性向上につながるでしょう。


投稿日

カテゴリー:

投稿者: