ハイスループット コンピューティング: 制限のないデータ サイエンスの育成

生物学とビッグデータは今や完全に切り離すことができません。

現代の生物学のほとんどは、従来の基準では管理するには膨大な量のデータ セットを生成しており、科学の高度化に伴い、課題は指数関数的に増加します。

UW-Madison と Morgridge Institute の共同パートナーシップである Center for High-Throughput Computing (CHTC) は、このデータの猛攻撃を見て、次のように述べています。 かかって来い。

ミロン・リヴニー

ハイスループット コンピューティング (HTC) の創設者である Miron Livny は、次のように述べています。 Livny は、UW-Madison のコンピューター科学者として 30 年以上にわたって HTC を擁護してきました。最近では、Morgridge Institute のコンピューティング研究の主任研究員として活躍しています。

HTCondor は、本質的に大きな計算タスクを小さな断片に分割するタスク スケジューリング ソフトウェア アプローチであり、研究者がより多くのデータを分析できるようにします (したがって、「高スループット」という用語が使われています)。 チームは現在、年間 250 ~ 300 件のプロジェクトを処理しており、これは 5 年前の 2 倍であり、数億時間の計算時間を使用しています。

そして、それはちょうどUW-マディソンにあります。 グローバルな Open Science Grid は、重力波の検出や新しい亜原子粒子の発見など、ノーベル賞を受賞したプロジェクトのバックボーン システムである HTC リソースを世界に提供します。 ちょうど今年、私たちの銀河系の中心にある巨大なブラック ホールの発見に貢献したとして話題になりました。

このサービスはキャンパス内で支持者を獲得しています。これは、単に「必要な技術は何ですか?」と尋ねる以上のものであることを科学者が学んでいるからです。 研究コンピューティングは共同作業であり、HTC が方程式にもたらす人々は技術よりも重要です。

Livny 氏は、HTC ファシリテーション チームがその好例だと言います。 ファシリテーターに重点を置くことは時代を先取りしており、コンピューター サイエンスの世界ではほとんど前例がありませんでした。 これらは、科学者のためにデータを最大化するための最良の方法を見つけて、テクノロジーとベンチ実験の間で魔法を働かせることができる翻訳者です。

Livny は病院の比喩を使用しています。 病院の ER ルームのように、HTC は 1 つの病気や 1 つの家族の健康問題に専念しているわけではありません。 素粒子物理学、脳科学、COVID 19 のいずれであっても、すべての参加者が必要です。ファシリテーターは、各個人に適した計算による「医療」とは何かを決定するのに役立ちます。

HTC の UW-Madison 側と Morgridge 側はシームレスに連携します。設計上、一方がどこから始まり、もう一方がどこで終わるかわかりません。 しかし、Morgridge が提供するユニークな要素があります。 Livny 氏によると、この研究所の雇用の柔軟性により、グループは、テニュア トラックの役割には最適ではないかもしれないが、HTC をコア サービスとして前進させるのに最適な型にはまらない才能を雇用することができます。

ブライアン・ボッケルマン
ブライアン・ボッケルマン

Brian Bockelman は、スイスの CERN コライダーや南極のアイス キューブなど、大規模な物理科学プロジェクトで HTC に数十年の経験を持ち、2019 年にモルグリッジ リサーチ コンピューティングの調査員として参加しました。 彼はその経験を、生物学研究で現在見られる膨大な計算ニーズに適用することができました。

たとえば、彼はキャンパス内の新しいクライオ電子顕微鏡 (Cryo-EM) センターのデータ管理プラットフォームの開発を主導しました。 大規模な課題と処理の課題の両方を提供する技術として、クライオ EM は研究コンピューティング チームを今後何年も忙しくさせます。 「リサーチ コンピューティングの真の成功は、研究者が科学のやり方を変えたときです。これは、私たちが尋ねる質問と、私たちが提供するコンピューティングによって、可能性を知らなかったことに目を向けさせてくれるからです」と Livny 氏は言います。 「最終的に、確立された科学者は、1 つの明確な問題を解決するだけでなく、科学そのものについて別の考え方をすることができます。」

Leave a Comment

Your email address will not be published. Required fields are marked *