JST CREST:「社会インフラ映像処理のための高速・省資源深層学習アルゴリズム基盤」(平成28年度採択)
ドライブレコーダーや監視カメラの大量の高精細映像から物体の検出や異常の検知を行うための、高性能かつ実時間で深層学習・解析を行うアルゴリズム基盤を構築します。高性能計算に関するハードウェアからアプリケーションまでの4つの異なる階層、ノード内処理、ノード間並列処理、学習処理、ネットワーク処理の研究者が互いに綿密に連携することで、従来と比較して1000分の1のメモリで1000倍高速な処理を目指します。 松岡グループでは、主にスパコンを対象として、複数ノードを用いたプログラムが性能を劣化させずにGPU数と比例した性能を達成する強スケール性を、現在の10倍の1000GPU規模の学習プログラムで実現することを目指します。そのためにノード間の通信処理量を削減する高並列学習アルゴリズムと、ノード間の資源スケジューリングによる全体最適化機構の開発を行います。 [リンク]
JST CREST:「EBD: 次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術」(平成25年度採択)
「ビッグデータ」の現在の実情はサイロ化された比較的小規模なデータに対する処理が中心だが、将来はオ ープンデータ化したサイエンス分野のようにサイロが崩壊し、更に IoT 等でデータの量と種別の爆発的な増 加が起こると予想されている。そこでは一見無相関なゼータ~ヨッタバイトに至る非構造なデータに対し高 次の O(n×m)のマッチングやグラフや種々の処理を行う必要があり、ペタ~エクサフロップスのシミュレー ションとの同化を行う需要もある。このような要求を我々は Extreme Big Data(EBD)と呼ぶが、EBD はシ ステムに今までにない莫大な計算・容量・バンド幅と同時に、性能ロスが最少でリアルタイム性のサポート、 更には柔軟なシステムソフトウェアやプログラミングを要求するが、現存の IDC・クラウドのインフラ及び スパコンのインフラは不十分である。そこで、我々はそれらの技術の融合(コンバージェンス)を各システム レイヤで革新的に果たし、最終的には現在の Google, Amazon などの IDC が現在保有するデータ処理能力の 10 万倍以上である「ヨッタバイト/年」の処理能力を達成する要素技術とその統合化アーキテクチャの研究 開発を狙う。その鍵となる技術は、不揮発メモリと processor-in-memory 技術の高性能・安価な統合、高バ ンド幅メニーコアプロセッサの活用、数十万ノードに分散する高速不揮発メモリのスパコン級ネットワーク からの超高速・低レーテンシアクセスのハードと低レベルソフトウェアスタック、それらを前提した超分散 の「EBD オブジェクト」と種々のソフトウェアによる管理・最適化・高信頼化と、EBD の利用シナリオに 応じたセマンティックスの実現、さらにはそれらの簡便な利用を可能とする(Map-Reduce に置き換わる)プ ログラミングレイヤや API の実現、更にはそれらを有効に活用するためのワークフローとリアルタイム性と バッチを共存させてシステムを最適させるスケジューラ、などである。これら要素技術はそれぞれ単独で開 発されるのではなく、EBD の典型的かつ社会的に有用なアプリケーショングループとのコ・デザインで統 合的に実現され、かつそれらの中途成果として世界初の EBD スパコンである TSUBAME3.0 が開発される。 TSUBAME2.5, 3.0、および開発されるプロトタイプその上でのシステムスタックの実現およびデモンスト レーションにより、広い技術普及と我が国の EBD におけるリーダーシップの確立を目指す。
JST CREST:「ポストペタスケール時代のメモリ階層の深化に対応するソフトウェア技術」(平成24年度採択)
メモリの速度性能・容量の伸びが、メニーコア化するプロセッサの伸びに追いつかないという、メモリウォール問題は、今後のスパコンアーキテクチャにおいて顕著となり、気象・医療・防災などの重要なシミュレーションをさらに大規模化・精緻化する上での障害となると考えられています。その解決のために、不揮発メモリも含めた異種のメモリを混在させたスパコンアーキテクチャを想定し、それを有効活用するコンパイラ・メモリ管理技術・シミュレーションアルゴリズムなどにまたがった新しいソフトウェア技術の研究開発を推進します。[リンク]
JST CREST:「ポストペタスケールシステムにおける超大規模グラフ最適化基盤」(平成23年度採択)
大規模災害では突発的に様々な事態が発生すると同時に短時間で状況が大きく変化します。このような状況下で、避難、誘導、復興計画等を早急に策定するためには、従来の手法では限界があり膨大なデータから作成したグラフを高速に処理することが難しい状況です。本研究ではポストペタスケールシステム上でこれらの問題を迅速に処理するための超大規模なグラフ最適化システムを作成して、安心安全な社会基盤の実現に貢献します。
基盤研究(S): 「10億並列 • エクサスケールスーパーコンピュータの耐障害性基盤」(平成23年度採択)
科学技術分野において、気象予報、地震及び津波伝播予測などのシミュレーションは、理論・実験に続く「第 3 の手法」として盛んに行われており、大規模なシミュレーションではスーパーコンピュータ (スパコン) が不可欠となっている。近年、計算需要の指数的な増加と共に、年々、スパコンはその規模とスピードが指数的に上昇しており、2018 年ごろには、エクサ(1018)フロップス・10 億並列のマシンが登場すると目されている。しかし、それにより搭載される CPU やメモリなど、多種多様なコンポーネントも指数的に増加し、エクサスケールスパコンでは、仮に各コンポーネントの信頼性が現在の数倍になったとしても、全体の障害発生率は数十倍近くとなる。これは、全てのコンポーネントが正常に稼動する時間間隔が平均で数十分以下足らずであることに相当し、エクサスケールシステムでは、マシンが実質的に動作しなくなる。これを解決するために、様々な耐障害技術が提案されているが、エクサスケールシステムへの適用は難しい。
我々は、TSUBAME2.0、及びその後継として2014 年に稼働予定の数十ペタフロップス級のTSUBAME3.0 を利用し、上記の問題に対する抜本的な解決を目指す。[リンク]
⇒ [ More Info ]
JST CREST:「高性能 • 高生産性アプリケーションフレームワークによるポストペタスケール高性能計算の実現 」(平成22年度採択)
PPCプロジェクトでは100PFLOPSから1EFLOPSクラスのスーパーコンピュータを対象とし、システムソフトウェアの最重要課題である「並列性の克服」、「信頼性」、「低消費電力化」の解決を目指した高生産性垂直統合型ソフトウェアスタックを研究開発しています。スケーラブルなマルチスレッド処理系を基盤としたアプリケーションフレームワークとして、自動並列化、自動チューニング、耐故障性、電力最適化等の各種ソフトウェア技術を透過的に実現することを狙います。本プロジェクトでは主に流体シミュレーションおよび分子動力学法を対象としてフレームワークを開発しています。
JST CREST:「ULP-HPC 次世代テクノロジのモデル化 • 最適化による超低消費電力ハイパフォーマンスコンピューティング」(平成19年度採択)
HPC(高性能計算)の重要性は強く認識されていますが、処理能力の向上と引換えの電力消費の急速な増大が危機的状況です。本研究では10年後にHPCの性能電力効率を現状の1000倍とする目標を掲げるULP-HPC(Ultra Low Power HPC)を提案し、(1)数理的な新手法に基づいた性能モデル・省電力の自律自動最適化(チューニング)技法を (2) 超マルチコア・ベクトルアクセラレータ・次世代省電力メモリ・省電力高性能ネットワーク等のハードウェア基盤、仮想機械やスケジュラなどのソフトウェア基盤・冷却や電源などの設備基盤などを融合的に活用する、新しいHPC向けの超省電力化基盤の開発を行い、(3)我国No.1スパコンの東工大TSUBAME(100 TFlops級)上に (2)の要素を研究基盤として追加し、 (4) 実際の大規模HPCアプリケーションをベースに超省電力向けアルゴリズムを開発し、上記の目標を達成します。これで10年後にはTSUBAMEがデスクサイドPC級になり、大いに科学技術の発展に貢献します。