Inspur倚天NF5588M3(ユーザーの複雑なアプリを優先的に考慮した業務特化型ヘテロジニアスサーバー)

目標の客様と応用領域

・生命科学:分子動力学、遺伝子の並べ替え、蛋白質の折畳み、計算化学など

・エンジニアリング科学:CAD / CAM / CAE、天体物理、CFD、Mathematics、LabView

・政府の国防:武器、画像処理、戦地シミュレーション

・医療:MRI、CT、映像補助治療

・石油石化:地震情報処理、油層シミュレーション

・金融:リスク分析、金融派生商品の模擬、金融モデリング

・可視化:レンダリング農場、ゲーム、アニメ

・電子設計自動化EDA:SPICE、Verilog、3D EM

製品優勢

CPU+GPU異種計算アーキテクチャ

GPU計算ユニットを導入し、伝統的な単一な計算ユニットを超えた、Intelの最新アーキテクチャのコアとNVIDIAテスラ/ Keplerを採用して、計算技術の協同を加速し、CPUとGPUとの能力を十分に発揮させる。CPUは主に得意な論理選択、判断ジャンプ及びIO通信を担当し、GPUは計算密集型、高度の並列計算に特化して、資源の合理に配分し、計算力を十分に発揮させて、計算性能を数倍から数百倍まで成長させる。特に、協同計算加速アーキテクチャは伝統的な技術ルートの否定ではなく、一種の補充と補助である。さらにGPUの利点を発揮し、ユーザーの特定な応用領域の中で問題解決の時間を大幅に短縮できる。

高性能の仮想化ソリューション

伝統GPU仮想化ソリューションと比べ、NVIDIA Keplerアーキテクチャに基づいたGRID K1とK2カードは、専門の設計にて仮想化環境で豊かな効果を現せると同時にGPUのハードウェア仮想化を実現するので、数名のユーザーが単一GPUを共有できる。ユーザーの密度を改善するほか、PCの性能と互換性を提供できる。

GridカードはCitrix、マイクロソフトやVMwareなどGPUに基づいた仮想化ソリューションを支持し、人々が実踐により証明された多種のソリューションから柔軟に選択できる。

大規模の並列計算処理コア

GPUは同時稼動の多核CPUに比べ、同時に数千個のスレッドを処理できる。これで我々のシステムは情報の処理量を増やせる。例えば、ゲームやアニメレンダリングの中で、GPUの計算は特殊な演算処理であり、すなわち計算される各画素間の順序、又は使用方法にて、その順序に制限されない。数百万のスレッドがあれば、すべての画素を同時にレンダリングさせることで1画素の時間で計算を完了できる。

ユニット間高速IO交換技術を協調処理する

設備はすべて自分の専用接続が付き、GPUは全体の総線に帯域幅を請求する必要がなく、データ伝送率を高度に引き上げる。伝統のPCI総線は単一の周期内で単向伝送しか実現できない。PCI-Eの双単向接続はより高い伝送速度と品質を提供でき、それらの差異は半二重と全二重との差異と類似する。Inspur「倚天NF5588M3」はPCI-E 3.0 x16を採用し、帯域幅が32 GB/sに達する。

最新のIntel QPI技術を採用する

CPUとGPUとの協同効果をより一層発揮するため、Inspur「倚天」デスクトップのスーパーコンピューターはIntelのQPI(QuickパスInterconnect)技術を採用し、最大に8.0GT / sの転送速度を実現し、通信が一層早やまる。QPI総線はマルチプロセッサ内部の直接な連携を実現する。マルチプロセッサ作業の場合、各プロセッサはお互いに資料を転送でき、チップセットを経由する必要がないので、システム全体の性能を大幅に向上させる。Sandybridgeアーキテクチャのプロセッサ集積メモリコントローラ-、PCI-E 3.0図形インタフェース、及び、図形コアの出現に伴い、QPIアーキテクチャの優位性がさらに発揮できる。

優秀なプログラミング環境

CUDA(Compute Unified Device Architecture)G通用並列計算構造よりGPUが複雑な計算問題を解決できる。そこにCUDA命令セット(ISA)とGPU内部の並列計算エンジンが含まれる。現在、開発者はC言語にてCUDAアーキテクチャにプログラミングできるが、C言語は最も広く使用された高級プログラミング言語であり便利である。書かれたプログラムはCUDA適用のプロセッサで超高性能に運行できる。

・GPU並行応用に使われた標準のC言語

・高速フーリエ変換(FFT)及び基本線形代数サブルーチン(BLAS)の標準データベース

・専用CUDAドライブはGPUとCPUとの間で高速データ伝送計算に使われる。

・CUDAドライバとOpenGL及びDirectXグラフィックスドライバーが相互の操作を実現できる。

・Linux 32 / 64ビット、Windows XP 32 / 64ビットやMacシステムを支持する。

Inspurは強力なGPU/MICアプリ開発、移植チームを有している

・国内トップレベルのCPU+GPU/CPU+MICアーキテクチャアプリ最適化チーム

・混合アーキテクチャクラスタにおける管理、ディスパッチの問題を解決

・CPU、GPU、MICの演算能力を融合

・アプリを混合アーキテクチャに移転する方法論を熟成させる

InspurはGPU/MICの開発の面で豊富な開発経験を積んでいる

1.GPUイノベーション

・Blastn

Inspur及び中国科学院の某所は共同でGPUバージョンに基づくBlastn演算法を開発した。シングルコアCPUと比べ、Blastn演算法はシングルGPUにおいて性能が35倍に達した。

・ATOM

Inspurは中国科学院の複数の研究所と共同でGPUバージョンに基づくETソフトATOMを開発した。シングルTesla C2050 GPU上にて使用する場合、シングルコアCPUプラットフォームでの性能が48倍に達した。

・CFD: LBM_LES

Inspurは国内の某大学と共同でGPUバージョンに基づく並行LBM-LES演算法を開発した。シングルTesla C2050 GPU上での倍精度性能はシングルコアCPUプラットフォームにおいて55倍に達した。1クアッドTesla C2070 GPUでの倍精度性能はシングルコアCPUプラットフォームにおいて150倍に達した。

2.MICイノベーション

・ET

InspurアプリサービスチームはMICプラットフォームに基づく並行SIRT演算法を開発した。Intel CPUプラットフォームで単スレッドの運行時間は1434s、8核のマルチスレッドOpenMP版の運行時間は136s、単マイク(KNF版)の運行時間は55sであって、性能が向上する。2011年SC11大会において展示された全世界からの5つのMICアプリの一つである。

・BSDE

InspurアプリサービスチームはMICプラットフォームに基づくBSDE並行演算法を開発した。Intel CPUプラットフォームで単スレッドの運行時間は401s、8核のマルチスレッドOpenMP版の運行時間は41s、単マイク(KNF版)の運行時間は21sであって、性能が向上する。

・CFD: LES_LBM

Intel CPUプラットフォームで単スレッドの運行時間は10324s、16核のマルチスレッドOpenMP版の運行時間は273s、単マイク(KNF版)の運行時間は191sであって、性能が向上する。2012年IDF12大会において展示された唯一のMICアプリケーションである。

倚天NF5588M3

プロセッサー

Intel® Xeon® E5-2600V2シリーズプロセッサ(up to 150W)

メモリ

最大512GBの DDR3 1600/1333/1066 RECCメモリ対応、クアッドチャンネル読込、高級メモリエラー検出訂正、メモリミラーリング、メモリ高可用性等の高級機能に対応している。

SATA制御器

集積SATAディスクコントローラ-、8通路のSAS 3Gb及び6Gbディスクコントローラ-を選択可能

ストレージ

ホットスワップハードディスクを最大32TBまで対応

PCI拡張ソケット

Nvidia GPUカード或いはIntel MICカードを最大4個まで対応

集積I/Oポート

インテグレーションシリアルインターフェース、RJ45ネット端子、USB2.0接続端子、独立IPMI管理ネット接続口、VGA接続口

電源

1+1予備式1620W 80PLUS Platinum級電源

OS

Microsoft Windows Server 2008 SP1 32/64bit

Windows 2003 Enterprise with SP2 32/64bit

Red Hat Enterprise Linux 5U3 32/64bit

SuSE Linux Enterprise Server 10 SP2 32/64bit

SuSE Linux Enterprise Server 11 32/64Bit

配置によってオペレーティング・システムのサポート能力が違うため、詳しくはInspur会社にお問い合わせください。

その他の情報

Nvidia Tesla K20(4個)/K20X(4個)/K40M(4個)/K10(4個)対応可;Nvidia Grid K1/K2対応可

产品名称 倚天NF5588M3
商品编码 LCHPC55880001 LCHPC55880002
CPU Intel Xeon E5-2620(2.00GHz/6c)/7.2GT/15ML3/1333 Intel Xeon E5-2620(2.00GHz/6c)/7.2GT/15ML3/1333
内存 4G ECC Registered DDR3 1600内存 8G ECC Registered DDR3 1600内存
硬盘 1TB 3.5" 7.2Krpm SATA硬盘 1TB 3.5" 7.2Krpm SATA硬盘
RAID Inspur SAS 2008 Raid卡
加速卡 Intel Xeon Phi套餐1
(3120A MIC卡+Intel Parallel Studio+MIC编程指南+Parallel Programming and optimization with Intel Xeon Phi Coprocessors+Top 10 List webinar, simple lab, forum, more info)
Intel Xeon Phi套餐2
(5110P MIC卡+Intel Parallel Studio+MIC编程指南+Parallel Programming and optimization with Intel Xeon Phi Coprocessors+Top 10 List webinar, simple lab, forum, more info)
网络 1000M*2 1000M*2
电源 1620W 1+1冗余服务器电源 1620W 1+1冗余服务器电源
其他 DVD光驱 DVD光驱
主机全国统一价 RMB 75000 元 RMB 80000元
备注 通过主板集成Host-RAID实现RAID 标配Raid卡