2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

2位じゃだめなスーパーコンピューター『京』 世界ランク5位に転落

1 : スパイダージャーマン(東京都)@\(^o^)/:2016/06/20(月) 20:38:37.51 ID:zoTSIdfZ0.net ?PLT(15000) ポイント特典

中国が7連覇 スパコン世界ランク、新機種が1位に 日本の「京」は5位に後退

 スーパーコンピューターの計算速度の世界ランキング「TOP500」が20日、
ドイツで開催中の国際会議で発表され、中国の新機種が1位となり、中国勢が7連覇を果たした。
理化学研究所の「京(けい)」(神戸市)は昨年11月の前回4位から5位に後退した。

 1位は中国・無錫スパコンセンターの「サンウェイ・タイフ・ライト」で、
計算速度は京の約8・8倍の毎秒9京3014兆回(京は1兆の1万倍)。
2位は前回まで6連覇を達成した中国・広州スパコンセンターの「天河2」で、
新機種の速度が約2・7倍となった。3位、4位は米国勢だった。

 京は平成23年に1位だったが、米国や中国に抜かれ順位を下げている。

 TOP500は上位500機を半年ごとに発表。
中国は前回から58機増の167機が入り、165機の米国を逆転して最多となった。日本は29機が入った。
http://www.sankei.com/smp/life/news/160620/lif1606200031-s1.html

493 : リバースネックブリーカー(神奈川県)@\(^o^)/:2016/06/22(水) 20:44:52.39 ID:GKS82mN20.net
>>491
凄いねぇ。
頑張っている人に頑張って欲しいと言うのは失礼だからなんと言ってよいのか。

非ノイマン型の方は磁気を使ったアナログニューラルコンピューターで、
ノイマン型の方はPEZY-SC系の技術を使って機械学習という感じかな。
機械学習用のスパコンはnViDIAも出しているから、あれがライバルになるのか」

494 : リバースネックブリーカー(神奈川県)@\(^o^)/:2016/06/22(水) 20:50:50.89 ID:GKS82mN20.net
>>493

「PEZY-SCチップは、DDR3/4を8チャネルとPCIe3.0を32レーン持ち、チップのI/Oピン数が多い。
この多ピンのチップを47.5mm角のパッケージに押し込んだために、電源や信号の引き回しが厳しく、
ノイズが大きくなってしまい、ZS-1.4とZS-1.5ではPEZY-SCのクロックやDRAMのクロックを落とす必要があったという。
また、電源ノイズが大きくノイズによる電源電圧の低下分を補うため供給する電源電圧を高めにしておく必要があり、
消費電力の増加にもつながっていたという。」

って、設計ミスってんじゃん!って内容なんだけど、ミスらないことより行動優先ってのが日本の企業っぽくなくていい

495 : ウエスタンラリアット(庭)@\(^o^)/:2016/06/22(水) 20:55:08.70 ID:Sycmfjd/0.net
>>493
磁界結合強度を使ったシナプスの結合強度可変は、微妙。
TCIの転送は、デジタルパルスなので、それをアナログ信号積算にするのは、プロセス縮小から言っておかしいと考える。

ただし、低電力高バンド幅と複数のチップにデータをブロードキャストするのは大有り。

そして、演算とパワーの効率は、GPUを抜いてしまってるけれども。

496 : ウエスタンラリアット(庭)@\(^o^)/:2016/06/22(水) 21:05:28.45 ID:Sycmfjd/0.net
>>494
これは、設計ミスと呼ぶにはかわいそうなレベル。クロック落としや電源管理で調節でリカバリできるならば、設計見積もりの甘さレベル。

成果物がチャンピオンデータ目指してるんだから。

497 : リバースネックブリーカー(神奈川県)@\(^o^)/:2016/06/22(水) 21:11:33.60 ID:GKS82mN20.net
>>495
nViDIAのTeslaはGPUを応用したGPGPUなので、科学技術計算専用のPEZY-SCに比べると
GPUのための無駄な部分があるので、方式的にはPEZYが有利。
ただ機械学習用という点では浮動小数点演算は64bitもいらないそうで、
nViDIAのTeslaは16bitの浮動小数点演算が出来ることを機械学習用のウリにしています。
PEZY-SCでは現時点で半精度(16bit浮動小数点演算)を使えないかも

498 : ウエスタンラリアット(庭)@\(^o^)/:2016/06/22(水) 21:18:06.23 ID:Sycmfjd/0.net
>>497
これは確かにと最初思ったが、
GPUでも単精度浮動小数で半精度浮動小数を実現してる?
それとも、専用の半精度浮動小数演算器を持ってる?

前者ならPezyと変わらず、後者なら半精度でGPUが有利。

499 : リバースネックブリーカー(神奈川県)@\(^o^)/:2016/06/22(水) 21:26:09.61 ID:GKS82mN20.net
>>498
nViDIAのPascal世代は面白くて、
Teslaに使っているGP100というチップでは半精度を使用可能(当然単精度の2倍の速さになる)として、
GPUで使うGP102というチップでは半精度を使えないと言っている。

500 : 32文ロケット砲(茸)@\(^o^)/:2016/06/22(水) 21:32:14.40 ID:yyn3nAGy0.net
もう9京なのに驚く

501 : ウエスタンラリアット(庭)@\(^o^)/:2016/06/22(水) 21:36:50.40 ID:Sycmfjd/0.net
>>499
なるほど、勉強になった。やはり、GPUとしての本用途やGPGPUになると3Dグラフィックス精度や倍精度演算が必要になるから、
16ビットで仮数部と指数部持つのを想像すると精度が保証されない。

半精度は、ある意味スペシャル用途だな。

半精度を重ねて、単精度、倍精度演算を実現していくにも後者側のパフォーマンスが劣化する。

結局はGPUも、半精度サポートより新しいアーキで単精度浮動小数演算器を増やす方向だね。
汎用性を考えると。

502 : リバースネックブリーカー(神奈川県)@\(^o^)/:2016/06/22(水) 21:37:57.29 ID:GKS82mN20.net
>>500
富士通のFX100も最大構成を組めば10京出ると言っています。
http://www.fujitsu.com/jp/products/computing/servers/supercomputer/primehpc-fx100/

503 : リバースネックブリーカー(神奈川県)@\(^o^)/:2016/06/22(水) 21:44:20.87 ID:GKS82mN20.net
>>501
そこは色々な考え方がありまして、グラフィックに関してHDR(High Dynamic Range)ということが言われ始め、
RGBを各8bitの整数ではなく16bitの浮動小数点で扱って、もっと色の表現を豊かにしようというのがあります。
なもんでグラフィックスでも半精度演算が必要になるかもしれません。

504 : トペ コンヒーロ(東京都)@\(^o^)/:2016/06/22(水) 21:45:01.49 ID:w80kX/Vn0.net
つうか後継機作ってないのかよ

505 : リバースネックブリーカー(神奈川県)@\(^o^)/:2016/06/22(水) 21:47:19.18 ID:GKS82mN20.net
機械学習専用プロセッサとしてはGoogleがTPUと呼ぶプロセッサを既に使っていて、
それは8bitの演算をするらしいです。
http://www.geocities.jp/andosprocinfo/wadai16/20160618.htm

506 : 稲妻レッグラリアット(dion軍)@\(^o^)/:2016/06/22(水) 21:47:45.82 ID:5on4z6RQ0.net
>>503
いま単精度でやってるんだけど

507 : リバースネックブリーカー(神奈川県)@\(^o^)/:2016/06/22(水) 21:49:53.71 ID:GKS82mN20.net
>>504

後継機は
>>502
に書いたFX100です。

でもって、京の次の国策スパコンはフラッグシップ2020という名前でプロジェクトが進み、
2020年に京の100倍の性能を目指しています。
1,300億円使う予定。

508 : スパイダージャーマン(dion軍)@\(^o^)/:2016/06/22(水) 21:54:12.78 ID:2dedMtoc0.net
これで2ちゃんしてみたい。(´・ω・`)

509 : リキラリアット(神奈川県)@\(^o^)/:2016/06/22(水) 21:56:21.26 ID:3IFIzV2j0.net
ボインクはスパコン換算でどのくらいなんだろう

最近やってみたが今やCPUよりGPUのほうが
何倍もポイント稼げるようになってた

510 : リバースネックブリーカー(神奈川県)@\(^o^)/:2016/06/22(水) 21:59:08.76 ID:GKS82mN20.net
フラッグシップ2020ではARM v8アーキテクチャーをサポートと富士通が発表しています。
http://www.theregister.co.uk/2016/06/20/fujitsu_arm_supercomputer/
ARMのコアを富士通が拡張したものが使われるみたいです。

511 : ウエスタンラリアット(庭)@\(^o^)/:2016/06/22(水) 22:02:25.14 ID:Sycmfjd/0.net
>>505
だろうと思ったよ。機械学習は整数演算でできるから、専用ならそちらの方向。
だって、機械学習をFPGA実装しようとしている研究者達がそっちの方向だから。
Convolutional Cellular Network系など

ただし、機械学習というか人工知能でもToplogical data analysisなど空間構造を厳密に扱うなら話は別

それに汎用性やグラフィックスなら、単精度を多数載せる方向。

512 : ウエスタンラリアット(庭)@\(^o^)/:2016/06/22(水) 22:03:57.25 ID:Sycmfjd/0.net
>>511
Convolutional Cellular Neural Network
CNN系ね。

513 : 稲妻レッグラリアット(dion軍)@\(^o^)/:2016/06/22(水) 22:08:01.73 ID:5on4z6RQ0.net
認識向け

514 : リバースネックブリーカー(神奈川県)@\(^o^)/:2016/06/22(水) 22:53:22.20 ID:GKS82mN20.net
スーパーコンピューターの方向としてはFPGAを使うというのも注目されています。
IntelがFPGAの大手Alteraを買って、1チップにCPUとFPGAを混載させるそうで。
http://www.nextplatform.com/2016/03/14/intel-marrying-fpga-beefy-broadwell-open-compute-future/
いわゆる制御系マイコンのノリで、ARMのコアとFPGAが混載されたものは既にあります。
http://japan.xilinx.com/products/silicon-devices/soc/zynq-ultrascale-mpsoc.html

スーパーコンピューターのアプリケーション用途は多くが特定の計算をとんでもなく大量にやるものなので、
その特定の計算をFPGAでハードウェア化すれば高速で低消費電力になるという理屈です。

515 : チキンウィングフェースロック(広島県)@\(^o^)/:2016/06/22(水) 22:56:05.38 ID:nxR8fE0+0.net
当たり前だろ
バカなのか?

516 : トペ コンヒーロ(SB-iPhone)@\(^o^)/:2016/06/22(水) 22:57:30.74 ID:fltubhWa0.net
まだ5位にいることに驚いた

517 : キングコングニードロップ(茸)@\(^o^)/:2016/06/22(水) 22:57:40.89 ID:G3vnSa6r0.net
Top500のランキング通りの性能がそのまま活かせる密な多元連立一次方程式を解く実用例ってないのかな?

思い浮かぶシミュレーションといえば大抵疎な多元連立一次方程式を解く奴だけど

518 : リバースネックブリーカー(神奈川県)@\(^o^)/:2016/06/22(水) 23:32:34.00 ID:GKS82mN20.net
>>517
Top500に使われているLinpackは、元々はスーパーコンピューター用のライブラリーから来ているそうなので、
ある程度、実用上の必要性があってのものだと思う。

519 : ミッドナイトエクスプレス(福岡県)@\(^o^)/:2016/06/22(水) 23:43:45.19 ID:G8S73Nba0.net
>>175
技術を語る日本人なのにダイソン贔屓ってかなりの情弱だろ
ダイソンは真下に強いが、真下のパワーが強いということは非力な者には使いにくい
日本製はパワーが倍だがあえて力を分散させて、さらに壁側まで使いやすくしてる
輸入コストがあることで日本人は本来よりかなり割高で購入

これでもダイソンと比べて日本の掃除機が悪いと思うのか

520 : ミッドナイトエクスプレス(福岡県)@\(^o^)/:2016/06/22(水) 23:53:01.84 ID:G8S73Nba0.net
>>507
同時代の予想ナンバーワンを余裕でぶち抜く性能なんかね
いくらスパコン研究が目的で、決まった予算が出るとは言え、
京の問題点である目標とした性能から見ると割高すぎるのは引き継いでほしくないのだが

521 : リバースパワースラム(神奈川県)@\(^o^)/:2016/06/23(木) 00:01:57.37 ID:ijQsEYZe0.net
>>520

2020年に1000Pflopsというのは中国も狙っているので、余裕でぶち抜くではなく、同水準だと思います。

522 : ビッグブーツ(愛知県)@\(^o^)/:2016/06/23(木) 00:04:28.13 ID:UxTzU0qC0.net
やだ、レンホっちゃう

523 : リバースパワースラム(神奈川県)@\(^o^)/:2016/06/23(木) 00:29:22.98 ID:ijQsEYZe0.net
Top500で使われるHPLは実アプリケーション性能から遠いので、新しい指標を作ろうということで考えられたHPCGの結果を見ると色々と面白い。
http://www.hpcg-benchmark.org/downloads/isc16/hpcg-isc16.pdf
Crayのインターコネクトを使ってXeonをつないだXC40やXC30というのが、そんなに性能悪くない。
上位20を見ると、
6、8、9、10、12、17、19、20の8システムがアクセラレーター使わずにXeonをつないだスパコン。

京とその後継機のFX100を使ったJAXAのスパコンSORA-MAを比べると、
京、HPL:10.510、HPCG:0.5544、HPCG/HPL比:5.3%
SORA-MA HPL:3.157、HPCG:0.1102、HPCG/HPL比:3.5%
で、
HPLではSORA-MAは京の30%であるのに対し、HPCGでは19.8%になっている。
SORA-MAよりHPCGが上で、HPCG/HPL比も上のスパコンを探すと、
2位の京は当然として、
9位のPlaiadesが、HPCG/HPL比3.8%とSORA-MAより上。

HPCG/HPL比が色々なアプリケーションに使えるという意味で使い易さの指標とすると、
Xeonを繋いだPlaiadesの方が京の後継機を使ったSORA-MAより使い易く、
性能も良いことになる。

524 : セントーン(dion軍)@\(^o^)/:2016/06/23(木) 00:30:41.48 ID:6vCP37WL0.net
>>518
Linpackは、貴方が良く出してる報告書のProf. Dongaraが作ったんだよ。
HPLのLは、Linpackの頭文字。

一時連立方程式の係数が全て揃ってる疎行列ではない演算を解くベンチマーク。

疎行列演算がなぜ実用的なのか、物理シムを考えたとき、空間を3次メッシュで区切ると
各メッシュの相互作用は、近接空間でなるたけ留まる。

だから、全ての空間メッシュの値を求める方程式は、近接の値が中心となり遠方の作用を必要としない。

すると、遠方の影響に関する係数は、ゼロとなるから、連立方程式の係数をまとめた行列は、疎行列となる。

だから、疎行列演算が重要なんだよ。

525 : ミッドナイトエクスプレス(関東地方)@\(^o^)/:2016/06/23(木) 00:37:24.84 ID:PyTdBngpO.net
スパコンって必ず追い抜かれていくもんだからなあ

526 : セントーン(dion軍)@\(^o^)/:2016/06/23(木) 00:38:03.66 ID:6vCP37WL0.net
>>514
これ、FPGAのこと話に出す人なら既知だよ。
自分は、Xilinxでspartan3から、vertex4,5、kintex-7ボード使ってる人。

後、ARMは、ARM7から、開発環境のARM Integrater(CPUコアボード、user logic:FPGAボードの積層)をいじってた人

527 : リバースパワースラム(神奈川県)@\(^o^)/:2016/06/23(木) 00:43:01.93 ID:ijQsEYZe0.net
>>526
既に使っている人からするとスーパーコンピューティングで使われるようになりそうですか?

528 : セントーン(dion軍)@\(^o^)/:2016/06/23(木) 00:48:40.09 ID:6vCP37WL0.net
>>527
スーパーコンピューティングは、何を指すんだい?

FPGAを使うというのは、演算をあるアプリケーションに特化させるということだよ。専用のロジックをプログラミングで作り上げる訳だから。

529 : セントーン(dion軍)@\(^o^)/:2016/06/23(木) 00:50:06.59 ID:6vCP37WL0.net
>>528
ここで言うプログラミングは、もちろんハードウェア記述言語のことです。

530 : セントーン(dion軍)@\(^o^)/:2016/06/23(木) 00:52:52.47 ID:6vCP37WL0.net
>>527
アプリを限定し、演算を固定するとGPUと比較して、かなり頑張れば1桁ぐらい効率の良いものは可能。

531 : かかと落とし(WiMAX)@\(^o^)/:2016/06/23(木) 00:53:17.72 ID:9pOTSefa0.net
あの「二位じゃダメなんですか」もマスコミ切り貼り報道の
犠牲のひとつだと思うんだけどね

「利権側」が公平な公開議論の場でちゃんと必要性の説明ができれば予算切られることはなかったのに

532 : リバースパワースラム(神奈川県)@\(^o^)/:2016/06/23(木) 00:59:39.15 ID:ijQsEYZe0.net
>>529
最近はHDLではなくCでも書けると聞きますが

533 : セントーン(dion軍)@\(^o^)/:2016/06/23(木) 01:07:08.77 ID:6vCP37WL0.net
>>532
あのさ、実際やってみたほうがいいです。
例えば、NECとかでも出してるけど、クセがあるしライセンス料を払う必要があるの。

クセの意味は、HDLによる記述は、どの様なHWができるか明示的に扱える。

対してCで書いて変換されたものが、自分の思うHWになるかわからないということ。

534 : セントーン(dion軍)@\(^o^)/:2016/06/23(木) 01:11:35.16 ID:6vCP37WL0.net
>>532
例えばだけど、for文による繰り返しは、どの様にHW化されるかなど。Cなら簡単だけど。
ビット精度の扱いとかもそうです。

535 : セントーン(dion軍)@\(^o^)/:2016/06/23(木) 01:15:41.35 ID:6vCP37WL0.net
>>532
Cでやるなら、ベンダー提供のAPIがあり、
それが1対1でそれぞれ演算器IPに直結されてる様なライブラリがあるのが良い。という感じです。

536 : リバースパワースラム(神奈川県)@\(^o^)/:2016/06/23(木) 01:20:47.45 ID:ijQsEYZe0.net
>>531
従来予定では米国に追いつかれて1位を取れないから構築を前倒しするために100億円を追加するという追加予算の是非の審議で、
1位であることが次世代スパコンの意義と説明する人がいいはっっちゃったから、それなら計画全体を再考すべしになっちゃった。

「2位じゃダメなんですか?」
は順位じゃなくて次世代スパコンが必要な用途があるでしょうという問いかけだったんだけど、説明の人がそれ応えず1位じゃないと意味が無いと言い続けた

537 : リバースパワースラム(神奈川県)@\(^o^)/:2016/06/23(木) 01:31:49.57 ID:ijQsEYZe0.net
>>535
Cで書けると言ってもベンダー提供のライブラリーを呼び出す制御に使えるぐらいで、
ユーザーが科学技術計算のプログラムを数式のイメージで書いたものは上手くFPGA化出来ないのであれば、
現在のスーパーコンピューターを置き換えることはまだまだ無理ですね

538 : 32文ロケット砲(神奈川県)@\(^o^)/:2016/06/23(木) 14:19:51.37 ID:Ent4LNtE0.net
>>536
一位を取ることを目指して開発しなければ技術開発競争に後れをとることになると説明してたろ。
糞神奈川。

539 : アトミックドロップ(新潟県)@\(^o^)/:2016/06/23(木) 14:30:52.66 ID:6GVzyN2f0.net
天気予報くらいしか使わんだろう

540 : ツームストンパイルドライバー(庭)@\(^o^)/:2016/06/23(木) 14:56:16.70 ID:+OZ9SE+M0.net
今思うとコスパの問題はその内訳の項目レベルで他プロジェクトと比較してほしかったな。土地建物代とか開発費製造費運用準備とかわけてさ。

541 : タイガードライバー(新疆ウイグル自治区)@\(^o^)/:2016/06/23(木) 15:10:05.05 ID:3C6V8XOj0.net
R4 「チ:O:ン:コ:ーじゃ駄目なんですか?」

542 : キングコングラリアット(やわらか銀行)@\(^o^)/:2016/06/23(木) 16:27:55.81 ID:wNxKKqTt0.net
>>538
用途の説明は無かったということで、同意してもらえたと認識して良いですか?

総レス数 542
151 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★