河野太郎さんのブログに

「京」に関するこんな記事が載っていました。


スパコン京への疑問
http://www.taro.org/2011/11/post-1118.php


まあ、思うことはいろいろあるのですが、「京」について書いてくれるというのは関心があることのあらわれ、頑張ってほしいと思います。


問いについて、思ったことを書きますが、とはいえ、河野さんに対して答える立場にも義理もないのでトラバも何も送りません。京の関係者でもないしなんのチェックもしていないので、たぶん不正確なところがいっぱい。あとで修正するかもです。感情に任せて書きました。


> スパコン京の利用については、選定機関が認めたものに限るようだが、既に科研費の審査を通ったものについて、再度、スパコンを利用するための申請書を書き、それを審査するのは無駄ではないか。負担金額に応じたリソースが使えるようなルールにすべきではないか。(科学振興予算の純粋科学と技術開発の割り振りを適正化する必要がある)


意味がよくわからない。科研費の審査員に必要とされる能力と、京の課題選定の審査員に必要とされる能力は違う、と答えたいが、本当にそんなことを聞いているのか?


> 成果目標の明確化を求めると、純粋な研究の可能性を狭めないか。


これはその通り。京、というより日本の科学技術に全般的に言える問題。逆に、成果目標の明確化を求めないと、京自体の成果も明確化しにくくなるが、それは OK なの?


> 来年6月の引き渡しから半年近く経った11月からしか供用されないのはなぜか。


理由は二つ。まず、多くの装置系の巨大プロジェクト (人工衛星とか) で、最初の一定の期間はプロジェクトに主に関わった研究機関に占有する権利が与えられることが多い。開発に割く資金、労力を考えると、この程度のインセンティブは必要だと私は思うし、京にもそれが当てはまるだろう。


もう一つ、巨大スパコンは設置当初安定して動かない。時間が経つに従ってこなれてくる。最初の不安定な期間に部外者に開放するのは、お互いデメリットが多い。こんなこと書くと、不安定なまま引き渡したベンダーを責める声が多いと思うが、私はそれには与しない。プロ使用の品はコンシューマ向けの製品とは違う。そもそも、開発したのは建前としては理研のはず。スパコンは PC とは違う。


> 京を中核とするネットワークで接続されたHPCIとこれまでのネットワークに接続されているスパコンの環境はどこがちがうのか。


質問の意味がよくわからない。なんだ、「ネットワークに接続されている」って。無理に答えるが、私の印象では、違いは規模、つまり、コア数。たとえば地球シミュレータで使われたような接続方法は京では使えない。だから、Tofu を開発する必要があった。コア数という量的な違いなのだが、実質上、質的な違いとなって開発陣に立ちはだかる。


> 「次世代スパコンと全国の主要スパコンをネットワークで結ぶことにより、研究の内容、性質に応じて最適なスパコンを選んで計算することが可能になる」というが、計算機を使い分けることが実際にあるのか。


しらん。が、有ってもおかしくない。


> ソフトウェアのデバッグを考えると、京一台というのは効率が悪くないか。


効率悪い。是非、もう一台。


もちろん、京の半分 × 2 では?ということをおっしゃりたいのだろうが、劇的に安くなるならともかく、メリットはない。京でも、京の半分×2として運用することは可能で、一方、京の半分×2では京でしか出来ない計算を実行できないから。


> 東大の次世代スパコンは、富士通の1ペタ以上のものになるが、これまでの日立のスパコンからのソフトウェアの移行という作業が加わることをどう考えるか。


そうなんだよねぇ。東大の計算機の計画はよく知らんが、日立から富士通に移行時にコードの書き換えが必要になるでしょうから、それは厄介。で、どうします?日立にお金出してスパコン新たに開発してもらいますか?


> また、京大の次世代はCLAYになるが、同じような問題が発生するのだろうか。


こちらはどうなんでしょうね。今の CLAY のアーキテクチャを知らんからなんともいえない。


> 民間で京クラスのスパコンを必要とするところがあるか。ソフトウェアをかける研究者がいるのか。これまでのスパコンの民間の利用はどうだったのか。


費用との関係。京を自前で作る!ってところはないんじゃない?一方、安けりゃ使いたいという人はいっぱいいると思う。


> 本当に「スパコンを利用した研究が飛躍的に進展し、推定利用者が1000人から2万人になる」か。


なるかどうか、というより、そうするべきです。ただ、京があったから利用者が 2 万人に増えるとは限らん。それでも京があった方が増えやすいと思う。


> 開発加速の経費110億円が削減されたのにほぼ当初のスケジュールできているのはなぜか。企業努力なのか。


企業努力でしょうね。もちろん、110 億はふっかけだ、との主張を私が否定する理由も義理もありません。


> NECや日立に支払われた開発経費はどうするのか。


ぜひ、このへんはクリアにしてほしいものです。


> メンテナンス経費は適正か。


この辺もクリアに。ただ、ベンダーがうはうはってなことはないと思うよ。京の開発過程で途中で投げ出したベンダーを思い出すべき。


> ストレージの単価の低減が急激に起こることを考えると、ストレージの導入計画は適正か。


わからん。あまりこだわると、ストレージが足りなくてせっかくの計算機が遊んでしまう可能性はある。一般的に、スピード頑張っちゃうから、メモリとかストレージけちる傾向がある気がします。逆に少なすぎないか心配。


> スパコンの利用率は導入年度には低く、後年度に高くなることを考えると、性能はレベルアップ方式で調達すべきではないのか。


そうかも。ただ、利用者も使いながらスキルアップしていくので、この方式を採用するといつまで経っても利用率のパーセンテージは上がらない (利用されるコア×時間では増えるけど) ということにもなりかねん。


> 10ペタという開発目標は適正だったのか。


わからん。歴史が決める。


> 10ペタフロップスの性能に対して、1ペタバイトのメモリーは適正か。


私は少なめだと思う。先にも行ったようにメモリけちる傾向はあるとおもう。とはいえ、工夫で何とかなる部分でもあるから、ひどく少ないとは思わない。


> 文科省は、かつてLinpackで一位になった中国のスパコン「天河」に関して、「多くのアプリケーションで必要とされる主記憶との間のデータ転送性能が十分とは言えず、応用範囲は限定的。性能を引き出すためには専用の言語でのプログラミングが必要となるため、ソフトウェア試算の継承や流通が難しい」と指摘したが、なぜ、京では10ペタフロップスだけが強調されるのか。


京は天河にくらべてバランスが良い (はず)。Linpack 以外の、データ転送性能に影響されやすい多くのアプリケーションでより理論値に近い性能が出る (はず。詳しくは知らん)。


> スカラー型とベクター型の混合型が適正とした当初の計画から、スカラー型のみの計画に転換したのはなぜか。


これはクリアにして頂きたい、ってか、ほんとは知ってるんじゃないの?こんなことに関わる政治家たるもの、それを知るチャンネルを持っておくべき。


> 文科省は、自民党事業仕分け民主党政権事業仕分けで指摘されたことに対して、きっちりと答えていないではないか。


これはそうかも。きっちり答えるべき。


> 一部の学者のためのスパコンになっていないか。


超並列スパコンを (超並列スパコンとして) 使える技能を持つのは一部の学者だから、その通り。是非スパコン技術の普及を。


> なぜ、スパコン京の利用を一部の機関、一部のプログラムに優先的に割り当てる必要があるのか。


しらん。ってか、これは国家戦略だから、是非、政治家の方にも参加して頂きたい。もちろん、ちゃんとスパコンと科学技術に対する知識、知見と展望を持って長い間コミットしてくれることが条件。


> 今後のスパコン開発は何を目標とするのか。なんのためのスパコン開発をするのか。


スパコンがほしい人たち、各人各様の思惑がある。その最大公約数が「スパコンは必要」。はっきりしないよね。


> スパコン問題は根が深い。が、問題は、文科省がこの予算、このプログラムの目的に関して、明確に答えられないところにある。


なにをもって明確と言っているのか。他の最近の巨大プロジェクト、たとえば、天文の ALMA とかは明確なのか。


> スパコン問題は、科学技術振興予算のいわば入り口で、来年は4兆円を超えるかもしれない科学技術振興予算の全面的な見直しが必要だ。


それはそうかも。お金はそこそこ増えてきたのに、研究者たちは未来をあまり明るいものととらえることが出来ていない。そのせいもあって、科学技術の足腰は弱りつつある。減らすにしても、足腰を強くする方策を考えてほしいし、それこそ政治の力。河野氏が本気で取り組んでくれることを望む。<追記>
牧野さんが書かれていて、やっぱ本物は全然違いますね。

109. 「スパコン京への疑問」について(2011/11/16)
http://jun-makino.sakura.ne.jp/articles/future_sc/note110.html


とはいえ、消さずに恥はさらしておきましょう。