AMD Instinct MI250Xは49.6TFlops@DPを達成?

videocardz.comさんより、AMD Instrinct MI250Xの性能のリークが出ています。

videocardz.com

TDPが500Wに対し、倍精度で49.6TFlopsの性能と書かれています。これが本当だとすると、カタログスペックでは100GFlops/Wと、他社の競合製品を一気に引き離す性能を実現可能になります。
近年のRadeon系はカタログスペックが非常に良いので、あとはソフトウェアスタックがもう少しNVIDIAに追従してくれば、いい勝負ができるのではないかと数年間言い続けているような気がしますね。まぁこれはFrontierとORNLの頑張り次第なのではないかと思うところはあります。

ただ、気になるのは、FP32とDPの性能が同一であるということです。
近年では、TensorCoreに代表されるように行列演算回路を積むのがトレンドとなっていますが、FP32とDPの性能が同一ということは、FP32を処理するときにDPに変換するということです。つまり回路的にはDP回路しか入っていないことになります。同様の仕組みでFP32を処理していたのは京のプロセッサのSPARC64 VIIIfx、開発コードVenusでした。Venusの場合は、科学技術計算用ということで倍精度だけでいいだろうという判断がされたのでしょうが、AMD Instinctはディープラーニングの学習のことを考えるとFP32性能も捨てるわけにはいかないのではないかと考えられます。

いずれにせよ、製品が出てくるのを楽しみにしたいところです。