Table 3を見ると,倍精度になっています.(Full Precision) Power Mac G5 Dualで倍精度で計算する時の理論的ピーク値は
一度に実行できる演算数/1数値演算ユニット x 数値演算ユニットの数/1CPU x 動作周波数 x プロセッサの数
とすると,G5の数値演算ユニットは積和演算("a*b+c"=2FLOP/S)が出来るので,
2 x 2 x 2(GHz) x 2112 = 16896(GFLOP/S)
となります.これで実測値を割ると,
8164(GFLOP/S) / 16896(GFLOP/S) = 0.483
と.資料の通りになります.(この手のベンチマークは倍精度演
効率 (スコア:2, 参考になる)
単
Re:効率 (スコア:3, 参考になる)
一度に実行できる演算数/1数値演算ユニット x 数値演算ユニットの数/1CPU x 動作周波数 x プロセッサの数
とすると,G5の数値演算ユニットは積和演算("a*b+c"=2FLOP/S)が出来るので,
2 x 2 x 2(GHz) x 2112 = 16896(GFLOP/S)
となります.これで実測値を割ると,
8164(GFLOP/S) / 16896(GFLOP/S) = 0.483
と.資料の通りになります.(この手のベンチマークは倍精度演
Re:効率 (スコア:2, 参考になる)
>64bitでは一回で出来ますから,もう少しパフォーマンスが上がると思います.
一般に倍精度の演算を行う浮動小数点レジスタは80bitあります。
PowerPC 745x(G4)もPowePC 970(G5)も、2次キャッシュは256bit幅で接続されています。
つまり32bitモードでも既に、倍精度浮動小数点のデータは64bit単位で入出力されているはずですから、64bitアプリに再コンパイルしても、性能向上は望めないでしょうね。
#Pentium以降の32bit CPUのデータバスが64bitになったのは
[tomoyu-n]
Re:効率 (スコア:1)
浮動書数点数のレジスタが 80 bit 幅なのは IA-32 くらいで、
SPARC も MIPS も Alpha も PowerPC も、80 bitではないです。