パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Power Mac G5は「世界最速PC」か」記事へのコメント

  • 最適化の問題 (スコア:1, 参考になる)

    by Anonymous Coward
    ZDnet・PCupdate [zdnet.co.jp]のAppleのソフトウェアプロダクトマーケティング担当シニアディレクターであるブライアン・クロール氏のインタビュー [zdnet.co.jp]によれば、Mac OS Xのカーネルは32ビットで動作し、それは次期OSであるPantherでも変わらないとのこと。
    両者とも100%の力を発揮できてるわけではな
    • Re:最適化の問題 (スコア:2, 参考になる)

      by Anonymous Coward on 2003年06月26日 12時20分 (#345831)

       2ch で言われていること [2ch.net]が本当であればこのストーリーのイチャモンは大嘘で、知ったかぶりが難癖付けているだけのようです。
      引用すると、

       1. x86対応以外のGCCの最適化性能わ低いことを無視
       2. POWER4(970も同じ)対応の最適化フラグにケチをつけている
       3. PPC970の結果もIBMのXLC/XLFコンパイラによる結果より低くなることを無視
      そしてこれが最大の誤解すけど、
       4. SPECrateわシングルプロセッサ対応のベンチを物理プロセッサ数だけ、並列に
        動かした結果なので、HyperThreadingを有効にするとかえって遅くなること

       また、Intel コンパイラの方が格段に速いということに対しては、Intel コンパイラが SPEC 用に最適化してある(3D Mark 対策と同じ原理)可能性が非常に高いので gcc にしたらしいです。
       いや、みんな 2ch で言ってることをそのまま書いてるだけで本当かどうかはさっぱり分かりませんが。

      親コメント
      • Re:最適化の問題 (スコア:2, 参考になる)

        by nminoru (5013) <nminoruNO@SPAMnminoru.jp> on 2003年06月26日 22時29分 (#346253) ホームページ
        > 1. x86対応以外のGCCの最適化性能わ低いことを無視

        GCC 3.3 が SPARC などのアーキテクチャで最適化が進んでいないのは確かですが、この際問題となるのは Pentium4 と PowerPC G5 の GCC 最適化度です。

        Pentium4 は、GCC よりも高速なコンパイラとして Intel C++ Compiler(ICC) が容易に入手可能ですし、SPEC CPU2000 の計測では ICC を使うことがメジャーです。
        この場合、GCC と ICC との性能差、つまり最適化度の差は客観的に示せます。

        一方、GCC の PowerPC G5 最適化度はどうでしょうか。
        あるコンパイラの最適化がどこまで進んだかは、そのプラットフォームで最速のコンパイラの比較をするしかありません。GCC 3.3 は CodeWarrier、Abosoft、NAGWare に対してどの程度 負けているのでしょうか?

        これは予測にすぎませんが、Apple は GCC に対して最適化の技術協力をしているはずですし、本田雅一氏 [impress.co.jp] の記事に Apple は GCC 3.3 を標準コンパイラにしようとしています。そうであれば最適化度はそう低くもないでしょうし、最適度が低いといって逃げてもいられないでしょう。
        # まあ実際には一番速いのは IBM XL C++/FORTRAN でしょうが、# これは Mac OS X には(まだ)移植されてませんので比較のしようがないです。

        逆に、GCC がプラットフォームで最適化度が異なることを認めるのであれば、Apple の「コンパイラが同じならば(GCC3.3)、公平な比較ができる。我々はコンパイラの最適化機能をテストするのではなく、システムの性能を比較する必要があった」という主張は変です。
        それぞれのプラットフォームで(現実的に入手が可能な中で)一番高速なコンパイラを使って測るのが理に適っています。

        > 3. PPC970の結果もIBMのXLC/XLFコンパイラによる結果より低くなることを無視

        IBM の XLC/XLF コンパイラを PowerMac G5 で計測した結果ってどこかにありましたか?
        もしこの結果が MPF2002 に出した「予測値」だとしたら、今回のPowerMac G5 で実機計測した結果と直接比較しないのは妥当だと思います。

        > 2. POWER4(970も同じ)対応の最適化フラグにケチをつけている

        これはおそらく DELL側(Pentium4) が "-O3 -march=pentium4 -mfpmath=sse" と最適化オプションを3つ指定しているのに、PowerMac G5 が "-fast" と 1つで済ませている点だと思います。
        # VeriTest のレポートを読む限り -fast で G5 アーキテクチャ対応まで指定するらしい。

        これにケチがつくのは、 base は最適化オプションは 4 つまでという制限があるからです。プロファイルの結果を使うフィードバック最適化(FDO)は 1 と数えて、Pentium4 は 3+1 =4 でおしまい。PowerMac G5 は、FDO で 2つで、ライブラリ(-lstmalloc) で 3つの最適化オプションを指定したことになります。
        まあ目クジラを立てる程ではないですけど。

        # あと VeriTest のレポートを読むと "-mfppath=sse" は SSE2 は使わないとあるのですが、
        本家のレス [slashdot.org]の中には SSE2 命令が有効になるとあります。
        # また "-mfppath=sse" は指定すると返って遅くなるとか、
        # "-ffast-math" を指定すべきだったとかいろいろ紛糾しています。

        個人的にはオプション絡みでいうと、PowerMac 側にのみ ONESTEP=yes が指定されているのはなぜか?とか、Pentium4 の NAGWare F95 で -O4 ではなく -O3 を使ったのはなぜとか、そもそも NAGware F95 を選択したのはなぜかなどいろいろ疑問は沸きます。
        # -O4 は指定すると返って遅くなったのかもしれません。

        > 4. SPECrateわシングルプロセッサ対応のベンチを物理プロセッサ数だけ、並列に
        >   動かした結果なので、HyperThreadingを有効にするとかえって遅くなること

        HT を有効にすると遅くなるのは本当ですが、前半に引っかかります。
        SPEC rate の並列度(copy数)は、物理プロセッサ数に合わせなければいけない縛りはないです。
        [spec.org]
        Q & A の 15

        For the rate metrics, multiple copies of the benchmarks are run simultaneously. Typically, the number of copies is the same as the number of CPUs on the machine, but this is not a requirement. For example, it would be perfectly acceptable to run 63 copies of the benchmarks on a 64-CPU machine (thereby leaving one CPU free to handle system overhead).

        Run Rule [spec.org]

        3.2.2 Nu

        --
        コンタミは発見の母
        親コメント

※ただしPHPを除く -- あるAdmin

処理中...