これは予測にすぎませんが、Apple は GCC に対して最適化の技術協力をしているはずですし、本田雅一氏 [impress.co.jp] の記事に Apple は GCC 3.3 を標準コンパイラにしようとしています。そうであれば最適化度はそう低くもないでしょうし、最適度が低いといって逃げてもいられないでしょう。
# まあ実際には一番速いのは IBM XL C++/FORTRAN でしょうが、# これは Mac OS X には(まだ)移植されてませんので比較のしようがないです。
For the rate metrics, multiple copies of the benchmarks are run simultaneously. Typically, the number of copies is the same as the number of CPUs on the machine, but this is not a requirement. For example, it would be perfectly acceptable to run 63 copies of the benchmarks on a 64-CPU machine (thereby leaving one CPU free to handle system overhead).
最適化の問題 (スコア:1, 参考になる)
両者とも100%の力を発揮できてるわけではないので、むしろPhotoshopがPCよりも快適に動いていた結果の方が説得力があると思うのですが、みなさんの意見はどうでしょうか?
それよりも32ビットでしか動いていないのなら、8GBのメモリは意味がないのかしら?
Re:最適化の問題 (スコア:2, 参考になる)
ただそれは全てにおいていえることで、シリアルATA等も同じでしょう。
現状、シリアルATAを活かしきれるドライブはないですからね。
今回のPowerMacはボトルネックになるものをできるだけ少なくなり、
全体のパフォーマンスがうまくあがっていると思います。
説得力は十分。
Re:最適化の問題 (スコア:1)
100%いかしきれているわけではないようですね。
ただそれは全てにおいていえることで、シリアルATA等も同じでしょう。
現状、シリアルATAを活かしきれるドライブはないですからね。
今回のPowerMacはボトルネックになるものをできるだけ少なくなり、
全体のパフォーマンスがうまくあがっていると思います。
パフォーマンスを出しやすくなったという感じでしょうかね。
ちなみに、PCで、今回のG5並のマザーを持ったものってあるんでしょうか?(珍しいかもしれませんが、PCって全然詳しくない)
後、仮定なんですが、もし同一クロックの場合、IntelとG5ってどちらがどのくらい速いんすかね?
とりあえず、会社でBuyNowしました。(結局8月末出荷らしいけど)
Re:最適化の問題 (スコア:1)
今までのMacってメインメモリのアクセススピードが滅茶苦茶遅いのと、Quartzが描画する際にメインメモリにアクセスする方法になっているので、キャッシュミスによるペナルティがかなり大きくて、実際のCPUの実力よりかなり落ちる状態になっていたと思うんです。
ベンチマークなどでキャッシュに総て収まるようなアプリだと早くても実際のアプリを使うとイマイチ、というのはこの辺に起因するんじゃないかと。
これはPCでも事情は同じですが、Quartzはキャッシュミスのペナルティが大きく出ます。
今回のG5はメインメモリのバススピードが8倍くらいになっている訳で実際のアプリの使用感の向上はかなりのものではないかと。
つまりベンチマーク比から予想されるよりも遙かに快適に使える予感がありありとします。
でもメインメモリのアクセススピードが追いついて無いんだよなぁ。メインメモリのバス幅も広くなってんでしょうか?
-----------------
#そんなワタシはOS/2ユーザー:-)
Re:最適化の問題 (スコア:0)
結構な頻度でmac関連のトピックにはaverage氏が書き込んでいるように感じたので
普通に使用している方だと思ってました。
あーでもよく考えたら誰にでも書けるようなトピでしか
見たことがないような気もしてきた。
Re:最適化の問題 (スコア:1)
済みません(^^;でもまぁ、CPUヲタ&OSヲタなのでご容赦を(^^;
-----------------
#そんなワタシはOS/2ユーザー:-)
Re:最適化の問題 (スコア:0)
Re:最適化の問題 (スコア:0)
#気がするだけなのでAC
Re:最適化の問題 (スコア:0)
http://www.zdnet.co.jp/news/0306/25/ne00_g5compare.html
FSBの遅さ(メモリ帯域の狭さ)をCPSの高さ(高実効率)で補ってきたのが、やっと実行ユニットに見合うFSBになったとも見えます。でもまだ帯域が釣り合っていない気がしますが。
Re:最適化の問題 (スコア:3, 参考になる)
G5(970)のFSBは、AlphaやAthlonに似たSource syncronousなP2P方式です。
ただし、1プロセッサごとに1GHzの32bitバスを2本並べて、メインメモリに対して同時にロード&ストアできる点で、Athlonよりもさらに進んだ方式となっています。これはPower4のFSB(433MHz 128bit×2)を受け継いだものです。
>でもまだ帯域が釣り合っていない気がしますが。
8GB/secのFSB×2に対して、メモリは64bitのPC3200デュアルで6.4GB/secだから、ちょっと供給が追いつかない。ですが、プロセッサ毎に96KBの1次キャッシュと512KBの2次キャッシュがあるので、なんとかなるのでしょう。
ジョブズは「12カ月以内に3GHz」、IBMも「将来性のあるロードマップがある」と言っていますが、3GHz時には最低でも1MBの2次キャッシュが欲しいですね。Athlon 64やPrescottも1MBの2次キャッシュを持つらしいですが、次期G5(980)についても1MB 2次キャッシュという噂が以前から流れていますね。
[tomoyu-n]
ダイサイズの縮小化 (スコア:1)
_____ Don't think you are, know you are.
Re:最適化の問題 (スコア:0)
Re:最適化の問題 (スコア:1)
あぁ、「ン」が消えてるんですよ。「ビーフン・カレー」ね。
Re:最適化の問題 (スコア:2, 参考になる)
2ch で言われていること [2ch.net]が本当であればこのストーリーのイチャモンは大嘘で、知ったかぶりが難癖付けているだけのようです。
引用すると、
また、Intel コンパイラの方が格段に速いということに対しては、Intel コンパイラが SPEC 用に最適化してある(3D Mark 対策と同じ原理)可能性が非常に高いので gcc にしたらしいです。
いや、みんな 2ch で言ってることをそのまま書いてるだけで本当かどうかはさっぱり分かりませんが。
Re:最適化の問題 (スコア:2, 参考になる)
GCC 3.3 が SPARC などのアーキテクチャで最適化が進んでいないのは確かですが、この際問題となるのは Pentium4 と PowerPC G5 の GCC 最適化度です。
Pentium4 は、GCC よりも高速なコンパイラとして Intel C++ Compiler(ICC) が容易に入手可能ですし、SPEC CPU2000 の計測では ICC を使うことがメジャーです。
この場合、GCC と ICC との性能差、つまり最適化度の差は客観的に示せます。
一方、GCC の PowerPC G5 最適化度はどうでしょうか。
あるコンパイラの最適化がどこまで進んだかは、そのプラットフォームで最速のコンパイラの比較をするしかありません。GCC 3.3 は CodeWarrier、Abosoft、NAGWare に対してどの程度 負けているのでしょうか?
これは予測にすぎませんが、Apple は GCC に対して最適化の技術協力をしているはずですし、本田雅一氏 [impress.co.jp] の記事に Apple は GCC 3.3 を標準コンパイラにしようとしています。そうであれば最適化度はそう低くもないでしょうし、最適度が低いといって逃げてもいられないでしょう。
# まあ実際には一番速いのは IBM XL C++/FORTRAN でしょうが、# これは Mac OS X には(まだ)移植されてませんので比較のしようがないです。
逆に、GCC がプラットフォームで最適化度が異なることを認めるのであれば、Apple の「コンパイラが同じならば(GCC3.3)、公平な比較ができる。我々はコンパイラの最適化機能をテストするのではなく、システムの性能を比較する必要があった」という主張は変です。
それぞれのプラットフォームで(現実的に入手が可能な中で)一番高速なコンパイラを使って測るのが理に適っています。
> 3. PPC970の結果もIBMのXLC/XLFコンパイラによる結果より低くなることを無視
IBM の XLC/XLF コンパイラを PowerMac G5 で計測した結果ってどこかにありましたか?
もしこの結果が MPF2002 に出した「予測値」だとしたら、今回のPowerMac G5 で実機計測した結果と直接比較しないのは妥当だと思います。
> 2. POWER4(970も同じ)対応の最適化フラグにケチをつけている
これはおそらく DELL側(Pentium4) が "-O3 -march=pentium4 -mfpmath=sse" と最適化オプションを3つ指定しているのに、PowerMac G5 が "-fast" と 1つで済ませている点だと思います。
# VeriTest のレポートを読む限り -fast で G5 アーキテクチャ対応まで指定するらしい。
これにケチがつくのは、 base は最適化オプションは 4 つまでという制限があるからです。プロファイルの結果を使うフィードバック最適化(FDO)は 1 と数えて、Pentium4 は 3+1 =4 でおしまい。PowerMac G5 は、FDO で 2つで、ライブラリ(-lstmalloc) で 3つの最適化オプションを指定したことになります。
まあ目クジラを立てる程ではないですけど。
# あと VeriTest のレポートを読むと "-mfppath=sse" は SSE2 は使わないとあるのですが、
# 本家のレス [slashdot.org]の中には SSE2 命令が有効になるとあります。
# また "-mfppath=sse" は指定すると返って遅くなるとか、
# "-ffast-math" を指定すべきだったとかいろいろ紛糾しています。
個人的にはオプション絡みでいうと、PowerMac 側にのみ ONESTEP=yes が指定されているのはなぜか?とか、Pentium4 の NAGWare F95 で -O4 ではなく -O3 を使ったのはなぜとか、そもそも NAGware F95 を選択したのはなぜかなどいろいろ疑問は沸きます。
# -O4 は指定すると返って遅くなったのかもしれません。
> 4. SPECrateわシングルプロセッサ対応のベンチを物理プロセッサ数だけ、並列に
> 動かした結果なので、HyperThreadingを有効にするとかえって遅くなること
HT を有効にすると遅くなるのは本当ですが、前半に引っかかります。
SPEC rate の並列度(copy数)は、物理プロセッサ数に合わせなければいけない縛りはないです。
[spec.org]
Q & A の 15
Run Rule [spec.org]
コンタミは発見の母
Re:人間コンパイラーは? (スコア:1)
ただし、 SPEC の公式スコアとして登録するには 計測に使ったすべてのコンポーネントが発表から 3ヵ月以内に入手可能なこと [spec.org] という制限を満たす必要があります。
3ヵ月以内に「人間コンパーラ」を培養するなり複製するなりして、 一般の人が入手可能な状態にする必要があります。
コンタミは発見の母
Re:まぁ、かわいそうなので (スコア:0)
Re:まぁ、かわいそうなので (スコア:0)
Re:最適化の問題 (スコア:1)
作りにもよりますが、カーネルが32bitで動いていても、アプリケーションが32bit以上のメモリにアクセス出来る様に作ることは出来ますね。
後、プロセスが2GByte位メモリを使うとして、同規模なアプリを数個立ち上げてもスワップしない、とかいう可能性もあるでしょう。
でも、Appleがそこまでやるのかどうかは分かりませんなぁ。
アプリがアクセス出来る空間を広げるのはそんなに大変じゃないとは思うんですが、どーも見ている限りだとシステムが出来たのがつい最近のよーな気がするので、OSに手を入れるのが間に合うのかどうか・・・
-----------------
#そんなワタシはOS/2ユーザー:-)
Re:最適化の問題 (スコア:1)
利用できます。
後藤さんの記事 [impress.co.jp](※その訂正 [impress.co.jp])によれば、
「PowerPC 970では、32bit OSが32bitメモリ空間の4GB以上のメモリ空間にもアクセスできる。これは、新しい「Segment Lookaside Buffer(SLB)」の最初の16エントリをセグメントレジスタとして使うことで実現する」
そうです。
[tomoyu-n]
Re:最適化の問題 (スコア:1)
少なくとも、OSのメモリマネジメント回りとスワップ回りは64bit化しないとアプリはアクセス出来ません。
特にスワップ関係を実装するのは手間取りそうな気が。(だからPantherが遅れている?)
実際x86系は64TByteまでアクセス出来ますが、利用できるアプリは一個もありません。
-----------------
#そんなワタシはOS/2ユーザー:-)
Re:最適化の問題 (スコア:1)
>少なくとも、OSのメモリマネジメント回りとスワップ回りは64bit化しないとアプリはアクセス出来ません。
Mac OS XのDarwinに使われているMachにしろFreeBSDにしろ、すでに64bitに対応しているOSなので、Pantherについては、あまり技術的問題はないのでは?
現行のOSも、G5専用に改良を加えた10.2.7(G5)というバージョンで、8GBアクセス可能なようです(要確認)。ただ、8GBをリニアに使えるかどうかは?(「セグメント」で対応するなら無理な気がします)。
[tomoyu-n]
Re:最適化の問題 (スコア:1)
いや、現時点ではpanther自体は32bitで動く、とAppleも仰ってますし、カーネル自体は32bitでいくんじゃないですか?G4をまだまだ使うiBookやiMacもあることですし、カーネルが64bitになるのはiMacとiBookにG5が降りてきてから、じゃないでしょうかね。
ただ、OSとアプリがリニアに4GByte以上アクセスするのはカーネルが32bitでもそんなに技術的に難しくないです。高位メモリをアクセスするスペシャルAPIを一発用意するだけでオッケーだと思います。
ただ、使えるのはデータ領域でコードの領域としては使わないと思いますけど。
というか、コードの量が4GByte越えるならそれはプログラム自体が既に怪しいですねぇ:-)
-----------------
#そんなワタシはOS/2ユーザー:-)
Re:最適化の問題 (スコア:1)
Re:最適化の問題 (スコア:0)
Enterprise Memory Architecture [microsoft.com]って仕組みが
まさにそれだが何か?
Re:最適化の問題 (スコア:0)
いや、あちらはセグメントで拡張するので4GByte以上はリニアにアクセス出来ませんが、G5の場合、そもそもセグメントレジスタっぽい
Re:最適化の問題 (スコア:1)
さすがビル様、10数年前とポリシーが変わらなくて天晴れ、てな感じですか。
Re:最適化の問題 (スコア:1)
trueOne
Re:最適化の問題 (スコア:1)
PC Watchにアップルの担当者へインタビュー記事 [impress.co.jp]が出ましたね。
やはり、各ユーザープロセスは4GB以下に制限され、その合計が8GB以内ということだそうです。
[tomoyu-n]
Re:最適化の問題 (スコア:1)
私もその記事を読みまして, 最初に思ったことが
「OSXだめじゃん」
これならXeonと変わらないんで, 結局のところ64bitリニア空間を低価格で使いたかったら, 今現在ではOpteron+Linux(*BSDはまだ不安かな)って組み合わせしか無いんですね.
Re:最適化の問題 (スコア:0)
……何に使うの??
いや、もちろん「そうなったら嬉しい」使い道は山ほどあるだろうけど、
>今現在ではOpteron+Linux(*BSDはまだ不安かな)って組み合わせしか無い
これに限定した場合に嬉しいことって……理解不能だよ。。。
Re:最適化の問題 (スコア:0)
分野ではまだまだ性能が欲しいところです。だいたい最新の
ハードウェアなんて一般人には手がでない価格でしょ?
たとえば。
ハードウェア記述言語 verilog のコードを FPGA に落とす時間
がちょっとでも短くなってくれればこれほど嬉しいことないで
すね。シミュレーションだと
Re:最適化の問題 (スコア:0)
Re:最適化の問題 (スコア:0)
ということは、PPC linuxで、いち早く64bitリニア空間に対応すれば、PPC linuxの大きな売りになる?
Re:最適化の問題 (スコア:0)
64bit リニアは……対応してないわけじゃないのですが、今ある実装だとカーネルの空間がうにゃむにゃなので512MBが限界っぽいです。
# Fault handler にカーネルも対応させないとダメぽ、たぶん……仕事がらみなのでACで
Re:最適化の問題 (スコア:0)
何をもって高速と主張しているのでしょうか?
基調講演でのデモを理由とするのはAppleを信用しすぎでは?
Re:最適化の問題 (スコア:0)
明らかに早く終わってるんですから、高速は高速ですよ
あれだけ差がついてるんだから、数十%サバを読まれていたとしても高速だと思いますよ。
少なくともPCに及ばないということはないわけで、ハイエンドの価格比較をしてみれば意外とPowerMacG5がお買い得である気はします
Re:最適化の問題 (スコア:0)
# G3-400MHz 320MB vs Celeron400MHz 256MB
# (Photoshop メモリ効率100%)
# (個人的見解に過ぎないので、意見にもならない)
Re:最適化の問題 (スコア:0)
Re:最適化の問題 (スコア:0)
むちゃくちゃ。
Celeron400MHzは数世代前のコアで、しかも当時でも廉価品で遅い方のプロセッサでしょう……。
Re:最適化の問題 (スコア:0)
>しかも当時でも廉価品で遅い方のプロセッサでしょう……。
それをゆーたらG3だってそーですが・・・
Re:最適化の問題 (スコア:0)
そのCeleronは同時期のPentium3に比べてキャッシュ量、レイテンシ、バスクロック等を
制限された物ですよ?チップセットも往々にして廉価版が宛がわれています。
今はともかく、フラッグシップモデルにも搭載されてきたG3と比較するのはフェアで
はないという事です。
Re:最適化の問題 (スコア:0)
Re:最適化の問題 (スコア:0)
それはどのメーカも同じこと。十分に勝てるところがあって、それを公開の場で
ちゃんと見せてくれるなら、その部分は認めるべきだよ。
32ビット/64ビット (スコア:0)
メモリーアドレッシングは当然64bit化されるんでしょうが、
RISCチップの命令コードが64bitである必要は全然ないだろうし
long-longな変数はコンパイラがどうにかしてくれると思うので
正直よくわかりません。
Re:32ビット/64ビット (スコア:0)
Re:32ビット/64ビット (スコア:0)
出来ないなら、帰るべきはあなた。
で、どこに帰るの?
Re:最適化の問題 (スコア:0)