FC2カウンター

カテゴリー

月別アーカイブ

最近の記事

最近のコメント

最近のトラックバック

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

Bloomfield 2.93GHzと2.66GHzのベンチ

Tom'sHardware 'Nehalem' 2.93 GHz Benches Revealed
2.93GHzの方は一部Nehalem@2.93GHz+Radeon HD 4850のベンチの結果が使われているようですが、比較対象があり見やすくなっています。
Bloomfield@2.93GHzは同クロックのCore 2 Extreme QX6800やPhenom 9850 BEと比べても性能がかなり高いのが分かりますね。
PCMark 05ではPhenom 9950 BEよりも28%高速だったようです。

一方Bloomfield@2.66GHzのSandraベンチが掲載されています。
3.2GHzのQX9770やQX9650と比較されていますが、クロックで劣るBloomfieldの方が圧倒的に高いスコアを出していますね。
特にMulti-Media Floatの値がQX9770の1.5倍程もあります。
まだまだゲーム性能などが気になりますが、相変わらず高く安定した性能ですね。

コメント

同クロック同士だと、2倍近いですね。
HTTが大きいと思いますが、それでだけではなくSSE命令の高速化やループキャッシュの影響ですかね。


Multi-Core Efficiencyも注目してます。
256KBまでのデータ交換でものすごい速さになってますが、256KBといえばL2キャッシュのサイズですが、この異様な速さは
Nehalemの速さを解くカギになりそうです。

http://www.hardspell.com/pic/pic.asp?picurl=http://www.hardspell.com/pic/article/2008/7/9/59210a5d-3495-411b-95e6-c7dbc459ef7f.jpg


http://journal.mycom.co.jp/special/2008/phenom01/012.html

ほぼ同じ構造のphonomはとても遅いので、Nehalem似て非なるキャッシュアクセスなのでしょう。

Multi-Core Efficiencyの256kBまでが非常に良いのはキャッシュ構造が変わり、L2のレイテンシが小さくなったからでしょうね。
そのかわり256kBを越えるとL3にアクセスしてしまうのでレイテンシが大きくなり、Core 2シリーズよりも若干低くなっています。
Nehalemの安定した性能もそこにあるのでしょうかね。

AMDは相変わらずMulti-Core Efficiencyの部分は苦手なようですが・・・
構造的にはそれほど変わらないように見えるんですけどね。

個人的な推測で言わせてもらいますと、PhenomのL3は基本的にに排他構造で各コアのL1、L2同士でのデータ交換になるのでXBARを経由しての交換を行っているのでしょう。ここは大原氏と同じ意見です。
ただ、L3にデータがある場合、4倍に帯域が広がる点からすると、各コア計4本のバスが稼働しているものと推測されます。

わからないのはIntelで、Core2は共有L2にもかかわらず、なぜ小容量データでAMDとほぼ同じ速度なのかという点。
推測としては共有バスを採用しているせいで、L1-L2間のバスが一本しかない。2コアで一本を共有なので、条件がAMDと同じになってしまうのではないかと。QuadCoreだと、2本あるので倍になると。

Nehalemはここが強化されてて、L1-L2-L3までのバスが、各コアに1本づつ用意されてる。つまりCore2QUadの2本から4本に増えてる。
また大原記事では、L1-L2間はスレッドあたりでアクセス出来るみたいな事を書いてますので、4コアで計8本持っていることになります。Core2Quadでは、2本しかないので4倍に広がっています。
と考えると、Nehalemは各コア間のデータ交換能力は非常に高められていると考えられます。
というかCore2が本来4本あるべきが2本しかなく細いだけなんですけどね。
この辺は、モバイル向けで低消費電力を追求した結果、バス(アンコア)をケチったせいかもしれない。
オレゴンがアンコアを強調するのも、わかる気がします。

32kB以下の性能が低いのは気になりましたが、そういう事ですか。
そう考えると納得できますね。

Core MAの設計思想が元々モバイル向けに近かったからじゃないでしょうかね。
イスラエルチームはモバイル向けに力を入れてきましたし。
そこでデスクトップ向けに力を入れていたオレゴンチームがアンコアを強調し、バスを増やしたのかもしれません。
元から段階的に改良していくつもりだったのかもしれませんが。

そうですね。各コアに1本L1-L2のバスが用意されているならCore2DuoがXBAR経由のAthlon64と、そう変わらないというのは遅すぎると思います。2コアで共有しているなら、Duoで一本ですので、Athlon64と条件は合います。

Nehalemは当初L2 256KBと少ないのでどうなのかな?と思いましたが、何とかなりそうな気がしました。

>元から段階的に改良していくつもりだったのかもしれませんが。

これをそのままnativeQuadにするのは無理だったでしょうね。
4コアで1本ではコア当たり0.25本しかなく、1/4回しかL2にアクセスできなくなってしまいます、優先順位が低いとそれ以下になってしまうでしょう。
これはCore2の構造的欠陥かもしれません。
QuadCoreでは別の方法を考えたとおもいます。

一方、Nehalemは他コアに気兼ねなくL2にアクセスできるでしょう。

3階層のキャッシュ構成はかなり良いですね。
L3も速くは無いですが、E6700のキャッシュよりは速いですし。
今までのキャッシュ構造にL3を追加したというよりは、L1と若干低速なL2をL3と置き、その間に今までのL2と比べると高速な小容量のキャッシュを追加したという感じですかね。

Core2の構造的欠陥・・・ですかね。
実際はそこまで性能に影響を与えていないので欠陥とまではいかないとは思います。
そういえばConroeは64bit時にMacro-Fusionが効かないという弱点がありましたね。
これは欠陥と呼べるものだと思いますが、Penrynで解消はされたようですね。

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバックURL:
http://pctukuru.blog86.fc2.com/tb.php/1045-47b48d86

FC2Ad

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。