Cacheabhängigkeit

Manchmal gibt es dann doch Produkte, die man nicht rausbringen sollte, weil dann die Schwächen des gesamten Konzepts zu Tage treten. Die Core-Architektur ist so etwas. Es gibt eine ganze Reihe von Leuten, die sagen, das die Core-Architektur sehr gut ist, aber in einer mediokren Plattform in Form des FSB gefangen ist und nur durch grosse Caches so halbwegs ihre Stärken ausspielen kann. Leider konnte das nie so recht bestätigt werden. Jetzt hat Intel ein Produkt herausgebracht, das diesen Nachweis erbringt: Conroe-L. Im Grunde ist dies ein Conroe , dessen Cache auf ein Achtel reduziert wurde. Statt 4 MB hat der Prozessor nunmehr nur 512 KByte L2 Cache. Ausserdem scheint der Frontside-Bus auf 800 statt 1023 MHz zu laufen. Für diesen wurden jetzt Ergebnisse für den SuperPI-Benchmark bekannt. SuperPI ist wie der Name schon sagt ein Programm, die die Berechnung von Pi auf extrem viele Stellen durchführt und gerne im Amateurbereich zur Bewertung der Prozessorperformance benutzt wird. Conroe-L erreicht in diesem Benchmark eine Durchlaufzeit von etwa 32.5 Sekunden. Der entsprechende Benchmark kann hier betrachtet werden. In einem Forenthread bei HardOCP konnte für einen Conroe bei gleicher Taktung eine Durchlaufzeit von 21 Sekunden erreicht werden. Die beiden genannten Faktoren(kleinerer Cache und FSB-Verlangsamung) verlängern also die Laufzeit um etwa 50 Prozent. Wenn man davon ausgeht, das der Performanceverlust zu etwa 20 % dem langsameren FSB zuzurechnen ist, dann verbleiben immer noch 30 % die dem verkleinerten Cache zuzurechnen sind. Warum ist das nun interessant. Ob ich nun den Cache bei einem bestehenden Workset verkleinere, oder ein groesseres Workset auf einem bestehenden Cache vergroessere, duerfte ungefähr die gleiche Auswirkung haben. Letztlich bedeutet dies, das etwa 30 Prozent meiner Leistung verliere, sobald ich Worksets habe, die groesser sind als der Cache. Nungut, dieses Phänomen ist allen Prozessorplattformen zu eigen, jeder Prozessor wird langsamer, sobald er auf den Arbeitspeicher zugreifen muss. Es ist nur abhängig von der Gesamtarchitektur, wie gross dieser Verlust ist. Verliert beispielsweise der Athlon 3700+ beispielsweise 512 kb Cache (also benchmarkt man einfach den 3500+, das ist der wesentliche Unterschied zwischen Athlon 64 3500+ und 3700+) so bricht die Performance nur um etwa 5 Prozent zusammen, wenn man die Quantispeed-Werte zur Grundlage nimmt (ich werde die Superpiwerte nachreichen, sobald ich welche gefunden habe, die nicht irgendwelchen Overclocking-Massnahmen zu verdanken sind). Was ist nun die Moral aus der Geschichte: Intel weisst mit dem Conroe-L sehr stark auf die Cacheabhängigkeit der Core-Architektur in der FSB-Plattform hin. Da Woodcrest im Grunde genommen Core ist und dort die Worksets in der Regel sehr viel groesser sind, weiss ich nicht, ob man sich damit einen Gefallen getan hat.