PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Cell


Lord Darth Anubis
30.12.2007, 21:25
hi,
ich hab mich gefragt:
da der cell bei einfacher genauigkeit über 200 GFLOPS kommt... wie schnelld er wohl beim decodieren ist. (videos usw)
hat jemand von euch schon mal was davon gehört dass jemand es versucht hat (mit linux) videos zu decodieren bzw umwandeln?


ich frage mich auch:
bei einfacher genauigkeit liegt der cell über 200GFLOPS
"... Ingesamt leistet der Cell BE Spitzenwerte von über 256 GFLOPS bei einfacher und über 26 GFLOPS bei doppelter Genauigkeit. ..."
http://www.tecchannel.de/server/prozessoren/444414/index8.html (http://forum1.onlinewelten.com/redirector.php?url=http%3A%2F%2Fwww.tecchannel.de% 2Fserver%2Fprozessoren%2F444414%2Findex8.html)

hmm das sagt mir eigentllich net viel (reine leistung für die games)
ähm... was wird eigentlich bei den spielen eh verwendet? bzw was bedeuten diese "genauigkeiten"? und in wie fern ist diese "doppelte" besser als "einfache"?

kann mir jemand da weiter helfen?


EDIT: hab bei wikipedia nachgeguckt:
einfache heißt 32bit und doppelte 64bit
hmm die meiste spiele sidn ja sowieso auf 32bit-systeme programiert. von daher sind diese 256GFLOPS enorme leistung was der cell da auf die reihe kriegt. oder?

ja ich weiß, man muss erst richtig speile für den cell programieren. aber wenn man das tut dann konnte man ja eine enorme steigerung der KL/KI damit bewirken. zb ein richtiges schachspiel für sehr fortgeschritene schachspieler. vllt solte man wieder kasparov vs PC (in diesem fall ps3) machen^^

was sagt ihr zu den leistungen im bereich "einfach" und "dopelt"?

Velve Veldruk
30.12.2007, 22:04
Der Cell Broadband Engine Prozessor der Playstation 3 erreicht eine theoretische Rechenleistung von 204,8 Giga-FLOPS, was rein rechnerisch doppelt so viele sind wie bei der von Microsoft entwickelten Xbox 360. Die tatsächliche Nutzleistung hängt stark von der Anwendung und dem Optimierungsaufwand ab. In der Paradedisziplin, Matrizenmultiplikation mit einfacher Genauigkeit, erreicht ein Cell mit 8 SPUs tatsächlich etwa 200 GFLOPS, bei doppelter Genauigkeit reduziert sich die Performance um Faktor 14, auf etwa 14 GFLOPS. Vergleicht man die Ergebnisse des Linpack Benchmarks, liegt der Cell mit 14,63 GFLOPS etwa gleichauf mit einem mit 3,6 GHz getakteten Intel Pentium 4.

Quelle: http://de.wikipedia.org/wiki/PlayStation_3

Also den kompletten Text sollte man auch lesen.

Was einfache- und doppelte Genauigkeit angeht, das sind Begriffe aus der
Informatik und zwar beschreiben sie die Darstellung einer Zahl im Speicher.
Einfache Genauigkeit: Nach der IEEE 754 Norm eine Zahl die 32Bit im
Speicher belegt.
Doppelte Genauigkeit: Nach der selben Norm eine Zahl die 62Bit im Speicher
belegt. Damit kann eine doppelte Genauigkeit bei Berechnungen erreicht
werden. Also mit den Zahlen nach dem Komma.

Matrizen sind die Grundlage jeder modernen 3D Engine heutzutage und diese
Werte können die Performence bei 3D Berechnungen wiedergeben.
Bei Berechnungen mit doppelter Genauigkeit gibt es eben "genauere" Resultate.
Wie dies verwendet wird kann ich dir leider nicht sagen. Soweit bin ich im
Studium noch nicht. (also wie dies in der Praxis von den Spielerentwicklern
realisiert wird)

Der Cell ist wirkich ein Supercomputer für bestimmte Anwendungen, man sollte
ihn jedoch nicht überbewerten.

Lord Darth Anubis
31.12.2007, 00:43
ok, du hast den link zur wiki mit gegeben.
die frage ist ob es stimmen soll was da über den cell steht...

früher war ich mir sicher dass es so sein muss was da steht, aber vorkurzem hab ich das hier gefunden. ichs ende den link noch mal mit:

http://www.tecchannel.de%2Fserver%2Fprozessoren%2F444414% 2Findex8.html

"...
Alleskönner oder Hype - der Cell-BE-Prozessor

http://www.tecchannel.de/img/spacer.gif
Leistung

Mit ihrem Register (javascript:MM_Glossar(1446);) File kann die SP sechzehn 8-Bit-, acht 16-Bit-, vier 32-Bit-Integer- oder vier Gleitkomma-Zahlen pro Taktzyklus bearbeiten. Bei 3,2 GHz Taktfrequenz liefert eine SPE damit 4 x 3,2 GHz = 12,8 GFLOPS, alle acht insgesamt 8 x 12,8 = 102,4 GFLOPS Rechenleistung. Nach sechs Taktzyklen (Latenzzeit) ist das Ergebnis bei einfacher Genauigkeit verfügbar. Bei doppelter Genauigkeit (zwei 64-Bit-Gleitkomma-Zahlen) kann alle sieben Taktzyklen mit einer totalen Latenzzeit von dreizehn Taktzyklen eine Operation initiiert werden.

Üblicherweise wird die Angabe der FLOPS-Leistung mit dem Faktor 2 multipliziert, wenn das System Multiplikation und Addition zusammen in einem Zyklus (Multiply-Add-Instruction) durchführen kann. Damit ergibt sich für den Cell BE eine Rechenleistung von 25,6 GFLOPS beziehungsweise 204,8 GFLOPS für alle SPEs. Dies ist konform zur Angabe seitens IBM (http://www.tecchannel.de/server/prozessoren/444414/index8.html#), das heißt 2 x 8 x 4 = 64 Gleitkomma-Operationen pro Taktzyklus. Ingesamt leistet der Cell BE Spitzenwerte von über 256 GFLOPS bei einfacher und über 26 GFLOPS bei doppelter Genauigkeit.

... "

also der wert bei wiki mit 200GFLOPS könnte hinhauen, da bei der ps3 sind nur 7 SPEs im einsatz sind bzw sogar 6. aber bei der doppelten genauigkeiten sind die werten weit unterschieden. 14,63 gegen 26

oder sind es 14,63 mit 7 SPEs im einsatz? dann das könnte den unterschied auch erklären.

oder sehen wir hier ein fänomen der verschiedenen meinungen? (es werden andere fakten und zahlen über eine und die selbe sache geschrieben.


sagen wir mal so, zuvor hat mich der cell nicht beeindruck (nach dem ich gelesen hab was bei wiki steht). naja dann habe ich den "techchannel" per zufall endeckt. seit dem bin ich der meinung dass der cell doch schon was besonderes ist als ich es gedacht hab.
vllt stehen die fakten bei techchannel ausführlicher als bei wiki oder genauer... ich denke mal dass so ählich auch bei wiki stehen soll. den bei techchnannel steht wenigstens (mehr oder weniger) wie man auf die GFLOPS-zahlen kommt.
und wiki wirkt für mich nach amateuren arbeit (die schon ahnung haben aber schlecht wiedergeben), was mir ein gefühl gibs dass es nicht unbedingt stimmen soll.


" Der Cell ist wirkich ein Supercomputer für bestimmte Anwendungen, man sollte
ihn jedoch nicht überbewerten."
welche anwendungen meinst du? hab gehört dass der cell für multimedia gut sein soll, aber für spiele nicht besonders. ich denke aber dass man mit dem cell eine sehr gute künstliche intelligenz simulieren kann. denn der cell hat ja vektorenprozessoren und die waren früher nur in den supercomputern drinne. (dank sony ist es jetzt für heimunser zugänglich)
naja, und diese supercomputer berechnen irgendwelche komplezierte simulationen. und meiner meinung nach ist diese künstliche intelegenz eine art von simulation.
auf anderer seite hab ich gehört dass einer von spielehersteller hat gesagt dass die cpus heutigen consolen nicht gut genug für ein bestimmtes spiel sind. (ich glaube es war die rede von crysis, bin mir nicht sicher)

es gibt ja multimedia, k.intelligenz und physik... (beschränken wir uns jetzt auf die drei, es seiden du meinst dass der cell für was anderes gut sein soll, dann nenne es)
für welche anwendung deiner meinung nach ist der cell gut bzw besser geeignet?
ich wette auf die KI und physik. (rein von gefühl her, weil "supercomputer=komplexe simulationen")


vllt, weiß jemand noch was darüber, dann schreib doch mal rein. neue fakten und zahlen seh ich gerne:)


uff hab wieder mal viel geschrieben.. hoffe mal dass man mich einige maßen gut versteht, was ich da schreibe.


auf der seite (techchannel) steht eigentlich viel über der cell und auch cpu der 360 usw.man muss nur bisl suchen...

Velve Veldruk
31.12.2007, 12:22
Also bevor wir hier weiter diskutieren solltest du dir genau im Klaren sein was
diese Floating Point Operations Test aussagen. Aber das mal bei Seite.




Der Cell ist eine sehr gute CPU für Multimediaanwendungen wie du schon
schreibst. Er kann große Datenmengen in kurzer Zeit bewältigen was im
HDVideo Bereich notwendig sein wird um dort bei hohen Auflösungen und
den damit verbundenen Datenmengen eine gute Performence zu liefern.
Allerdings sind für komplexe Simulationen auch präzise Rechnungen notwendig.
Wenn man etwas simulieren will möchte man ja möglichst präzise Ergebnisse
durch die Simulation erhalten wozu sonst Simulieren?

Ganz ähnliches gilt auch für eine KI und die Physik, wenn die Physik
wirklich simuliert werden soll und nicht nur hinreichend genau dargestellt
damit es in einem Spiel für den Durchschnittsspieler als "realitätsnah"
erscheint. Sehr komplexen Berechnungen die auch auf Dauer nur sehr
geringe Abweichungen der errechneten Werte zulassen sollen benötigen
auch eine sehr große Genauigkeit. Heute sind wir schon so weit dass
die doppelte Genauigkeit kaum noch ausreicht für die SuperComputing
Anwendungen. Die Rechnungen sollen immer präziser, schneller und
komplexer, sofern sich keine sehr eleganten mathematischen Lösungen
finden lassen, werden und da lohnt sich keine CPU die keine hohen FLOPS
Zahlen erreicht bei hoher Genauigkeit.

Was die Genauigkeit angeht ist hier vielleicht ein interessanter Link.
http://www.bernd-leitenberger.de/genauigkeit-von-computern.shtml

Dennoch ist der Cell eben eine Leistungsstarke CPU im Bereich der
Embedded Systems (Konsolen zB) wenn die Anwendungen für ihn
optimiert sind. Grade im Konsolenbereich, mit weiteren Multimedia
Anwendungen (HD-Video), wird der Cell gute Ergebnisse Liefern
denke ich da hier eine Optimierung der Software nicht so aufwendig
wie bei einem PC ist. Und im Vergleich mit der CPU der XBox360
steckt im Cell rein theoretisch das größere Potential für eine
Spielekonsole.
Für komplexe und präzise Simulationen werden heute dann wohl doch
lieber andere Prozessoren verwendet, was aber zukünftige Prozessoren
bringen kann man heute noch nicht genau sagen :).

Ansonsten meine Bezugsquellen, bin davon ausgeganen dass die Aussagen
dort richtig und gültig sind:

Nur wenn das Programm für den CELL optimiert ist, kann die CPU seine volle Leistung entfalten. Auch während alle acht SPEs aktiv sind, kann sich der PPE anderen Aufgaben widmen. Die Developer-Resource-Seiten von IBM geben dazu nähere Angaben.

Im Vergleich zu einem aktuellen 3,2-GHz-Prozessor ist der Cell BE beim 4kx4k-Linpack-Benchmark mit einfacher Genauigkeit um den Faktor 6 schneller. Je nach Anwendung und Algorithmus ergibt sich laut IBM eine Performance-Steigerung von 0,9 bis 35 bei Einsatz des Cell BE.



Sony nutzt den Cell BE in seiner neuen grafischen Spielekonsole PS3, die Mitte November 2006 auf den Markt kommen soll. In der Playstation arbeitet der Cell BE mit 3,2 GHz Taktfrequenz und nur sieben aktiven SPEs - die achte SPE ist redundant. Damit will Sony vermutlich die Ausbeute erhöhen und den Cell auch dann nutzen können, wenn eine SPE defekt sein sollte. Laut Sony erreicht die PS3 eine theoretische Rechenleistung von 218 GFLOPS, was fast fünf Mal so schnell ist wie die Triple-Core-CPU der Xbox 360.
(man beachte immernoch das Quote darüber)


Um den Cell BE auszureizen, sollte das Programm entsprechend dafür optimiert werden. Der Cell BE unterstützt gleichzeitig drei verschiedene Page-Größen von 4 KByte, 1 oder 16 MByte, was sich auf die Performance auswirken kann. Adressen, die 2 KByte voneinander entfernt sind, adressieren also die gleiche Bank. Stellt man sicher, dass die acht SPEs unabhängig voneinander auf je zwei Speicherbänke zugreifen können, so kann dies eine Performance-Verbesserung von 25 Prozent ergeben.

[...]

Es empfiehlt sich, den Compiler entsprechende Optimierungen durchführen zu lassen und im Zweifelsfall selbst Hand anzulegen, möchte man das Optimum aus dem Cell mit seinen acht Vektorprozessoren herausholen.


Wars das schon? Nein:


Der Cell BE der ersten Generation hat in der Praxis bereits gezeigt, was er zu leisten vermag. Sein Nachfolger, der Cell-2, soll im 65-nm-Fertigungsprozess produziert werden und darüber hinaus bei den SPEs mit doppelter Gleitkomma-Genauigkeit (Double Precision) ausgestattet sein. Vielleicht verdoppelt das Konsortium auch gleich die Anzahl der SPEs.

Es bleibt also noch abzuwarten ob in naher Zukunft ein Cell Prozessor kommt
der sich auch für wirklich komplexe Simulationen eignet und dort eine gute
Performence erzielt.

Firewarlock
03.01.2008, 12:05
Erwähnen sollte man auch, dass die CELL Technologie noch sehr unausgegoren ist. Microsoft/Intel arbeiten auf dem Gebiet schon eine Weile und geben an, dass die CELL Technologie noch nicht ausgereift sei und man wohl erst irgendwann nach 2010 mit den ersten effektiv arbeitetenden Prozessoren mit dieser Technologie rechnen kann.

Lord Darth Anubis
04.01.2008, 15:01
Erwähnen sollte man auch, dass die CELL Technologie noch sehr unausgegoren ist. Microsoft/Intel arbeiten auf dem Gebiet schon eine Weile und geben an, dass die CELL Technologie noch nicht ausgereift sei und man wohl erst irgendwann nach 2010 mit den ersten effektiv arbeitetenden Prozessoren mit dieser Technologie rechnen kann.

naja als AMD mit 64bit kam da meinte INTEL dass es zufrüh sei :]. jetzt komtm die frage ob es wirklich zu früh war. den soweit ich weiß waren die amd mit 64bit "schenler" als intelsprozi.
und jetzt fragen wir ob der celltechnologie unausgereift ist. und ich sage dass es in 1 bis 2 jahren feststellen wird.

Velve Veldruk
04.01.2008, 15:36
naja als AMD mit 64bit kam da meinte INTEL dass es zufrüh sei :]. jetzt komtm die frage ob es wirklich zu früh war. den soweit ich weiß waren die amd mit 64bit "schenler" als intelsprozi.
und jetzt fragen wir ob der celltechnologie unausgereift ist. und ich sage dass es in 1 bis 2 jahren feststellen wird.

Intel hatte mit der Aussage Recht, wo AMD heute finanziell steht lässt sich
ja gut erkennen. Die Technik des Cells mag noch nicht so ganz ausgereift
sein und die Technologie ebenfalls nicht (Technik und Technologie sind 2
unterschiedliche Begriffe in der Deutschen Sprache, bitte bringt erst in
Erfahrung was diese Begriffe bedeuten bevor ihr arglos damit um euch werft.
Das klingt so unprofessionel.).

Mit den künftigen Cell-Generationen wird sich die Fertigung (Technologie)
und die Prozessorarchitektur / Layout (hier: Technik) sicherlich noch
optimieren.

@Lord Darth Anubis: Ich hab deine Posts hier jetzt 3-4x durchgelesen
und du hast kein einziges mal irgendwas davon erwähnt dass sich
erst nach einer gewissen Zeit herausstellen wird.
Genauere Recherchen bevor du zu eiligen Schlüssen kommst will ich dir
auch ans Herz legen.

Lord Darth Anubis
04.01.2008, 19:07
was laberst du denn da? intel hatte recht? ach ja, damals hat amd beste cpu geliefert. und es hat nix damit zutun dass amd jetzt probleme hat! mein gott die haben damals mit den 64bit prozis gewinne gemacht!

auserdem du bist hier unprofessionel... labesr hier nur müll. vorhin hab ich mich nur zurück gehalten...

(Technik und Technologie sind 2
unterschiedliche Begriffe in der Deutschen Sprache, bitte bringt erst in
Erfahrung was diese Begriffe bedeuten bevor ihr arglos damit um euch werft.
Das klingt so unprofessionel.). <---- hab kein plan was du mit dieser klügscheißerein sagen willst....

oder das hier:

@Lord Darth Anubis: Ich hab deine Posts hier jetzt 3-4x durchgelesen
und du hast kein einziges mal irgendwas davon erwähnt dass sich
erst nach einer gewissen Zeit herausstellen wird.
Genauere Recherchen bevor du zu eiligen Schlüssen kommst will ich dir
auch ans Herz legen. <---- mein duetsch ist nicht besonders aber deiner. was laberst du denn da?

Velve Veldruk
05.01.2008, 11:58
Aiai, so böse hab ich das garnicht gemeint :).

Die 64Bit Prozessoren haben sich vielleicht schön verkauft aber dem Kunden hat
es relativ wenig gebracht, dem Endkunden als normaler PC User eigentlich rein
garnichts. Die 64Bit Technik hat zu der Zeit höchstens irgendwelchen Server-
betreibern / Softwareentwicklern etwas genutzt. Verbaut wurden die 64Bit
Prozessoren auch in normalen Rechnern und somit wurde dem Kunde etwas
verkauft von dem er keinen praktischen Nutzen hatte. Was nutzt der sehr
viel vergrößerte Speicheradressbereich wenn ein normales Betriebssystem
das ganze garnicht verwalten kann? Was nutzt dem Kunde ein Betriebssystem
das keine vernünftige Treiber für seine Hardware bereitstellt (XP 64)?

Da muss man zum Schluss kommen dass AMD zu früh mit der 64Bit Technik
auf den Markt getreten ist und dem Kunde etwas verkauft hat was er nicht
braucht. Darum hat Intel meiner Meinung nach mit der Aussage vollkommen
Recht gehabt. Windows 64 oder Linux sind einfach keine richtigen alternativen
Betriebssysteme für einen Endnutzer der auch mal Spielen will.
Selbst Vista 64 ist momentan noch ein Zumutung, da es einfach kein fertiges
Betriebssystem ist sondern erst mit SP1 sein fertiges Kernel erhalten wird,
was zum Glück sehr bald sein wird.


Das mit "Technik und Technologie" war ein gut gemeinter Ratschlag. In
Seminaren und auf Wirtschaftstagungen hat man mir oft genug gesagt
dass wir diese Begriffe mit vorsicht benutzten sollen. "Technologie" wird
gern für "alles" verwendet da es dem englischen "technology" sehr ähnelt
und im Zug der Sprachverschandelung den meisten im Ohr einfach schöner
klingt, aber fehl am Platz ist.


Und nun zum letzten.

Du hast einfach nicht gesagt dass man es in 1 bis 2 Jahren feststellen wird
schreibst es aber so als hättest du es gesagt :). Nichts für ungut.

Das mit den Recherchen lege ich dir ans Herz, da es durch gründliche
Recherchen einfacher ist ne sachliche Diskussion zu führen. Wenn man
genau weiß wie GFLOPS ermittelt werden, welche Methoden es dafür
gibt und welche Optimierungen da ne Rolle spielen, gestaltet sich das
Ganze sehr viel einfacher.

Lord Darth Anubis
08.02.2008, 20:21
"Dank dieser Architektur kann der Cell Berechnungen mit einfacher Genauigkeit, welche vor allem bei Spielen relevant sind, deutlich schneller verarbeiten als aktuelle Dual-Core-Prozessoren. So soll es der Cell bei 4 GHz und einfacher Genauigkeit auf über 256 Milliarden Gleitkommaoperationen pro Sekunde bringen. Wird mit doppelter Genauigkeit gerechnet, sollen hiervon noch 25 GFlop/s erreicht werden."


http://www.computerbase.de/artikel/hardware/multimedia/2007/test_sony_playstation_3/6/

ich bin ein verfluchter klugscheißer