Desbloqueando el 8º SPE

1, 2, 3
Ioannes Carolus escribió:Imagen

My program is implemented as both a generic version which compiles on any Linux system, as well as a Cell-specific version. The first two bars compare the generic versions on a 2.2 Ghz Athlon and the 3.2 Ghz PowerPC in the Cell. Here we see the Cell PowerPC is much less powerful than the Athlon. Note the Athlon is actually dual-core (and the PowerPC actually has two hardware threads), but the generic code doesn't utilize multiple threads. The generic code utilizes the software vector library from the Graphics Gems texts. The Cell-specific version uses the vector datatypes and operators available in the SPE hardware, and vector libraries provided by IBM. The switch from Graphics Gems software vectors to SPE hardware vectors provided a 62% speedup. Without this speedup the single SPE would be slower than the PowerPC alone; the SPE is designed to be less efficient than the PowerPC on non-vector operations. Note the Athlon has similar SSE3 hardware vector operations available; these are not utilized in the generic code. Other Cell ray tracers (discussed below) have achieved significant pipeline speedups by converting their vector operations from AOS (Array of Structures) to SOA (Structure of Arrays) form and batching multiple rays together; this transformation is complicated since branches (where some rays intersect an object while others don't) are involved.


Vamos...que al menos es más fuerte un Athlon dualcore a 2.2 como PowerPC sin utilizar los SPE's...y a partir del tercero, Cell comienza a remontar. Sería interesante tener más comparativas para ver el rendimiento de procesadores más actuales y ver si el Cell es la gran maravilla como lo pintaba Sony.

Saludos.

+1 [oki]
ven!!! eso es exactamente lo que le quiero mostrar a los Cell Fanboy's, no todo es como una compañia nos lo pinta.

el Xenos de Xbox 360 y estoy casi harto de decirlo, tiene menor en potecia que el Cell BE de PS3, pero dejo claro que la potecia que demuestra el Cell no es tan considerable comparado con la del Xenos, ya estamos en tiempos que no dependemos tanto de la potecia de las consolas, sino de los programadores...
hjthebest escribió:+1 [oki]
ven!!! eso es exactamente lo que le quiero mostrar a los Cell Fanboy's, no todo es como una compañia nos lo pinta.

el Xenos de Xbox 360 y estoy casi harto de decirlo, tiene menor en potecia que el Cell BE de PS3, pero dejo claro que la potecia que demuestra el Cell no es tan considerable comparado con la del Xenos, ya estamos en tiempos que no dependemos tanto de la potecia de las consolas, sino de los programadores...


Eso lo dije yo hace muuuchos años.. Xbox 360 y PS3 se diferencian en eso.. CPU peor/mejor y GPU mejor/peor, y como bien dices.. la diferencia de potencia aun a dia de hoy se sigue notando en la programación de los juegos, y es que no me arto de decirlo..

Xbox360 usa una estructura muy muy parecida a la del PC, por lo que... los programadores que hacen juegos para Windows estan muy acostumbrados a trabajar con esas librerias, etc etc... sin encambio la PS3 siempre ha sido considerada como un "rompecabezas" para los programadores, por su estructura que es nueva para ellos... y aunque haya pasado ya años desde que salieron al mercado y sony haber mejorado sus SDK... aun le queda muuuucho camino por recorrer, porque aun les sigue costando a los programadores acostumbrarse a trabajar para PS3
hjthebest escribió:
Ioannes Carolus escribió:Imagen

My program is implemented as both a generic version which compiles on any Linux system, as well as a Cell-specific version. The first two bars compare the generic versions on a 2.2 Ghz Athlon and the 3.2 Ghz PowerPC in the Cell. Here we see the Cell PowerPC is much less powerful than the Athlon. Note the Athlon is actually dual-core (and the PowerPC actually has two hardware threads), but the generic code doesn't utilize multiple threads. The generic code utilizes the software vector library from the Graphics Gems texts. The Cell-specific version uses the vector datatypes and operators available in the SPE hardware, and vector libraries provided by IBM. The switch from Graphics Gems software vectors to SPE hardware vectors provided a 62% speedup. Without this speedup the single SPE would be slower than the PowerPC alone; the SPE is designed to be less efficient than the PowerPC on non-vector operations. Note the Athlon has similar SSE3 hardware vector operations available; these are not utilized in the generic code. Other Cell ray tracers (discussed below) have achieved significant pipeline speedups by converting their vector operations from AOS (Array of Structures) to SOA (Structure of Arrays) form and batching multiple rays together; this transformation is complicated since branches (where some rays intersect an object while others don't) are involved.


Vamos...que al menos es más fuerte un Athlon dualcore a 2.2 como PowerPC sin utilizar los SPE's...y a partir del tercero, Cell comienza a remontar. Sería interesante tener más comparativas para ver el rendimiento de procesadores más actuales y ver si el Cell es la gran maravilla como lo pintaba Sony.

Saludos.

+1 [oki]
ven!!! eso es exactamente lo que le quiero mostrar a los Cell Fanboy's, no todo es como una compañia nos lo pinta.

el Xenos de Xbox 360 y estoy casi harto de decirlo, tiene menor en potecia que el Cell BE de PS3, pero dejo claro que la potecia que demuestra el Cell no es tan considerable comparado con la del Xenos, ya estamos en tiempos que no dependemos tanto de la potecia de las consolas, sino de los programadores...



Si vas a usar esa tabla como argumento porque no poner la información completa, que viene abajo de ese cuadro...
fuente: http://home.mindspring.com/~eric_rollins/ray/ray.html

Lo anexo traducido, disculpen la gramática pero lo hice rápido para darse una idea.

-----------------------------------------------------------------------------------------------------------------------
Actualización (6/2007)
IBM ha sacado la versión 2.1 del SDK Cell. Lo actualice a esta versión y a Fedora Core 6; instrucciones aquí. IBM provee ahora una versión nativa en PPC, de su compilador XLC. Este Provee de una mejora de mas del 50% en desempeño sobre GCC:

Imagen


IBM ha cambiado la manera en que los hilos de los SPU son inicializados y controlados; ahora exponen una interface pthreads. Mi codigo fuente incluye ahora ambas versiones, la vieja (LIBSPE 1 / SDK 2.0) y la nueva (LIBSPE 2 / SDK 2.1). no hubo diferencia en rendimiento entre LIBSPE 1 y 2.

Actualizacion (7/2007)

Imagen


Como parte del Real-Time Ray Tracing con NVIDIA CUDA GPGPU e Intel Quad-Core añadi soporte pthreads al codigo del ray tracer generico. Como se discute arribala unidad PowerPC en el procesador Cell soporta 2 hilos por hardware. Corri la version pthreads del ray tracer generico y obtuve un aumento de velocidad del 63% sobre la version de un solo hilo. Tambien intente compilar usando el IBM XLC en lugar del GCC. Esto resulto en un incremento de velocidad del 26%. Todo junto pthreads mas XLC dan un aumento de velocidad del 89%.

-------------------------------------------------------------------------------------------

Es de suponer que los programadores tienen que trabajar mas duro en Cell para obtener el máximo potencial, pero los programadores generalmente optan por usar lo que existe en lugar de desarrollar versiones mas eficientes, ese es el problema con el ps3, y es por eso que vemos que juegos multiplataforma a veces son peores en Ps3 por que no usan adecuadamente los SPUs si es que los usan, los desarrolladores First party si que tratan de pasar procesos a los spus para mejorar el desempeño u obtener efectos especiales, físicas etc, y se nota, cierto han mencionado a veces que usan el 100% del cell, sin embargo eso no significa que no le puedan sacar mas provecho a veces como se puede ver en la grafica anterior, con resultados sorprendentes en rendimiento, esto es cierto generalmente para todo hardware, sin embargo el cell por su dificultad de programar tiene un potencial mucho mas amplio sin descubrir, que otros tipos de hardware que son mas faciles de programar y a los cuales ya no es tanto el margen de mejora que se puede obtener después de un tiempo.

El cell es un procesador de datos impresionante, tanto asi que por eso existen multiples proyectos tanto de gobierno como de empresas privadas, que tienen sus sets de Ps3 para estos procesos.
Nota, que no por eso significa que siga siendo la mejor opción sobre nuevos sistemas de procesadores para el manejo de este tipo de datos, como CUDA o el ATI Stream entre otros, pero estamos hablado de varios años después, ademas también ha disminuido su precio pero bueno eso es otro rollo.


Saludos!
Pero si yo juraría que he entrado a la parte de scene de ps3 y resulta que estamos en una tienda de componentes PC online??
Por favor vale ya con el tema que os habéis ido por las ramas y dejad de reflotar el hilo porque ya esta bien claro que de momento no aporta nada mas que investigar sobre el sistema y su funcionamiento, e incluso quizás en un futuro siga sin aportarnos nada mas allá de lo que he dicho.

Para los que se queden con ganas de discutir la potencia de ambos procesadores juraría que hay un hilo de PC....
Xulofuenla escribió:Pero si yo juraría que he entrado a la parte de scene de ps3 y resulta que estamos en una tienda de componentes PC online??
Por favor vale ya con el tema que os habéis ido por las ramas y dejad de reflotar el hilo porque ya esta bien claro que de momento no aporta nada mas que investigar sobre el sistema y su funcionamiento, e incluso quizás en un futuro siga sin aportarnos nada mas allá de lo que he dicho.

Para los que se queden con ganas de discutir la potencia de ambos procesadores juraría que hay un hilo de PC....
Este hilo (salvo flamewars de 360 vs PS3, que por otro lado es la mayor parte del hilo, a ver si crecemos un poco majos) tiene mas de scene que todo el foro junto con su 97% de hilos de cargadores de backups, 1% de mensajes chorras sobre Geohotz, 1% de emuladores añejos y otro 1% de como mkvs, asi que si no te gusta no entres a leerlo.
Yo entro a leerlo porque es scene y me ncanta la scene. No te tengo que dar ninguna explicación a ti. Y a lo que me refiero es que dejen la discusión que me jode un huevo entrar a ver si hay avance (cosa que dudo, como ya he dicho) y solo me encuentro paginas de basura y estoy en mi derecho de protestar por los offtopic como ya he dicho hay un foro de PC para discutir sobre los procesadores.

Quieres otra??
guayaquil escribió:Y con esto de desbloquear el 8º Cheroun de esos podremos viajar más alla de nuestra galaxia? :)
Lo siento pero es que al leer el título no he tenido más remedio que acordarme de Stargate...... Ya en serio, esta potencia extra sera aplicable a los homebrew que desarrolle la comunidad? Pq esta más o menos claro que a los juegos no, ya que no se van a programar con esa idea.


Ahora podremos llegar al plantea Asgard Othala, en la galaxia Aida XD . Y esto lo digo de memoria (llamadme friki si quereis)

Yo solo digo una cosa. Si se habilita el uso de este "cacho" de procesador no se generara mas calor y mas consumo? No podría llegar a ser peligroso? No se, mi PS3 en verano sufre mucho, por lo menos la mia. Imaginaos como se devera poner con ese "poquito" mas de potencia.

Yo siempre ablo desde la ignorancia.

Un saludo
Xulofuenla escribió:Yo entro a leerlo porque es scene y me ncanta la scene. No te tengo que dar ninguna explicación a ti. Y a lo que me refiero es que dejen la discusión que me jode un huevo entrar a ver si hay avance (cosa que dudo, como ya he dicho) y solo me encuentro paginas de basura y estoy en mi derecho de protestar por los offtopic como ya he dicho hay un foro de PC para discutir sobre los procesadores.

Quieres otra??

El unico problema de este hilo son los flamewars que podian irse a tomar vientos. Si es eso de lo que te quejas vale, si no, si lo que te molesta es que se comparta informacion del Cell y sus SPEs, pues lo siento. Eso es mas scene que cualquier otra cosa. Si tienes quejas a ese respecto, tienes el foro feedback, pero deja a la gente tranquila hablar de SPE, SPUs y rendimiento en calculos vectoriales.
Por supuesto me quejo de los que están discutiendo sobre que procesador es mejor (casi todo el hilo) y ya se de sobra que si un hilo no me gusta no entro (como el de multiman que ni piso por ahí)

Por mi parte dejo el offtopic que ya hay suficiente aquí
speedxl escribió:
Si vas a usar esa tabla como argumento porque no poner la información completa, que viene abajo de ese cuadro...
fuente: http://home.mindspring.com/~eric_rollins/ray/ray.html

Lo anexo traducido, disculpen la gramática pero lo hice rápido para darse una idea.

-----------------------------------------------------------------------------------------------------------------------
Actualización (6/2007)
IBM ha sacado la versión 2.1 del SDK Cell. Lo actualice a esta versión y a Fedora Core 6; instrucciones aquí. IBM provee ahora una versión nativa en PPC, de su compilador XLC. Este Provee de una mejora de mas del 50% en desempeño sobre GCC:

Imagen


IBM ha cambiado la manera en que los hilos de los SPU son inicializados y controlados; ahora exponen una interface pthreads. Mi codigo fuente incluye ahora ambas versiones, la vieja (LIBSPE 1 / SDK 2.0) y la nueva (LIBSPE 2 / SDK 2.1). no hubo diferencia en rendimiento entre LIBSPE 1 y 2.

Actualizacion (7/2007)

Imagen


Como parte del Real-Time Ray Tracing con NVIDIA CUDA GPGPU e Intel Quad-Core añadi soporte pthreads al codigo del ray tracer generico. Como se discute arribala unidad PowerPC en el procesador Cell soporta 2 hilos por hardware. Corri la version pthreads del ray tracer generico y obtuve un aumento de velocidad del 63% sobre la version de un solo hilo. Tambien intente compilar usando el IBM XLC en lugar del GCC. Esto resulto en un incremento de velocidad del 26%. Todo junto pthreads mas XLC dan un aumento de velocidad del 89%.

-------------------------------------------------------------------------------------------

Es de suponer que los programadores tienen que trabajar mas duro en Cell para obtener el máximo potencial, pero los programadores generalmente optan por usar lo que existe en lugar de desarrollar versiones mas eficientes, ese es el problema con el ps3, y es por eso que vemos que juegos multiplataforma a veces son peores en Ps3 por que no usan adecuadamente los SPUs si es que los usan, los desarrolladores First party si que tratan de pasar procesos a los spus para mejorar el desempeño u obtener efectos especiales, físicas etc, y se nota, cierto han mencionado a veces que usan el 100% del cell, sin embargo eso no significa que no le puedan sacar mas provecho a veces como se puede ver en la grafica anterior, con resultados sorprendentes en rendimiento, esto es cierto generalmente para todo hardware, sin embargo el cell por su dificultad de programar tiene un potencial mucho mas amplio sin descubrir, que otros tipos de hardware que son mas faciles de programar y a los cuales ya no es tanto el margen de mejora que se puede obtener después de un tiempo.

El cell es un procesador de datos impresionante, tanto asi que por eso existen multiples proyectos tanto de gobierno como de empresas privadas, que tienen sus sets de Ps3 para estos procesos.
Nota, que no por eso significa que siga siendo la mejor opción sobre nuevos sistemas de procesadores para el manejo de este tipo de datos, como CUDA o el ATI Stream entre otros, pero estamos hablado de varios años después, ademas también ha disminuido su precio pero bueno eso es otro rollo.


Saludos!


No había necesidad del tochazo que citas...en la tabla que anexaba antes y en el extracto del artículo que cito, se aprecia a simple vista que el Cell aprovechando sus SPU´s es considerablemente superior a un procesador como el Athlon que refiere el autor (A partir de utilizar la tercera unidad sinergica de procesos).

Ahora...como dato curioso, he utilizado la aplicación del autor en Debian en una Aspire One con Atom 550 de doble núcleo a 1.6 Ghz. No llego ni a los 5 frames XD. Que el Cell en cuanto a arquitectura es un procesador poderoso eso creo que nadie puede discutirlo. Reitero...con esta app, sería interesante hacer comparativas con procesadores "punteros" de la actualidad, y contrastarlo con la información que tenemos del rendimiento de Cell. Haced sus propias pruebas en distintos ordenadores...podríamos tener una comparativa de miedo.

Saludos.
Bueno despues de todo este tocho de post, quien la tiene mas grande :O
ffelagund escribió:
Psmaniaco escribió:
ffelagund escribió:Psmaniaco, simplemente instalalo y ejecutalo. El unico problema es que si no recuerdo mal, son paquetes rpm

Es mas recomendable hacerlo desde el Fedora 5 ¿no?
Un saludo.

Pues si, o incluso un YDL.

Ioannes Carolus, Busca por google el rendimiento del Cell en la aplicacion Life (la que viene en la PS3, la de procesamiento de moleculas) En pocos meses el Cell ya habia hecho tanto como todas las CPUs hasta la fecha, y pocos meses despues ya les habia multiplicado en rendimiento. Solo lo superaron hace relativamente poco las gpus mas modernas de ATI y NVidia. Ahi tienes una prueba verdadera y contrastable del Cell Vs cualquier otra CPU en calculos vectoriales.

Pues ahora en Semana Santa lo probare a ver; ¿donde esta el rpm en cuestion para instalarlo y probarlo? ya que hace tiempo que estoy desconectado del tema de Linux en la PS3 (viendo al paso que estan abandonando el Power PC [snif] ).
Un saludo.
111 respuestas
1, 2, 3