Info PS3(Cell, RSX, SDK, SO, Linux..)

1, 2, 3
Johny27 escribió:
[tocho]
Es un poco falaz contar la minialu como alu completa (ayuda, pero no es ni de lejos una alu más, se limita a algunas operaciónes solamente), cuando está demostrado que en pixel shaders la solución de nvidia no es ni la mitad que la de ati (hablo de pc).

Te estas confundiendo nuevamente si cuentas las mini-alu entonces los pixel pipeline de la 7800 tienen 4 alu, esquema:
Imagen


Johny27 escribió:Por cierto, a quien decía por ahí arriba que MSAA no requiere uso de shaders: es correcto en parte, ya que el AA también se puede implementar por shaders y con esta solución permite el uso de HDR simultaneo en hardware que no lo permita al usar el método normal. Es mucho mas ineficiente, pero puede venir bien en situaciones donde estés sobrado.

No es el propio shader el que hacel el MSAA, lo del hacer el HDR y el MSAA el apaño que se hace en el Heavenly Sword es usar un formato de frame-buffer propio que ocupa 32 bit por pixel con lo que el hardware si soporta MSAA (el problema del hardware de nVidia lo tiene con 64+ bits por pixel de framebuffer), lo que hace el pixel shader es descodificar el formato ya que no hay soporte por hardware. El metodo consume aproximadamente el 3% del tiempo de ejecucion de los shader con lo que yo no lo llamaria "extremadamente ineficiente" sobre todo si tienes en cuenta que da mejor calidad que el fp10 de ATI (32 bit por pixel tambien).

Johny27 escribió:Deathkiller, las unidades de textura sin filtrar sun la bomba a la hora de hacer texture lookups, algo que se utiliza para hacer muchos efectos (por ejemplo doom3 lo usa para calcular el brillo de las superficies, el cual está almacenado en un cubemap con los valores preestablecidos en base a una fórmula matemática demasiado compleja para calcular en tiempo real. Luego se demostró que en hard ATI el calcularlo en tiempo real era bastante más rapido que usar el método original).

[/tocho]

No digo que no sean utiles solo digo que si no tienes que filtrar las texturas tampoco creo que exista la posibilidad de que esa parte del hardware sea un cuello de botella ya que tardas mucho en procesar lo que lees.
deathkiller escribió:Te estas confundiendo nuevamente si cuentas las mini-alu entonces los pixel pipeline de la 7800 tienen 4 alu, esquema:
Imagen


Discrepo, pero me informaré, más aún.


deathkiller escribió:No es el propio shader el que hacel el MSAA, lo del hacer el HDR y el MSAA el apaño que se hace en el Heavenly Sword es usar un formato de frame-buffer propio que ocupa 32 bit por pixel con lo que el hardware si soporta MSAA (el problema del hardware de nVidia lo tiene con 64+ bits por pixel de framebuffer), lo que hace el pixel shader es descodificar el formato ya que no hay soporte por hardware. El metodo consume aproximadamente el 3% del tiempo de ejecucion de los shader con lo que yo no lo llamaria "extremadamente ineficiente" sobre todo si tienes en cuenta que da mejor calidad que el fp10 de ATI (32 bit por pixel tambien).


No estamos hablando de lo mismo. Yo me refería al método que usa nvidia en sus demos de la serie 6800 para hacer AA con HDR (cosa que no soportaban sus gráficas).


deathkiller escribió:No digo que no sean utiles solo digo que si no tienes que filtrar las texturas tampoco creo que exista la posibilidad de que esa parte del hardware sea un cuello de botella ya que tardas mucho en procesar lo que lees.


Los texture lookup se usan para no tener que procesar, no para tomar datos y procesarlos (al menos no es su uso común, en gpgpu si se usan para eso).
Johny27 escribió:No estamos hablando de lo mismo. Yo me refería al método que usa nvidia en sus demos de la serie 6800 para hacer AA con HDR (cosa que no soportaban sus gráficas).

Ah, no lo sabia, de todas maneras hay alternativas como la que he mencionado.

Johny27 escribió:Los texture lookup se usan para no tener que procesar, no para tomar datos y procesarlos (al menos no es su uso común, en gpgpu si se usan para eso).

Supongo que te referiras para no tener que calcular un dato y usar un dato ya pre-calculado almacenado en memoria, en cualquier caso si no usas el dato en procesos (shader en este caso) no te sirve de nada. Solo digo que el procesos suele ser lo suficientemente largo como para no quedar limitado por los texture lookup. La verdad no se lo suficiente sobre el tema para afirmar nada seguro.
deathkiller escribió:Supongo que te referiras para no tener que calcular un dato y usar un dato ya pre-calculado almacenado en memoria, en cualquier caso si no usas el dato en procesos (shader en este caso) no te sirve de nada. Solo digo que el procesos suele ser lo suficientemente largo como para no quedar limitado por los texture lookup. La verdad no se lo suficiente sobre el tema para afirmar nada seguro.


Al contrario, las texture lookup tienen una latencia muy muy alta, y penalizan enormemente el procesado de un shader. El usar unidades de point sampling alivia mucho esa latencia.
Johny27 escribió:Por cierto, a quien decía por ahí arriba que MSAA no requiere uso de shaders: es correcto en parte, ya que el AA también se puede implementar por shaders y con esta solución permite el uso de HDR simultaneo en hardware que no lo permita al usar el método normal. Es mucho mas ineficiente, pero puede venir bien en situaciones donde estés sobrado.

Lo dije yo. Gracias por la info.
Johny27 escribió:

deathkiller escribió:Te estas confundiendo nuevamente si cuentas las mini-alu entonces los pixel pipeline de la 7800 tienen 4 alu, esquema:


Discrepo, pero me informaré, más aún.



http://www.techreport.com/reviews/2005q2/geforce-7800gtx/pixel-block-small.gif

Imagen

Por lo visto si que tienen dos Alu's

Pero tampoco se puede saber el rendimiento comparativo de dos
chips multiplicando Hz con unidades ya que estas pueden
ser más o menos eficientes en una arquitectura u otra

Como curiosidad en el G71 redujeron el numero de transistores respecto al G70 sin eliminar unidades y sus shaders son un poco más eficientes

¿Por cierto se confirmo si el RSX tenia 8 Rops en lugar de 16?
¿Esta confirmado que tenga 24/8 PS/VS o también tendra menos?
Harl escribió: ¿Por cierto se confirmo si el RSX tenia 8 Rops en lugar de 16?

Nada oficial pero en Beyond 3d se toma como un hecho asi que probablemente sera cierto, se considera apropiado para el ancho de banda disponible de base.
Harl escribió:¿Esta confirmado que tenga 24/8 PS/VS o también tendra menos?

Los 24 pixel shader se confirmaron en transparencias filtradas, los Vertex Shader no se suelen comentar. Si hay suerte este mes habra anuncios oficiales sobre el tema en conferencias o al menos eso dicen los rumores.
Harl escribió:
¿Por cierto se confirmo si el RSX tenia 8 Rops en lugar de 16?


Esta "confirmado", o sea, todos los desarrolladores lo saben pero no lo han hecho oficial aún. Es una putada porque limita muchísimo el rendimiento. En la gpu de la 360 el fillrate es SIEMPRE 4000, ya actives FSAA o no. En el RSX al activar FSAA el fillrate desciende a la mitad, lo que unido al vergonzoso ancho de banda es una putada.

Harl escribió: ¿Esta confirmado que tenga 24/8 PS/VS o también tendra menos?


Igual que antes, los 24 si estan confirmados, los 8 están "confirmados".
Johny27 escribió:
Esta "confirmado", o sea, todos los desarrolladores lo saben pero no lo han hecho oficial aún. Es una putada porque limita muchísimo el rendimiento. En la gpu de la 360 el fillrate es SIEMPRE 4000, ya actives FSAA o no. En el RSX al activar FSAA el fillrate desciende a la mitad, lo que unido al vergonzoso ancho de banda es una putada.

Solo un apunte, desciende a la mitad al activar MSAA de 4x y se mantiene si solo activas a 2x frente a no activarlo.
deathkiller escribió:Solo un apunte, desciende a la mitad al activar MSAA de 4x y se mantiene si solo activas a 2x frente a no activarlo.


Sip, cierto. Se me olvidó especificar. Por cierto, habrá que tener en cuenta que el fillrate también baja ala mitad al usar HDR, al igual que el ancho de banda, por lo que veo dificil que usen demasiado hdr.
Johny27 escribió:
Sip, cierto. Se me olvidó especificar. Por cierto, habrá que tener en cuenta que el fillrate también baja ala mitad al usar HDR, al igual que el ancho de banda, por lo que veo dificil que usen demasiado hdr.

Si usas fp16 para el HDR si pero no es compatible con el MSAA. Peor aun es si usas fp32, si que se fliparon anunciandolo en el E3 2005.
deathkiller escribió:Si usas fp16 para el HDR si pero no es compatible con el MSAA. Peor aun es si usas fp32, si que se fliparon anunciandolo en el E3 2005.


No es compatible en RSX y el resto de hard nvidia de pc, en xenos y las nuevas de ati si.

Y si, FP32 es una sobrada como una casa.
Johny27 escribió:
No es compatible en RSX y el resto de hard nvidia de pc, en xenos y las nuevas de ati si.

Y si, FP32 es una sobrada como una casa.

El fp16 da problemas con el MSAA en el Xenos (la eDram no es capaz de resolverlo, tienes que sacarlo a la ram y resolverlo a mano al menos segun lo que se ha dicho en Beyond 3D, busca hilos sobre el tema si quieres), lo que se utiliza en la Xbox 360 para HDR es fp10 (un desarollador del Fable 2 defendio en Beyond3D que no estaba justificado usar otro modo en la Xbox 360 ya que el fp10 esta completamente soportado por hardware y no da ningun problema o complicacion).
deathkiller escribió:El fp16 da problemas con el MSAA en el Xenos (la eDram no es capaz de resolverlo, tienes que sacarlo a la ram y resolverlo a mano al menos segun lo que se ha dicho en Beyond 3D, busca hilos sobre el tema si quieres), lo que se utiliza en la Xbox 360 para HDR es fp10 (un desarollador del Fable 2 defendio en Beyond3D que no estaba justificado usar otro modo en la Xbox 360 ya que el fp10 esta completamente soportado por hardware y no da ningun problema o complicacion).


Todo correcto, pero según he elido en arstechnica con la última actualización del sdk está ya mejor soportado el fp16 mas msaa sin hacer trapicheos.
una pequeña pregunta rapida: ¿que es el fp?¿algun tipo de filtrado?¿y el MSAA?, yo abia oido hablar de FSAA pero no de este:S
Izcariel escribió:una pequeña pregunta rapida: ¿que es el fp?¿algun tipo de filtrado?¿y el MSAA?, yo abia oido hablar de FSAA pero no de este:S

FP es float point o coma flotante (numero con decimales), fp16 quiere decir coma flotante a 16 bit (hablando de formatos de imagen quiere decir 16 bit por cada color + trasparencia normalmente, 64 bit en total por pixel).

MSAA es MultiSampleAntiAliasing que es una forma barata de hacer AntiAliasing a pantalla completa por hardware (es la manera por defecto si fuerzas AA en PC normalmente por ejemplo).
Entonce, si 10 mb Edram son poco ¿por que esta cantidad y no mas?
Cosmonauta escribió:Entonce, si 10 mb Edram son poco ¿por que esta cantidad y no mas?


Porque es la cantidad justa que se necesita para activar TODO a 480p. Cuando ya estaba la consola en producción se decidió poner el mínimo a 720p.
muchas gracias deathkiller ;)!
119 respuestas
1, 2, 3