AMD Zen tendrá el doble de rendimiento por núcleo respecto a Steamroller

Hoy llegan nuevos detalles en torno a la microarquitectura AMD Zen, la cual ha sido diseñada para aumentar significativamente el rendimiento por núcleo, sobre todo el rendimiento en datos númericos (enteros/flotantes). Se ve así casi la duplicación del número de decodificadores, ALU, y unidades de punto de coma flotante por número en comparación con su predecesor. En esencia, cada núcleo Zen equivaldría en términos de potencia a dos núcleos Steamroller, por lo que estaríamos hablando de palabras mayores.

En la microarquitectura Bulldozer, que fue con la que debutó los primeros procesadores FX para el socket AM3+, seguida por Excavator y continuando con las APU Carrizo, el enfoque de AMD estuvo en los núcleos involucrados en módulos, que cada módulo incluía dos núcleos físicos con una combinación de recursos dedicados y compartidos entre ellos.


Finalmente el enfoque de AMD fue poco inteligente y comenzaron a llegar los problemas con las aplicaciones, donde secuencialmente el software cargado en un procesador multi-módulo repercutía en un escenario menos óptimo que si se tratara de cargar un núcleo por módulo, en vez de cargar núcleos adicionales. La solución de AMD fue realizar un engaño por software, hacer pensar que un módulo era un núcleo completo que tenía dos hilos de procesamiento, por lo que un FX-8350 de ocho núcleos sería visto por el software como un procesador de 4 núcleos con 8 hilos como si de un procesador Intel Core i7 se tratase.

Con AMD Zen, la compañía eliminó las barreras que separaban a dos núcleos dentro de un módulo. Ahora tenemos un núcleo monoliticamente grande con 4 decodificadores, 4 ALU (Bulldozer tenía dos por núcleo) y cuatro unidades de 128 bits de ancho de punto flotante respaldado por dos FMACs de 256 bits. Con esto se consigue casi duplicar el músculo de procesamiento de datos numéricos por núcleo. AMD también optó por implementar una tecnología similar al SMT (Simultáneous Multithreading), que tiene una función similar a HyperThreading, la ejecución de varios hilos por núcleo.
Desde luego les gusta tirar por lo raro, ayer estuve viendo el esquema que han publicado y vamos a pasar de modulos de dos nucleos que comparten partes a un solo modulo/nucleo que es como si fueran cuatro si no entendi mal.

Veremos como sale, junto con lo de HBM, la grafica integrada y si finalmente el HSA aporta algo al usuario de sobremesa.
¿Entonces vuelven a sacar un Phenom?

A ver si se ponen al nivel de Haswell en 4 nucleos al menos, más competencia en precios espero, que Intel se ha subido a la parra mucho.

Si sacasen un 8 nucleos reales pero rindiendo ese 40% extra respecto a los FX actuales de 8 "medionúcleos" sería la caña.

¿Un 8 núcleos real y con buen IPC como el de Intel y a 200 pavos? Soñar es gratis.
Si rinde mas también lo ubicaran en precio, nadie regala nada.

En teoria ZEN siempre se ha dicho que tendra de 1 a 4 modulos, si cada core va a poder mover 4 hilos, tendríamos 1c/4t, 2c/8t, 3c/12t y 4c/16t, todos con grafica integrada e imagino que saldra algun modelo sin la gpu para vender aquellos que salgan "defectuosos".

Si va a tener el doble de IPC que los FX y con 4 modulos, sera una especie de i7 de AMD con grafica integrada pero lejos de los hexa y octa de intel, bueno, es un paso adelante, yo sinceramente hubiera preferido sin GPU integrada y con algún modulo mas.

No deja de ser un movimiento raro, pasamos de muchos núcleos poco potentes a pocos potentes con muchos hilos, si se ponen al día de IPC por lo menos sera una opción buena contra los intel de cuatro núcleos, pero de todas maneras si va a salir a finales de 2016 a saber como estara intel en aquella epoca.
Si ofrece un ipc por nucleo similar a los sandy bridge pero con más nucleos puede ser una gran opción a tener en cuenta, eso si el precio tiene que ir acorde al rendimiento que ofrezca, si en multihilo rinde mas que un i7 4790k pueden poner tranquilamente un precio de 300 a 370 euros, pero si por el contrario rinde menos y resulta que tiene una arquitectura compleja ( similar a lo que pasa actualmente con los fx) deberían poner un precio equilibrado, aunque a priori todo apunta que la arquitectura será mas eficiente y acertada, similar a los phenom.
Si el IPC va a ser el doble, pero el numero de nucleos va a ser la mitad por que de momento solo van a llevar 4 modulos para permanecer en los 95W y tener en cuenta que lleva gpu integrada..., a mi los calculos me salen en que en multihilo sera similar a los FX de ahora, en monohilo sera donde brille quizas al nivel de los 2xxx o 3xxx de intel.

Algo ubicado en rendimiento entre un i5 y el i7 de cuatro nucleos, obviamente subirá el precio, si salen de 6 o mas módulos ya sera otra historia totalmente diferente.
Hola, los modulos no decian que era un modulo ¿dos núcleos?
Por que recuerdo haber leido que eran maximo 4 modulos que daban 8 núcleos y 16 hilos :)
Un saludo
deivor escribió:Hola, los modulos no decian que era un modulo ¿dos núcleos?
Por que recuerdo haber leido que eran maximo 4 modulos que daban 8 núcleos y 16 hilos :)
Un saludo


Al principio se hablaba de modulos de 4 nucleos y de 4 modulos, lo que iba a dar en teoria 16c/32t, de hecho se especulaba con que ese ultimo solo iba a ser para servidores/workstations, ahora parece que cada modulo en realidad es un nucleo con 4 hilos, si venden uno con 4 modulos tendra 16 hilos y la igp, que ya veremos si finalmente se puede usar como FPU con lo de HSA
Recuerdo cuando se decía que el FX era el futuro con dx12, que ya no iba a importar el IPC por core...lo gracioso es que todavía hay gente que lo piensa cuando hasta la propia AMD les ha quitado la razón.
Daiben escribió:Recuerdo cuando se decía que el FX era el futuro con dx12, que ya no iba a importar el IPC por core...lo gracioso es que todavía hay gente que lo piensa cuando hasta la propia AMD les ha quitado la razón.


Imagino que la gente que dice eso se refiere para jugar, y en parte si tiene razón ya que con DX12 los juegos necesitarán menos potencia de CPU, por lo que los FX ya no limitaran a ciertas GPU.

Luego para el resto de tareas y programas el DX12 no vale para nada, así que de ahí la necesidad de aumento de IPC y potencia para poder competir con Intel.


Salu2
9 respuestas