ReinLOL escribió:Hide_to escribió:ReinLOL escribió:maxwell tambien soporta fp16
y el porcentaje de un juego de codigo que se podria adaptar a fp16 es del torno al 30% en el mayor de los casos.
de todas formas, no es que xbo y ps4 no puedan, sino que lo emulan en fp32, al final un calculo en fp16 se puede hacer en fp32, solo que es igual que pagar 10 euros por algo que vale 5.
Claro, es como coger la potencia bruta de Xbox One y Ps4, y multiplicarla por 0,7 para empezar (con lo que les restas ese 30% que mencionas), luego miras la ventaja que le pueda sacar nvidia a amd, por arquitectura y por apis, y sumasela a switch, de paso le sumas también la ventaja que les saque por CPU en los juegos CPU dependientes, y la diferencia resultante probablemente seguirá dando ventaja a Xbox y Ps4, pero no tanto como pueda parecer viendo los números en frío.
eso es
de todas formas conviene decir que ese numero seria lo que rendiria en comparacion, y en un mundo en donde los flops de switch y xbo y ps4 rindieran igual, que no es el caso.
la unica forma que tenemos para saberlo, es poniendo x juego uno al lado del otro y compararlo. porque incluso los calculos son meramente orientativos, ya que hay mas factores. por ejemplo la api sobre la que se corre, o el motor grafico empleado puede resultar mas beneficioso sobre tecnologias amd o nvidia. o incluso diferentes rendimientos entre maxwell y pascal sin ir mas lejos.
por poner un ejemplo, si switch tuviera 256 cuda cores a 1 ghz en modo dock (que no sabemos si es el caso) nos darian 512 gflops fp32 / 1024 gflops fp16, en comparacion a los 1310 fp32 de xbo.
un juego random con un 30% de codigo en fp16 en caso de xbo rendiria esos 1310 gflops, mientras que en switch rendiria como 512 * 0.7 + 1024 * 0.3 = 665 gflops
Perdón por recortar tu mensaje. Tengo que decirte que tu comentario tiene un error de cálculo muy grave. Intentaré hacer el mismo razonamiento pero de forma correcta. espero no te ofendas.
XO, al no Tener intrucciones con operando de 16 bit, utiliza operandos de 32 bit (para emular fp16), descartando 16 bit de cada operando.
Partiendo del supuesto que un juego ramdom exprime XO y tiene un 30% de intrucciones fp16, la cuenta sería la siguiente:
De los 1310 Gflops, 1310*0,7=
917 Gflops serían para instrucciones puramente de 32 bits mientras que 1310*0,3=
393 Gflops serían para emulación de fp16.
De esos 393 Gflops, sin descartar los 16 bits en la arquitectura de Nintendo Switch necesitaríamos solamente la mitad, es decir, 192,5 Gflops
Así un juego ramdom que exprime XO al maximo, necesita 1113,5 Gflops en la arquitectura de switch. Ese número está muy lejos 665 Gflops que proponías.
Por otra parte, la velocidad de reloj de la GPU necesaria para alcansar esos 1113,5 Gflops fp32 en switch sale de la siguiente ecuación:
256(nucleos cuda)*2(instruciones por ciclo de reloj)*X=1113,5 GFlops
Esto nos daría que switch debería tener su gpu a 2,17 GHz.
Se me quema la mano de solo pensarlo...
Más abajo dijiste esto:
en fp16 seria como usar solo dos digitos por numero, y fp32 seria usar 4
Esto es una analogía no es muy correcta. Me explico:
-usando dos dígitos obtenemos obtenemos 100 números.
-Usando 4 dígitos obtenemos 10000 números.
Es decir, cambiar de 2 a 4 dígitos logramos multiplicar por 100 la cantidad de números. Pero, ahora fijate lo que pasa al saltar de fp16 a pf32:
-Con fp16 tenemos 2^16=65536 instruciones posibles por operando.
-Con fp32 tenemos 2^32=4294967296 instruciones posibles por operando.
Es decir, la diferencia en precisión entre fp16 y fp32 es
abismal multiplicando por 65536 la cantidad de instrucciones.
Switch, es una gran consola y no necsitamos compararla con XO ni ps4 por la sencilla razón de que en switch podemos llevarnos nuestros juegos a donde queramos mientras que en esas consolas no. Disfrutemos switch y no la estigmatizemos por algo que ya sabemos que ocurrirá sí o sí. Aquí uno de 30 vueltas al sol que la espera con ansia.