Parece que ya puedo poner imágenes, a partir del próximo aporte intentaré centrarme más en los juegos, con algo de análisis por encima, creo que será más ameno.
BENCHMARKSAsí que vamos con los datos que estaban pendientes, las siguientes imágenes están sacadas de PDF oficiales.
Los datos de geometría nunca han estado claros, pero aquí tenemos un tabla oficial de benchmarks usando el micro código pre lanzamiento
Fast 3D, como se ha ido comentando a lo largo del hilo, pintar con solo goraud tendría un rendimiento mucho más elevado que hacerlo texturizando todas las superficies, también tenemos el impacto del Z-Buffer por separado.

Se asume conseguir tan solo un 50% de esos resultados en un entorno de juego real, donde además de generar polígonos hay iluminación, clipping, etc.. faltaría por confirmar si el programa y el audio van en ese porcentaje, en tal caso, recogiendo el peor dato (los 124K), nos quedarían 62K, lo cual es bastante realista, muchos juegos de lanzamiento estaban en la franja de los 60K, hasta los 120K+ que llego a mostrar en World Driver Championship.

Pero el cálculo no es tan sencillo, ya que el número de polígonos que podremos pintar depende del fillrate, pintar rectángulos es más rápido que pintar triángulos, además, para conseguir un pico similar al de los benchmarks hay que hacerlo en grandes superficies, en éste caso hablan de bloques de 320x240, dónde así le sacan más partido a la RDRAM.
En su día hice un test exactamente igual, con los mismos resultados en copy: 88Mpx, en libn64 los resultados serían superiores.
c write = color write, copia directa
rmw = read-modify-write, copia con varias operaciones
block load = rendimiento subiendo texturas a TMEM (4KB cache)
z = z dando por saco

A partir de ahora los siguientes benchmarks son con el RCP a 60.85Mhz, antes de que lo subieran de rendimiento para el lanzamiento final de la consola.

Qué tal los sprites? Bueno aquí tenemos una gráfica dónde he marcado un test exactamente igual que ya he mostrado algunas veces:

Como vemos el rendimiento es prácticamente el mismo, sprites de 16x32x16bits, que libdragon no llegue a los 60fps puede deberse a que me vi forzado a usar AA para 60hz (bug consola), los textos están pintados con la CPU y a que probablemente libultra sea algo más rápida que libdragon, incluso con el clock a 60.85Mhz, definitivamente lo es cuando se usa el RSP, pero en este test no es necesario.

En el siguiente texto se explica en que consiste el test y en confirmar varios apuntes que se han ido dando desde hace años:
- Texturas, rectángulos o triángulos con mayor tamaño horizontal que vertical: Mayor rendimiento, el RDP lee y escribe por linea horizontal, cuando llega al final salta a la siguiente, esos ciclos pueden ahorrarse con éste tipo de composición, además de otro tipo de optimizaciones
- Importancia en el alineamiento

Vale, pues ya tenemos geometría del Fast 3D por un lado y fillrate máximo teórico por el otro (el cual no es demasiado dependiente del micro código, sino del modo de ciclo empleado), qué pasa cuando los mezclas? Pues la siguiente gráfica:
La gráfica muestra una curvatura de rendimiento número de polígonos VS el tamaño de los mismos:
- Más pequeños, mayor cantidad de ellos
- Más grandes, mayor utilización del fillrate disponible

1) Corresponde a Turbo 3D
2) Corresponde a Fast 3D

Ahora ya empezamos a tener una buena lista de datos, nos dicen que el equilibrio perfecto entre el RDP y el RSP son triángulos de 32 pixeles, así que probablemente la lista de arriba del todo tenga como referencia triángulos de un tamaño similar, entre 18-32, obviamente están hablando de la base del triángulo, si fuera por cada lado serían del tamaño del triángulo 1 de ésta imagen que he compuesto, pero en realidad son como el tríangulo 2. (8*8/2 = 32)

Eso es, la consola podría poner 180K triángulos goraud del tipo 2 de esa imagen, que parece pequeño? Pues en absoluto, los modelos 3D suelen estar compuestos de muchos polígonos pequeños, aún más si se trata de resolución 320x240, ahora si se acercaran a la pantalla? Pues mal asunto, pasarían a ser gigantes, pero hay juegos que saben mantener siempre la cámara bien alejada, ah sí, esos triángulos estirados horizontalmente como debe ser.

En Dark Rift desde luego se preocuparon por conseguir los 60fps.

Otro ejemplo: Fighters Destiny 2, muchos polígonos pequeños para los luchadores, sin embargo han optado por un fondo compuesto por tiles de 64x32 en lugar de estirarlos, bueno peor sería que fueran de 32x64..

Pasamos al audio, siempre se ha dicho vagamente que la consola puede poner 100 voces, usando un 1% para cada voz, bueno vamos a matizar un poco con la siguiente gráfica donde se usa a la CPU y se muestra el porcentaje de uso:
- Como vemos el porcentaje varia no solo con el tipo de frecuencia utilizado, sino con los fotogramas a los que funciona el juego, éste dato en realidad es curioso, porque aunque el programa funcione a 60fps podrías colocar un semáforo para que el audio se actualice menos veces por segundo, aumentando el tamaño del buffer que envía por cada ronda.

El porcentaje de uso utilizando un micro código de audio para el RSP, dado que en éste test se menciona el uso de reverb, es probable que también esté aplicado en el de CPU, parece que el caso del RSP no es el número de eventos lo que más consume, sino la frecuencia utilizada.

No es de extrañar que Boss Studios moviera el audio a la CPU en el temprano Top gear Rally.
* Los tests no representan el rendimiento definitivo de la consola, sino el de los micro códigos: Fast 3D, Sprite2D y la librería inicial de audio.