la kyroII es un chipset 3D increible... no se como no implementaron el direct-rendering de esa tarjeta en las series nvidia o ati... en vez de tanto parchear el zbuffer para que rule mas rapido con menos ancho de banda. la pena es que la tarjeta no tiene T&L ni shaders, pero con una CPU pepino (un P4 2,4 o algo asi) la tarjeta va rapidisima...
para interesados, KyroII usa un metodo de renderizado que es una mezcla entre el algoritmo del pintor y el zbuffer inverso. para pintar, divide la pantalla en cuadritos de 8x8 pixeles (si estas usando 32 bits de profundidad y 32 bits de zbuffer serian 8*8*4*4=1024 bytes, eso cabe en un cache L1 sin problemas), ordena en orden inverso los poligonos que solo son visibles en esa zona (en un pantalla de 200000 poligonos que es lo habitual, a 1024x768, saldrian a calcular unas 13000 zonas de 8*8) segun formulas demostradas, el 80% de la complejidad poligonal se concentra en tan solo la mitad de la pantalla (el personaje principal, algun enemigo, fuegos, columnas...), el resto, o es cielo y la complejidad poligonal es minima, o es pared y la complejidad es minima tambien. con quicksort, ordenar 200000 poligonos por su profundidad es algo ridiculo en tiempo de proceso. a posteriori, por cada cuadro de 8*8, y usando algo de raytracing, se calcula cuantos poligonos entran dentro de ese cuadro de 8*8, y se pintan desde detras hacia adelante (algoritmo del pintor), de tal forma que los poligonos traseros quedan automaticamente tapados por los mas cercanos a la camara. repetir 13000 veces para cubrir una pantalla de 1024x768.
asi explicado puede parecer lento, pero tened en cuenta que al trabajar con datos tan pequeños (un buffer de 1024bytes que cabe directamente en cache L1, con su buffer Z incluido) y una unica ordenacion, que ni siquiera es ordenacion, es una lista enlazada a los poligonos, guardada en la cache del chipset grafico, todos los calculos se hacen sin esperas ni latencias de acceso a memoria.
de hecho, se hicieron unos calculos de rendimiento, y una tarjeta KyroII se comportaba mejor MIENTRAS MAS COMPLICADA ERA LA ESCENA. o sea, las geforce3 y 4, que eran las que habia cuando KyroII estaba en mercado, mostraban una caida de rendimiento exponencial (al multiplicar la complejidad de la escena al doble, gforce 3 y 4 reducia su rendimiento el cuadruple), mientras que kyroII reducia su rendimiento de forma lineal (al aumentar la complejidad de la escena al doble, KyroII reducia su rendimiento a la mitad)
bueno , espero no haber aburrido, lo unico que queria era hacerle un homenaje a un chipset grafico tremendo que fue engullido por una campaña de marketing de nvidia y ati, y una mala programacion de drivers por parte de KyroII