[SOFTWARE] MODS / MATS Testeo memorias GPUs AMD NVIDIA UEFI Y LEGACY DESCARGA

MODS / MATS Testeo memorias GPUs AMD NVIDIA UEFI Y LEGACY
Buenas dejo estos enlaces por si alguien necesita los archivos para hacerle un testeo a las memorias de su GPU, son compatibles tanto en UEFI (no lo he probado) y Legacy.

DESCARGA MODS MATS:
https://drive.google.com/uc?id=16VfAEKq ... t=download
https://mega.nz/file/N5YGBATC#-6i_rkFbS ... bdFQ4K-X7o

Está la misma herramienta o parecida para AMD per creo que es una imagen que ocupa mucho más.

Imagen
GUIA https://repair.wiki/w/Nvidia_Memory_Testing_Guide

Guía de prueba de memoria de Nvidia
Si tu tarjeta tiene todos los voltajes y has verificado que el circuito del BIOS funciona como debería, pero aún no tiene salida de la tarjeta, o hay salida, pero tiene artefactos, fallas bajo carga, comportamiento anormal, etc. Bueno, probablemente tenga un chip de memoria defectuoso, has venido al lugar correcto.

Reemplazar chips de memoria es un procedimiento difícil que requiere experiencia en soldadura BGA y el equipo adecuado. Si no tienes las herramientas o la experiencia, debes dejar que un experto lo haga por ti.

Nvidia MOdular Diagnostic Software (también conocido como Nvidia MODS)
MODS es una herramienta muy poderosa que prueba las tarjetas Nvidia para diferentes tipos de fallas. Incluye una herramienta independiente llamada MATS que prueba la memoria específicamente. Si tiene acceso a él, esta guía le mostrará cómo usar MATS e identificar chips de memoria defectuosos.

Etiquetado de canales de memoria
Como se muestra en la Figura 1, cada canal consta de 2 chips de memoria, 0 y 1. Para una tarjeta con N GB VRAM, hay N/2 canales. en ese ejemplo, hay cuatro canales de memoria (256 bits) en la GTX 1080 de 8 GB.

Los módulos de memoria se cuentan en el sentido contrario a las agujas del reloj a partir de la esquina OPUESTA de la flecha dorada en el núcleo. Desde A1, A0, B1, B0... hasta X1, X0. (X siendo el último canal)
Imagen


USO DE MATS EN UNA TARJETA QUE NO TIENE SALIDA DE VÍDEO
Necesitará una CPU con una GPU integrada (cualquier CPU Intel desde Sandy Bridge o una APU AMD) o una tarjeta de video secundaria para obtener la salida de pantalla.

Después de iniciar MODS, escriba los siguientes comandos para comenzar a probar la memoria:

./mods gputest.js -skip_rm_state_init -mfg

y entonces:

./mats -n [card index] -e [memory size to test in MB]

El índice debe ser 1 si está utilizando gráficos integrados o una GPU dedicada con una CPU que no tiene integrada.

El tamaño de la memoria para probar debe ser de al menos 5, se recomienda 50. Los números más altos tardarán más en completarse.

Una vez finalizada la prueba, obtendrá un archivo report.txt que contiene el resultado de la prueba. Alternativamente, puede agregar |lessal final del segundo comando para mostrar los resultados instantáneamente en la pantalla.

USO DE MATS EN UNA TARJETA QUE TIENE SALIDA DE VÍDEO
Esto es un poco más fácil ya que no tiene que ingresar el primer comando o un índice, simplemente ingrese ./mats -e [memory size to test in MB]y la prueba se ejecutará. Todavía puede agregar |lessal final para mostrar el informe en la pantalla.


Identificación de los bancos de memoria defectuosos
Al leer el ejemplo de informe en la Figura 2, MATS encontró errores en D1 y C0, que corresponden a los chips de memoria marcados en la Figura 3.

Imagen
Imagen

Por lo general, solo un chip falla y hace que la tarjeta no emita una imagen o muestre artefactos. Sin embargo, en este caso, hubo un problema con 2 chips que apunta a una falla de IMC (controlador de memoria integrado) que está dentro del núcleo. Afortunadamente, el usuario dejó caer esta tarjeta en particular. Quitar los chips de memoria, limpiar las almohadillas y volver a soldar los chips lo arregló.

Sin embargo, si obtiene errores en todos los canales, es el IMC o un problema relacionado con la alimentación que eliminó todas las memorias o no les proporciona suficiente energía. Los bits que fallan a veces pueden decirle si el problema es la memoria en sí o el IMC, pero reemplace la memoria para asegurarse.




DESCARGAS MODS / MATS
Solo hay que quemar la imagen en un pendrive con rufus
400.281.2 (imagen) https://disk.yandex.ru/d/R9lW1UfUvfBBrA RTX 2000 o inferior
455.127 (imagen) https://disk.yandex.ru/d/pTW7PqlPOCHDIA RTX 3000 o inferior
265.30 - 455.219 (Toolza) https://disk.yandex.ru/d/tAIPw5QLnez-2g Todas las versiones del software

Imagen

Fuente de las descargas: http://vlab.su/viewtopic.php?f=48&t=124090


THE LORD OF THE GPU
Sirve para testear las memorias de tarjetas nvidia y amd.

nVIDIA RTX 30xx series y anteriores
nVidia RTX 200XX, GTX 16xx/10xx/9xx/7xx/6xx/5xx series y anteriores
AMD RX4xx/RX5xx/RXVEGA64/R7/R9 Series/HD7xxx

Imagen

Descarga: https://drive.google.com/drive/folders/ ... 2L3kxJxa6k

La instalación es algo más compleja, tampoco es que se algo muy complejo, y se requiere de un dispositivo de unos 80GB. En el siguiente vídeo hay un tutorial de como crear la unidad:
¿Esto sirve para comprobar que tan quemada viene una gráfica de minero?
Gnoblis escribió:¿Esto sirve para comprobar que tan quemada viene una gráfica de minero?

claro, te indica si hay algún módulo que da errores de escritura o lectura.

Además que se supone que hay más herramientas dentro de mods para testear el chip de la gpu, mats es solo una de ellas enfocada a las memorias.


Por cierto, si os bajáis la imagen para las RTX 3000, las de las 2000 creo que también hay que tocar el fichero si está puesto lo de apagar el PC por defecto, una vez creáis el USB lo abrís y vais a la carpeta y modificáis los archivos runmats o commands con el bloc de notas

400 config - editar en /home/ runmats .
455 config - editar en /tiny/ commands .

Si os fijáis el test está puesto por defecto para que haga solo una comprobación de 20 MB, y eso está bien pues es rápido, una vez lo finaliza puedes ejecutar los siguientes comandos, cada línea es un comando al que hay que darle enter, la almohadilla es un comentario #, no debéis ponerlo:

ls #nosllevaaverlosdirectorios
cd 455.127 #numerodeldriverquemuestrals
./mats -e 20 #númerodemegasacomprobar

Así finalizado el test de 20 megas podéis hacer uno de más MB, pero el problema es que en el bloc de notas hay una linea al final de todo que lo que hará es que el programa apague el PC automáticamente después de la prueba de 20 MB que se hace por fecto, por lo que hay que ir a la carpeta del USB donde habéis quemado el programa con rufus y modificar el fichero de configuración para eliminar toda la línea que he marcado en negro.

Hay que eliminarla y guardar el archivo, así no se apagará el PC.


#!/bin/sh

# Copyright (c) 2009-2015, NVIDIA CORPORATION. All rights reserved.
# See /etc/LICENSE file for details.
# Copyright (c) 2021-2022, by Mansi.


MODSDIR="`modsoutputdir`"

# Run MATS
${MODSDIR}/455.127/mods gputest.js -no_gold -test 275
sleep 3
${MODSDIR}/455.127/mats -n 1 -e 20 -logfile mats_mobile.log
sleep 3
${MODSDIR}/455.127/mats -e 20 -logfile mats.log

# beep
echo -ne '\007'

# PowerOFF?
poweroff




Una vez finalizado el testeo podemos ver un reporte de este con el siguiente comando

nano report.txt
En la pagina de descarga de mats he vsito que junto a algunas versiones viene un numero de tarjeta grafica. Es porque es especifica para esa tarjeta?
Necrofero escribió:En la pagina de descarga de mats he vsito que junto a algunas versiones viene un numero de tarjeta grafica. Es porque es especifica para esa tarjeta?

Eso parece pero la verdad no tengo ni idea
Tengo una gtx titán x que da fallos de imagen , al poner la resolución 1080p salen puntos verdes , con resolución baja no .
Cree varios USB pero nada , siempre me dice que en la dirección no hay nada , no me encuentra los archivos , no sé si es cuestión de la efi de la placa base .
Alguna solución , siempre me da error acpi y después que en el directorio root no hay nada .
Intento buscar manualmente en /mnt pero nada , /mnt/root/mnt/nv vacías .
Alguna ayuda .
Gracias .
Yo tengo una Titan X Maxwell con un modulo de FBIO roto pero tengo porblema para identificarlo porque lleva en las dos caras chips (24 chips) pero en el mats solo aparece 12 canales de memoria... como procederia a identificar? La memoria van de M1 a M12 y las traseras de M501 a M512
NUEVA VERSIÓN DE MODS MATS ( VER VÍDEO )




DESCARGA DE NUEVA BUILD QUE NO DA TANTOS ERRORES:
https://drive.google.com/file/d/1MpX-Wz ... wEhIQ/view
https://mega.nz/file/N5YGBATC#-6i_rkFbS ... bdFQ4K-X7o
katatsumuri escribió:NUEVA VERSIÓN DE MODS MATS ( VER VÍDEO )




DESCARGA DE NUEVA BUILD QUE NO DA TANTOS ERRORES:
https://drive.google.com/file/d/17C_sWd ... rLVZh/view
https://mega.nz/file/N5YGBATC#-6i_rkFbS ... bdFQ4K-X7o



El drive da error.
@Necrofero se debió morir el enlace, si ocurre otra vez entrad al vídeo que lo habrá actualizado seguramente https://drive.google.com/file/d/1MpX-Wz ... wEhIQ/view
¿Cuánto dura el test para las RTX 30XX aproximadamente?
@katatsumuri lo has probado en la erying 11800H? a mi no sé por qué no me carga el grub2dos
@toniroller las placas erying no tienen bios legacy, solo uefi, por lo que no se pueden arrancar este tipo de herramientas.


Mira si en la bios hay la opción de activar el CSM que es un módulo de compatibilidad para sistemas antiguos.



Pon los discos en legacy
katatsumuri escribió:@toniroller las placas erying no tienen bios legacy, solo uefi, por lo que no se pueden arrancar este tipo de herramientas.


Mira si en la bios hay la opción de activar el CSM que es un módulo de compatibilidad para sistemas antiguos.



Pon los discos en legacy


Ahh ok! Gracias mañana pruebo!

También he leído que algunas RTX con bios UEFI pueden dar fail en mats pero en realidad están bien. Me estoy volviendo loco no sé si mi gráfica está viva o moribunda jaja por eso quiero abrir la version esta del vídeo con todos los menús. Ya te diré [oki]
Tengo una rtx 3080 10gb y usando mats testeando 10 mb me tirar 256 errores en todos los chips y si testeo 100mb me tira menos de 50 errores en todos los chips.
Estoy haciendo algo mal? o tengo todos los chips fritos?.
Uso el 455.127.
Dejo el reporte adjunto

Adjuntos

report.txt (64 KB)

Reporte 10mb modo legacy
duncan088 escribió:Tengo una rtx 3080 10gb y usando mats testeando 10 mb me tirar 256 errores en todos los chips y si testeo 100mb me tira menos de 50 errores en todos los chips.
Estoy haciendo algo mal? o tengo todos los chips fritos?.
Uso el 455.127.
Dejo el reporte adjunto

Si da error en todos los chips o si los errores "saltan" de un banco a otro, normalmente northwestrepair hace reballing del chip gráfico. O eso o es un problema de alimentación. Desde luego que no es algo para hacer en casa salvo que tengas MUCHA mano con soldadura SMD. Y no solo un soldador de aire caliente sino placa calentadora, plantillas, bolas de soldadura con plomo y demás.

Saludos
duncan088 escribió:Tengo una rtx 3080 10gb y usando mats testeando 10 mb me tirar 256 errores en todos los chips y si testeo 100mb me tira menos de 50 errores en todos los chips.
Estoy haciendo algo mal? o tengo todos los chips fritos?.
Uso el 455.127.
Dejo el reporte adjunto


Pero la tarjeta funciona correctamente y le has pasado el test o no da imagen? Ten en cuenta que hay veces que mats se ralla y da fallos aunque esté todo correcto.
Muchas gracias por la información compañero.

Tengo una 3090 que me da pantallazos de forma aleatoria y gracias a tu post he podido descartar que sea la VRAM, no mostraba ningún tipo de artifacts pero había que cerciorarse.

Por si alguno tiene dudas sobre como ejecutar MATs para la 3090 o 4000, únicamente hay que pegar la carpeta con la nueva versión( en mi caso la 455.229_3090) dentro de la carpeta mods del pen ejecutable.

EDIT: Ojito es recomendable pasar el nvmt, es un test más específico y es donde me ha sacado los dos módulos con errores.
He grabado la version que hay para laserie 3000, la 455 pero al iniciar el usb me salta este error :
ERROR: BP @ <FILEID:0X00006C>:464
Sabeis por que?

EDIT: me he descargado el Mats 2.0 Flash Drive By Meister Ver 4.3 y cambiando la bios a csm he podido lanzarlo bien
Pollonidas escribió:
duncan088 escribió:Tengo una rtx 3080 10gb y usando mats testeando 10 mb me tirar 256 errores en todos los chips y si testeo 100mb me tira menos de 50 errores en todos los chips.
Estoy haciendo algo mal? o tengo todos los chips fritos?.
Uso el 455.127.
Dejo el reporte adjunto

Si da error en todos los chips o si los errores "saltan" de un banco a otro, normalmente northwestrepair hace reballing del chip gráfico. O eso o es un problema de alimentación. Desde luego que no es algo para hacer en casa salvo que tengas MUCHA mano con soldadura SMD. Y no solo un soldador de aire caliente sino placa calentadora, plantillas, bolas de soldadura con plomo y demás.

Saludos

Una curiosidad,¿Que hace este test no hacen otras opciones como Video Memory Stress Test o MemtestG80 que son menos coñazo?
dicker31 escribió:Una curiosidad,¿Que hace este test no hacen otras opciones como Video Memory Stress Test o MemtestG80 que son menos coñazo?

La mayor ventaja que yo veo es que trabajan a mucho más bajo nivel y no requieren un sistema operativo. Gráficas con un chip de memoria totalmente muerto, por ejemplo, no llegan a mostrar imagen por pantalla ni mucho menos arrancar. Incluso si se utiliza una segunda GPU para ver el monitor al intentar cargar los drivers de la "rota" es muy probable que se cuelgue el SO, o con mucha suerte que no funcione.

Otra ventaja enorme es que en caso de tener fallos en VRAM te dicen el chip que falla exactamente, de tal manera que se puede cambiar solo ese. También otros síntomas como que el fallo "salte" de un chip a otro, que se suele solucionar con un reballing completo (un trabajo difícil y especializado, pero bueno, puede hacerse) son imposibles de identificar si no es con esta herramienta.

La verdad que para todos los sitios y aficionados que reparan electrónica que se haya filtrado esto es una bendición. Porque antes eran herramientas internas de nvidia y sus OEM y gráficas con un fallo que se podía arreglar por literalmente 5€ iban a la basura.

Las aplicaciones como Video Memory Stress Test son buenas si la gráfica no está rota del todo para hacer un diagnóstico previo o para descartar que un fallo sea de otra cosa que no es la VRAM. Pero llegados al punto de tener que reparar la gráfica, no se suele poder prescindir de MATS/MODS.

Saludos
A mi no me funciona en la placa, descomprimo el meister 4.3, sale una imagen, la quemo con rufus, me hace tres particiones y solo puedo arrancar la segunda que no es para mi GPU que es una RTX 3070, las otras dos particiones no arrancan.

La partición que arranca solo me muestra la segunda opción del vídeo, la segunda línea que no es para la serie 3000, solo me muestra tres opciones.

Me estoy bajando la 4.2 que es la de mega, la de google drive es 4.3

Nada, con la 4.2 me ocurre lo mismo, me sale solo la opción de gpus inferiores, solo tres opciones.
Imagen


En un comentario dice que hay que poner la bios en modo legacy, en mi caso creo que activar el csm, pero lo tengo activado y no sirve de nada.

@toniroller pudiste usar el soft con la erying?
Me pasa lo mismo. No lo conseguí ni poniendo legacy ni nada... :(
23 respuestas