[PROBLEMA] Pantallazos y fallos de memoria ¿cpu muriendo? ¿placa tocando los webs?

Buenas noches, comento.

Lo primero, equipo:
CPU: i7-920 sin ningún tipo de OC, con uso desde Abril de 2009 (que ya está bien xD).
Disipador: Noctua en torre de 12cm (no suele pasar de 50ºC, no es que sea buena temp pero podría ser mucho peor)
Placa: Sapphire Pure Black X58 (no tiene ni seis meses)
Memoria: 6x2GB G.Skill (3 módulos de hace 1 año y 3 con entre uno o dos años antes, exactamente iguales)

Imagen

Imagen


Además una Creative Titanium HD, una 5850 (con dos monitores), una Thermaltake de 650W, un 840 Pro y un Raptor (nada relevante para lo que aquí nos ocupa).

Hasta hace 2 días tenía un Windows 7 al que de vez en cuando se le iba la pinza y me soltaba un pantallazo azul, como soy muy vago, me daba pereza reinstalar y ponerme a ello (el windows estaba volcado de otro SSD anterior, ni siquiera hice reinstalación nueva). Lo achacaba al uso del RAMDrive y que alguno de los módulos de memoria me tocaba las narices.

Hace 2 días, cada vez que enchufaba un pincho USB, el ordenador decidía agraciarme la vista con un bonito azul y su correspondiente retahíla de caracteres blancos. Después de que me saltase lo menos 4 veces, me lié la manta a la cabeza y saqué la licencia de W8 que tenía en un cajón (de aquellas de 15€ de cuando salió).

Instalé y todo era maravilla, alegría y felicidad, hasta esta mañana. Zas! en toda la boca. He descubierto que Windows 8 ha cambiado los pantallazos azules. Error en memoria. Vale. Me lío la manta a la cabeza (esta vez hacia el lado contrario) y le dejo casi 10h de memtest. Llego a casa y me encuentro esto:

Imagen


6 iteraciones y una séptima casi completa. Un error. Un único error. Un error en un sólo bit. Error, por tanto, despreciable (no es descabellado que una memoria no ECC tenga un error en un bit). Nada de un módulo muriendo, cientos de megas inexistentes o que el memtest haya muerto en el intento. Un. Puto. Bit. De millones.

Por otro lado, tengo otros síntomas. Yo soy de suspender el equipo, es decir, casi nunca lo apago; por lo general cuando se arranca de 0 es por que ha cascado o por actualizaciones. Esto lo cuento por que otra cosa que me pasa, muy de vez en cuando, es que a veces, al volver de una suspensión el bicho se queda frito: ventiladores y lucecitas encendidas pero no responde. A veces, cuando reinicio (y casi siempre después de haber muerto después de una suspensión) en vez de detectarme los 12GB me detecta 8. Para que vuelva a detectar los 12 tengo que abrir la caja y tocar los módulos de ram (apagado, claro xD).

TL/DR:
  • Problema 1: BSOD debidos a memoria.
  • Problema 2: A veces se queda frito al volver de una suspensión (pudiera ser normal, suspender 15 veces un windows y que casque no sería descabellado).
  • Problema 3: El sistema de repente deja de detectar los 12GB y detecta sólo 8. Para arreglarlo basta con mover suavemente los módulos de RAM.

  • Hecho 1: Reinstalación limpia, drivers al día.
  • Hecho 2: Placa nueva, 0 OC.
  • Hecho 3: Memtest "correcto" (el fallo que da es asumible).

Así que mi pregunta es ¿CPU o placa?

Así de primeras he pillado un Xeon LC5528 en aliexpress por 25€ para probar, pero a ver si alguien me sabe decir algo (alguna forma de testeo o bench que le pueda meter, por ejemplo).
Si pasaba con la placa antigua y sigue pasando con la nueva.... no es la placa

Metele estres del bueno al micro durante una hora o dos: prueba de estabilidad, calculos de punto flotante y esas cosas nazis, si te lo aguanta no es el culpable, usa el Prime95, el OCCT en modo CPU y luego CPU + RAM.

RAM: A veces un solo bit puede desmoronar todo un sistema, si con un modulo (el bueno) no te hace rarezas pero es poner el segundo y morirse, pues ya sabes.

La fuente compruébala también, si la tienes desde el 2009 no vendrá mal que le pegues un repaso a los voltajes.
Gracias por responder.

carniceroman escribió:Si pasaba con la placa antigua y sigue pasando con la nueva.... no es la placa

No estoy seguro de que con la otra placa me hiciera lo mismo (no me acuerdo). Los problemas que me daba eran otros (si mal no recuerdo), y la RAM era distinta (3 módulos y 3 módulos). Por eso no descarto la placa.

carniceroman escribió:Metele estres del bueno al micro durante una hora o dos: prueba de estabilidad, calculos de punto flotante y esas cosas nazis, si te lo aguanta no es el culpable, usa el Prime95, el OCCT en modo CPU y luego CPU + RAM.

Tenía pensado eso, pero no sabía exactamente qué meterle. Bajando :3

carniceroman escribió:RAM: A veces un solo bit puede desmoronar todo un sistema, si con un modulo (el bueno) no te hace rarezas pero es poner el segundo y morirse, pues ya sabes.

El tema es que si fuese ese bit el que está jodido daría error en todas las pasadas (casi 7) que ha hecho, por eso descarto el fallo en RAM viendo esos resultados. Además, no puedo probar quitando módulos y poniendo. Tengo 6 módulos y el fallo puede ser una vez al día, pero también puede pasar una semana entre fallos -_-

carniceroman escribió:La fuente compruébala también, si la tienes desde el 2009 no vendrá mal que le pegues un repaso a los voltajes.

Me lo apunto, de todas formas, los fallos que he tenido de fuentes siempre ha sido que algo ha dejado de funcionar (como discos duros) o que el bicho se queda tieso (pantalla congelada).
La mejor forma de descartar es sin duda una criba, probar los componentes uno a uno en otro sistema a poder ser. No sé por cual votar, voy a decir ram por no preocuparte :-| jaja. Saludos.
El shocket 1366 no es precisamente fácil de encontrar, me costó encontrar que me vendieran una placa nueva, como para encontrar alguien conocido con un shocket de este tipo xD
Prueba memtest modulo a modulo, el q este defectuoso lo quitas y trabaja por un tiempo asi, si el error reaparece ya sabes q no es la ram. Yo probaria cada una en el mismo banco para asi descartar q sea un banco, si no da el error en un solo banco ya sabes q seria la placa
La putada es que no dispongo del tiempo necesario para probar los módulos uno a uno. Cuando llego a casa me pongo a estudiar (con el pc). Hoy que tengo turno de 8 horas volveré a dejar el memtest a todo a ver que me encuentro.
Prueba la RAM, al menos en tandas de 3 en 3 modulos. Si solo es uno, y eso parece, descartas la mitad de golpe y siempre podras ir funcionando con 6 gigas hasta que tengas tiempo de buscar el modulo maldito del averno.

Suerte!!
ToPoSorak escribió:Prueba la RAM, al menos en tandas de 3 en 3 modulos. Si solo es uno, y eso parece, descartas la mitad de golpe y siempre podras ir funcionando con 6 gigas hasta que tengas tiempo de buscar el modulo maldito del averno.

Suerte!!

El tema es que si me pongo a ello no acabo nunca xDD

Al tema, como dije nuevo memtest y nuevos resultados: error cerca del mismo sitio que el otro.

Imagen

Ahora sí que queda algo más claro que es la RAM (o el slot donde está, pero lo dudo).

¿Existe alguna forma de saber qué módulo es sin tener que ir probando los 12 uno a uno?

PD: Casi prefería que fuera la CPU, la RAM es una clavada [buuuaaaa]
Los errores "aleatórios" tienen un enorme porcentaje de posibilidades de ser problemas de fuente de alimentación.

Prueba otra fuente, suele ser el eslabón mas debil en la mayoría de los PC´s
Aleatorios no por síntomas, sino por ocurrencia, los síntomas son siempre los mismos: la RAM.
Para futuras referencias, al final funciona, pero ni idea de por qué.

Después de unos cuantos días con el equipo ahí pasando memtests de forma individual a las memorias (entre 4 y 7 pases por módulo) y tener 0 fallos, ahora funciona bien. Los voltajes de la fuente están bien, la configuración de la BIOS y del SO es la misma y la posición de los módulos está tal cual lo tenía (los numeré). Sin embargo ahora esto parece que no da fallos.

¿Un módulo mal conectado que no hacía del todo contacto? ¿suciedad en los pines del slot de la ram que se ha ido al meter y sacar módulos?

Ni idea de qué podría pasar, pero bueno, esos €urillos que me ahorro en cambiarlo todo [+risas]
11 respuestas