[Guía] Cómo detectar y solucionar los problemas del PC

@Roman Kr Tengo dos ssd, uno nvme samsung evo 970 donde está windows y poco más y otro para juegos samsung evo 850 ssd (sata tradicional). El primero tiene menos de dos años y el segundo sí que tiene unos cuantos más. Cristaldisk me indica un 100% de salud para el nvme y 97% para el otro. Qué más pruebas podría hacerle a los discos para ver si es la causa?

Cuál sería la mejor forma para reinstalar windows? Desde el propio Windows dandole a restaurar sin conservar nada o tengo que crear un usb booteable con la herramienta de Windows?

La verdad es que es tan raro, aleatorio y descontinuado en el tiempo lo que pasa que no sé por dónde tirar.
@Ma92

Pues así a voz de pronto no sé qué podría ser, ya que un samsung es muy raro que falle... por descartar, desmonta el PC y comprueba que estén todas las conexiones bien fijadas.

En cuanto a la reinstalación de Windows, es mejor formatear e instalarlo con un usb booteable, no perderás la licencia por reinstalarlo, así que por en ese sentido no te preocupes.

Edito: pásales benchmarks a los ssds con crystaldiskmark y ASssd y mira los valores que te da, si son muy anómalos (puede que ahí esté el problema). Esto lo explico en el post principal en el apartado hdd/ssd.
@Roman Kr

Vale, gracias. No sé, seguiré dándole caña al PC y si me vuelve a suceder ya formatearé por intentar algo. A saber qué es lo que pasa. Gracias de nuevo [oki]

Edito: Haré lo que me has comentado de los bench en cuanto pueda y pongo los resultados

Edito 2: He realizado Benchmark con la utilidad de Samsung magician y los resultados son los siguientes (la tenía instalada y he visto que da la posibilidad de hacerlo, he supuesto que valdría igualmente)

NVME Secuencial (MB/s) Lectura: 3556 Escritura: 1544
Aleatorio (IOPS) Lectura: 145263 Escritura: 169433

SSD Secuencial (MB/s) Lectura: 553 Escritura: 533
Aleatorio (IOPS) Lectura: 58593 Escritura: 51513


He estado haciendo más pruebas como las que indicas en el primer post y nada raro. Para la RAM usé la herramienta de Windows de diagnóstico de memoria, hice los dos primeros test. Para Gráfica y CPU jugando a juegos exigentes no tengo problemas, discos los benchmark e información....

Con relación de lo que indicas en la guía de abrir el administrador de tareas cuando se produce el fallo para comprobar el uso del disco, una de las veces que se quedó congelado me lo dejó abrir pero daba valores muy extraños, yo creo que no estaba mostrando la información real y explicó por qué: Estaba todo a un 0% de uso excepto la gráfica que indicaba 100% (cosa que no era real pues de ser así los ventiladores de la gráfica estarían a tope y para nada, funcionaban a la velocidad de su estado en reposo, me baso en el ruido). Además también es imposible que el uso de RAM sea de un 0%

Lo único que podría arrojar algo de información es que el proceso "Inicio" estaba en primer lugar (ordenados de mayor a menor uso de CPU) y eso sin quedarse colgado no sucede.
@Ma92

Los valores parecen en orden, aunque convendría que hicieses el bench con crystaldiskmark también para confirmar los resultados. En cuanto a lo del admin de tareas... es muy raro lo que te pasa y no sabría decir por qué es :-? ni aun sabiendo lo del proceso inicio. Hay una cosa que puedes probar a hacer, mantén siempre una carpeta abierta y el admin de tareas abierto. Cuando te pase, selecciona el proceso explorador de windows y dale a reiniciar. Coméntame si funciona.
Inmenso material como siempre @Roman Kr, no había visto este hilo hasta ahora pero es sencillamente magiatral... algo que todo buen aficionado a la informatica debería llevar escrito en el ADN...
@Roman Kr Ok. Lo del administrador de tareas es solo cuando el ordenador se queda colgado, en funcionamiento normal muestra los valores correctos, cierra procesos si así lo ordeno, etc... La otra vez probé a intentar cerrar algún proceso (creo recordar que el inicio) y solo me salía un mensaje de error pero el PC seguía sin responder.

Si me vuelve a suceder (que ojalá no) probaré a cerrar algún otro proceso pero mi apuesta es que no le afectaría en nada y seguiría igual. Pufff a saber [enfado1]
@RaulKO
RaulKO escribió:Inmenso material como siempre @Roman Kr, no había visto este hilo hasta ahora pero es sencillamente magiatral... algo que todo buen aficionado a la informatica debería llevar escrito en el ADN...

Gracias [beer] , en principio iba a hacer un hilo bastante más escueto para usarlo de copia y pega en otros hilos de problemas de hardware (porque para los equipos que tienen problemas pero logran encender, siempre es lo mismo, pasar occt o prime95, luego furmark, luego crystaldisk, etc.). Pero al final no pude evitar hacer un buen tocho, para variar [qmparto]

-

@Ma92
Ma92 escribió:@Roman Kr Ok. Lo del administrador de tareas es solo cuando el ordenador se queda colgado, en funcionamiento normal muestra los valores correctos, cierra procesos si así lo ordeno, etc... La otra vez probé a intentar cerrar algún proceso (creo recordar que el inicio) y solo me salía un mensaje de error pero el PC seguía sin responder.

Si me vuelve a suceder (que ojalá no) probaré a cerrar algún otro proceso pero mi apuesta es que no le afectaría en nada y seguiría igual. Pufff a saber [enfado1]

No no, si lo que yo digo es otra cosa. Cuando tienes una carpeta abierta, en el admin de tareas te sale como "explorador de windows", si seleccionas ese proceso y le das a reiniciar (aquí se cambia el cuadro a reiniciar, en vez de finalizar), hace un reinicio del explorador. Es como un mini reinicio del sistema (no es lo mismo que reiniciar el PC, ojo) y además te mantiene todo lo que tienes abierto (puedes probar a hacer esto en cualquier momento, no hace falta esperar a que se te congele). No digo que esto pueda ser una solución a tu problema, pero si funciona, podría ser un pequeño parche.

Y por mi parte hasta aquí te puedo ayudar, porque no se me ocurre qué podría ser, solo me queda decirte que mires que todos los cables estén bien conectados a la placa y a los SSD, que la RAM no esté suelta, etc. Te deseo suerte y que pronto encuentres una solución a tu problema. Que por cierto, si encuentras la solución, posteala aquí porfa, ya por pura curiosidad [+risas]
@Roman Kr
Buenas, yo no había visto esta guía. Por una banda genial que hayas montado esto.
Por otra decir que básicamente usas occt para todo y que podrías dar más opciones.
Por ejemplo occt gpu estrés básicamente el consumo/temp, pero la estabilidad de undervolt no la cazas. Si tienes un UV/OC. Occt no va nada bien para testear eso.
La última sobre la ram. Memtest86 a dia de hoy ya no se recomienda tanto. Al menos actualizar con las opciones modernas Karhu, TM5 y HIC memtest.
Gracias otra vez por el empeño! [plas]
Herionz escribió:@Roman Kr
Buenas, yo no había visto esta guía. Por una banda genial que hayas montado esto.
Por otra decir que básicamente usas occt para todo y que podrías dar más opciones.
Por ejemplo occt gpu estrés básicamente el consumo/temp, pero la estabilidad de undervolt no la cazas. Si tienes un UV/OC. Occt no va nada bien para testear eso.
La última sobre la ram. Memtest86 a dia de hoy ya no se recomienda tanto. Al menos actualizar con las opciones modernas Karhu, TM5 y HIC memtest.
Gracias otra vez por el empeño! [plas]

Gracias x el apoyo y la crítica constructiva [beer]

Recomiendo OCCT para todo, porque básicamente es un todo en uno y así el user no tiene que bajarse más programas para el mismo fin. Aunque también doy alternativas (como Prime95 para la CPU y FurMark para la GPU). Pero como digo, el fin es exactamente el mismo y aunque no usen el mismo motor, todos sirven por igual para detectar errores y/o OC's inestables, debido a que cargan los componentes al máximo (al igual que otros programas de estrés).

En cuanto a memtest86, no sé por qué dices que a día de hoy no se recomienda tanto, ya que es de los test de RAM más completos que hay, con bastantes algoritmos que testean toda la RAM mientras el PC está apagado (que es lo recomendable, para checkear hasta la última celda). Y es compatible con todos los tipos de RAM que hay hoy en día (ECC, DDR2, DDR3, DDR4, etc.). De hecho, algunos fabricantes, como Corsair, a veces te piden los resultados que arroja memtest86 en un PDF para poder tramitar la garantía (dependiendo de qué problema tengas). Si me dices qué diferencia hay con los test que me has citado, buscaré más info y actualizaré el post o al menos las añadiré como alternativas. Pero pienso que por lo menos el TM5 es peor, ya que se hace con el equipo encendido y eso es un inconveniente, ya que el sistema operativo ocupa parte de esa RAM que no se podrá testear.
@Roman Kr
Es un todo en uno sí, pero no caza todas las cosas. Por ejemplo yo podía hacer occt avx2 y linpack +2h pero aun así era inestable mi sistema. Cace el problema antes de intentar otra cosa. Pero vi recomendado realbench. Sino también ir algo más en profundidad sobre lo que un test comprueba o qué prueba se enfoca más o menos aspectos. (hay unos que tocan más el núcleo, otros el controlador de memoria y ram).

Yo pensaba lo mismo pero no es así. Creo que el problema es que memtest86 no soporta multicore? Y que detectando según que errores no va tan fino. RAM aunque window reserve. Es memoria volatil. No todas las direcciones están ocupadas de forma fija. Vamos que aunque te diga que reserva 4gb. Las celdas cambian. Si testeas durante suficiente tiempo, te puedes ir con un módico de seguridad que has testado a profundidad. Como soportan multihilo, van bastantes más rápido.
Corsair puede no haber cambiado las políticas por conveniencia. No es la primera vez que una empresa decide quedarse con lo viejo antes que irse a por algo más actual. Pero estoy especulando, no tengo ni idea sobre sus motivos.
Pruebas te intentaré buscar pero ahora no tengo a mano, pero si indagas un poco creo que puedes encontrar lo mismo que me crucé yo.
@Roman Kr He probado lo que comentas de reiniciar el proceso explorador de windows y lo que hace es cambiar el fondo de pantalla a negro y volverlo a poner (como si reiniciara el escritorio por así decirlo).

Muchas gracias por la ayuda y los consejos, no te preocupes, es lo que tienen estos fallos aleatorios sin patrón, que para el que los sufre son difíciles de explicar y replicar a propósito y para el que ayuda pues más complicado aún el dar un "diagnóstico" a ciegas. Yo digo, voy a preguntar por aquí que quizá a algún usuario en alguna ocasión le ha podido suceder y lo haya podido solucionar.

Por supuesto que si doy con la tecla comento la solución. Por mi parte si me vuelve a suceder (ojalá que no [angelito] ) el siguiente pasó será formatear porque poco más me queda por hacer (o al menos que sepa).

Gracias de nuevo [beer]
Muchas gracias por hilos como este, uno aprende a montar piezas buenas, el último pc que monte tiene una seasonic gold y no me arrepiento en gastar dinero en cosas de calidad.
Todo lo que sea ayudar al resto me parece genial para aprender en montajes y problemas.
@Herionz
Herionz escribió:@Roman Kr
Es un todo en uno sí, pero no caza todas las cosas. Por ejemplo yo podía hacer occt avx2 y linpack +2h pero aun así era inestable mi sistema. Cace el problema antes de intentar otra cosa. Pero vi recomendado realbench. Sino también ir algo más en profundidad sobre lo que un test comprueba o qué prueba se enfoca más o menos aspectos. (hay unos que tocan más el núcleo, otros el controlador de memoria y ram).

Yo pensaba lo mismo pero no es así. Creo que el problema es que memtest86 no soporta multicore? Y que detectando según que errores no va tan fino. RAM aunque window reserve. Es memoria volatil. No todas las direcciones están ocupadas de forma fija. Vamos que aunque te diga que reserva 4gb. Las celdas cambian. Si testeas durante suficiente tiempo, te puedes ir con un módico de seguridad que has testado a profundidad. Como soportan multihilo, van bastantes más rápido.
Corsair puede no haber cambiado las políticas por conveniencia. No es la primera vez que una empresa decide quedarse con lo viejo antes que irse a por algo más actual. Pero estoy especulando, no tengo ni idea sobre sus motivos.
Pruebas te intentaré buscar pero ahora no tengo a mano, pero si indagas un poco creo que puedes encontrar lo mismo que me crucé yo.

Pues que raro, a mi el OCCT me ha servido siempre para detectar OC inestable, tanto en mi PC como en PC's de amigos. En cuanto a los test de RAM, les hecharé un vistazo y seguramente los añada como alternativas, mañana o pasado, porque ahora mismo me da toda la pereza del mundo mundial [+risas]

-

@taservec
taservec escribió:Muchas gracias por hilos como este, uno aprende a montar piezas buenas, el último pc que monte tiene una seasonic gold y no me arrepiento en gastar dinero en cosas de calidad.
Todo lo que sea ayudar al resto me parece genial para aprender en montajes y problemas.

Me alegro de que te parezca útil, gracias por el apoyo [beer]
@Herionz pásale la opción por defecto de OCCT, no la que comentas y mira a ver si así es más estable. La opción que comentas calienta más al procesador y estresa más la caché, pero suele ser menos determinante para detectar inestabilidades.

Saludos.
@javier español
El avx2 es la opción por defecto (tienes los data sets, también modo sse). Ademas el problema venia del controlador de memoria y el on-die-termination de la ram. Ya lo cacé todo hace unas semanas y lo deje fino [sonrisa]. Pero me pasaba occt por horas, y luego me ponía 2 juegos sin limitar los fps, y a los 6-10min se me colgaba de lo lindo. [beer]

@Roman Kr
Depende del tipo de error/inestabilidad que tengas. Y la plataforma. Pero bueno, por eso digo que si puedes ir añadiendo detalles o casos pues puede ayudar a otros que vengan luego. Ya depende de como de serio estés puesto con esta guía [plas]. La sección del cuello de botella me parece idónea, sencilla, directa y fácil de entender [oki]. Deberías ponerlo en su hilo propio [beer]
@Herionz las opciones que dices no son las opciones por defecto, la opción por defecto es la siguiente:

Imagen

Ni Linpack, ni nada más, eso es si lo selecciona uno manualmente, no lo que sale por defecto.

Saludos.

Adjuntos

@javier español
Y si le das a iniciar. Veras que instrucciones > auto te pone AVX2. Y Large data set es eso > Conjunto de datos grandes. Con lo que... sí, es lo mismo. Disculpa [+risas]. Yo además lo uso con el extremo on. Que pone que va bien para pillar errores.
Lo de linpack venía a parte, tendría que haber puesto una coma.
66 respuestas
1, 2