Muy buenas tardes ^^
He estado intentar buscar soluciones por muchas páginas, googleando, etc y bueno.. me gustaria ver si alguien aquí puede ayudarme a resolver el problema, darme alguna idea nueva o ver si alguien más ha sufrido el mismo problema que yo... Os pongo en situación:
Tengo un servidor linux montado corriendo SUSE 10.2 y que básicamente tiene sendmail, qpopper, milter greylist, webmin... (aparte de otras aplicaciones que no tienen nada que ver con mail, como apache, etc pero vamos.. esas no implican problemas...). Tengo varios (bastantes) usuarios empleando este servidor de correo. Mi problema viene en que algunas veces intentamos enviar algún correo (sobretodo en horarios de oficina) y salen errores de que no se puede conectar con el servidor SMTP...
Mirando el servidor por SSH (algunas veces tambien le cuesta conectar...) y haciendo un "ps -xa |grep connections" observo que sale un mensaje del tipo "rejecting connections on daemon MTA: load average: 33" (33 es un numero variable, lo he puesto al tuntún xD).
Siguiendo con la investigación... pude comprobar que en /var/mail (donde almaceno todos los ficheros de usuario y los .pop) habian archivos de usuario de almacén de correo de más de 600 megas !!! pero bueno, me puse a renombrarlos a .backup (habiendo avisado antes al cliente de que descargase todos los correos del servidor) y el máximo tamaño que estoy permitiendo ahora por archivo de usuario es de 90 megas... (no creo que sea un tamaño demasiado grande, no? tambien decir que los que almacenan.. pueden ser un 30% de los usuarios).
También he visto que al hacer un "ls -la ." y darle 2 veces al tabulador para ver los archivos *.pop que se van creando de los usuarios (en ese directorio, /var/mail) cuando acceden a recoger el correo.. cuando no aparece ningun *.pop el servidor suele ir fino fino... es llegar a unos cuantos usuarios y ya no funciona correctamente... quizás la mayor parte del problema venga por aquí casi seguro... pero puff por preguntar... xD
Cuando ejecuto el comando top para ir controlando el uso de la cpu, etc... me sale algún dato bastante extraño.. según he visto el IOWAIT en altos porcentages puede causar un system load... pero si os digo la verdad.. mi ignorancia no llega a saber que es el iowait en mi top... aunque puedo intuir que sea el %wa (que quizas quiera decir %waiting). Os pasto una screen del top:
Y bueno chicos... creo que no se me olvida nada más, aun asi si se os presenta alguna cuestión no dudeis en preguntar, intentare contestaros xD
Saludos !!!