problemas servidor correo

Muy buenas tardes ^^

He estado intentar buscar soluciones por muchas páginas, googleando, etc y bueno.. me gustaria ver si alguien aquí puede ayudarme a resolver el problema, darme alguna idea nueva o ver si alguien más ha sufrido el mismo problema que yo... Os pongo en situación:

Tengo un servidor linux montado corriendo SUSE 10.2 y que básicamente tiene sendmail, qpopper, milter greylist, webmin... (aparte de otras aplicaciones que no tienen nada que ver con mail, como apache, etc pero vamos.. esas no implican problemas...). Tengo varios (bastantes) usuarios empleando este servidor de correo. Mi problema viene en que algunas veces intentamos enviar algún correo (sobretodo en horarios de oficina) y salen errores de que no se puede conectar con el servidor SMTP...

Mirando el servidor por SSH (algunas veces tambien le cuesta conectar...) y haciendo un "ps -xa |grep connections" observo que sale un mensaje del tipo "rejecting connections on daemon MTA: load average: 33" (33 es un numero variable, lo he puesto al tuntún xD).

Siguiendo con la investigación... pude comprobar que en /var/mail (donde almaceno todos los ficheros de usuario y los .pop) habian archivos de usuario de almacén de correo de más de 600 megas !!! pero bueno, me puse a renombrarlos a .backup (habiendo avisado antes al cliente de que descargase todos los correos del servidor) y el máximo tamaño que estoy permitiendo ahora por archivo de usuario es de 90 megas... (no creo que sea un tamaño demasiado grande, no? tambien decir que los que almacenan.. pueden ser un 30% de los usuarios).

También he visto que al hacer un "ls -la ." y darle 2 veces al tabulador para ver los archivos *.pop que se van creando de los usuarios (en ese directorio, /var/mail) cuando acceden a recoger el correo.. cuando no aparece ningun *.pop el servidor suele ir fino fino... es llegar a unos cuantos usuarios y ya no funciona correctamente... quizás la mayor parte del problema venga por aquí casi seguro... pero puff por preguntar... xD

Cuando ejecuto el comando top para ir controlando el uso de la cpu, etc... me sale algún dato bastante extraño.. según he visto el IOWAIT en altos porcentages puede causar un system load... pero si os digo la verdad.. mi ignorancia no llega a saber que es el iowait en mi top... aunque puedo intuir que sea el %wa (que quizas quiera decir %waiting). Os pasto una screen del top:

Imagen

Y bueno chicos... creo que no se me olvida nada más, aun asi si se os presenta alguna cuestión no dudeis en preguntar, intentare contestaros xD

Saludos !!!
Dos tipos de comentarios: los objetivos y los personales:

- Casi la mitad del tiempo de CPU está siendo 'gastado' en esperar a los discos o la red. Mira que ninguna de estas dos cosas sea excesivamente lenta.

- Tu load average es altísimo, esto puede ser consecuencia de lo anterior.

- Ese proceso de apache es un pelín grande....

----

- Deshazte de sendmail y popper, en serio, de verdad, sin bromas. Quémalos o algo una vez los desinstales. Prueba a usar software más eficiente como postfix y dovecot. (popper es una puta mierda, hablando en plata).

- ¿Qué hace hald corriendo en esa máquina? Mira a ver qué más cosas te sobran...

Y no se me ocurre mucho más... tampoco tenemos muchos más detalles excepto eso que te he dicho antes.

- ferdy
Gracias por responder ^^

La verdad que no habia visto el hald corriendo... ha sido casualidad pillarlo ahi xD investigaré a ver que puedo hacer...

En cuanto a lo del waiting.. hombre... el sistema creo que es un raid1 ... es lento.. pero tanto? :S la red es bastante buena, de eso estoy seguro.

Y en cuanto a lo de deshacerme del sendmail y el popper lo se... pero es lo que habia montado cuando yo llegué y de momento quiero seguir con esto hasta configurar yo uno correctamente... son muchos clientes los que trabajan con este servidor de correo...

Pasto otra imagen del pop justo cuando se me bloquea el ssh y deja de refrescar durante un rato... a ver si veis algo.. porque en estos temas del top.. estoy muy verde aun >.<

Imagen

Saludos y gracias !

P.D: no intento que hagais mi faena eh? xD estoy configurando algo paralelo.. pero hasta no tenerlo me gustaria tener este estable... y tambien saber que es lo que me da tantos dolores de cabeza xDDD
milter-greylist es GIGANTE..... ¿qué diablos hace? ¿Cómo invoca sendmail a los milter? (por suerte, olvidé todo lo que en su día aprendí sobre sendmail)

En lugar de top, pega la salida de ps aux, es algo más informativa. (Y si puedes adjuntar la de pstree para ver 'quién es quién' ya todo completo :))

- ferdy
3 respuestas