[Postfix-es] caida de postfix

Ender eduvedder en terra.es
Mie Feb 9 10:47:39 CET 2005


Muy Buenas,

Tengo un servidor en producción haciendo de MX (frontal de entrada de correos 
desde internet) para 3 dominios que reciben bastante mierda la verdad 
(hacemos reject de unos 15000 correos al dia :-) ).

El MTA en cuestión es un Postfix + TLS + amavisd con spamassasin y clamav. El 
postfix tiene tambien un slapd con las cuentas de usuario para consultarlas y 
no permitir el relay a los "non local recipients".

El caso es que lleva poco tiempo en producción y hoy a las 00:50 ha caido el 
smtp con unos cuantos errores en el log. Lo que quería era algún tipo de 
comentario y consejo sobre por qué puede haber sido. Si creeis que es 
recursos de la máquina, si se puede reconfigurar de forma que al caer levante 
sóla bien y tal...

La máquina es una HP: PIII a 800Mhz, 384MB Ram y bastante disco duro (IDE). Ya 
lo sé... cutre cutre... 0:-)
Normalmente el amavisd utiliza el 20% de la ram, pero hay picos (que duran 
varias horas) donde tiene pillado el 97 - 98% de la memoria.

Os comento todo esto por si creeis que lo que necesito es más memoria y listo, 
o si por el contrario, aunque le ponga 1 GB de RAM, el amavis se la va a 
chupar toda y va a caer igual....

Tengo datos de rendimiento de toda la noche de la máquina (Nagios powered!). 
Antes de la caida la CPU estaba muy petada y la memoria RAM y SWAP al 100% y 
99% respectivamente.

¿os ha pasado algo parecido o siempre teneis maquinones en produccion?
El problema tiene pinta de ser más del amavis, siento si alguno considera esto 
un poco offtopic.

Os pasteo las líneas interesantes del log...

LOS FATAL!!
Feb  9 00:48:27 localhost postfix/qmgr[12193]: FATAL: scan_dir_push: open 
directory incoming/2: Cannot allocate memory
Feb  9 00:48:27 localhost master[16231]: FATAL: master_spawn: 
exec /usr/lib/postfix/smtp: Cannot allocate memory

Feb  9 00:50:16 localhost postfix/smtpd[16222]: FATAL: connect #11 to 
subsystem private/rewrite: Connection refused


Un poquito antes pasaron estos WARNING: (El "BAD COMMAND STARTUP" a que se 
puede deber?)

Feb  9 00:47:35 localhost postfix/master[12189]: warning: 
process /usr/lib/postfix/smtpd pid 16229 killed by signal 9

Feb  9 00:47:36 localhost postfix/master[12189]: 
warning: /usr/lib/postfix/smtpd: bad command startup -- throttling

Feb  9 00:47:41 localhost postfix/smtpd[16222]: warning: dict_ldap_connect: 
Unable to bind to server ldap://127.0.0.1:389 as cn=...

Feb  9 00:48:27 localhost postfix/smtpd[16228]: warning: premature 
end-of-input on public/cleanup socket while reading input attribute name

Feb  9 00:48:29 localhost postfix/smtpd[16228]: warning: problem talking to 
service rewrite: Connection reset by peer

Feb  9 00:52:14 localhost postfix/smtp[16087]: warning: B5FB743AB2: flush 
service failure

Feb  9 00:52:37 localhost postfix/smtp[16220]: warning: E575C43AB3: defer 
service failure

Y ya no hay más líneas de log hasta que lo he levantado esta mañana, jeje

Saludos y a ver si alguien me comenta algo, muchas gracias por leer hasta aquí
    Ender.

PD - versiones:
postfix 2.1.5-5
clamav 0.81-2
spamassassin 3.0.2-1
amavisd-new 20030616p10-5


Más información sobre la lista de distribución Postfix-es