[Postfix-es] caida de postfix
Ender
eduvedder en terra.es
Mie Feb 9 10:47:39 CET 2005
Muy Buenas,
Tengo un servidor en producción haciendo de MX (frontal de entrada de correos
desde internet) para 3 dominios que reciben bastante mierda la verdad
(hacemos reject de unos 15000 correos al dia :-) ).
El MTA en cuestión es un Postfix + TLS + amavisd con spamassasin y clamav. El
postfix tiene tambien un slapd con las cuentas de usuario para consultarlas y
no permitir el relay a los "non local recipients".
El caso es que lleva poco tiempo en producción y hoy a las 00:50 ha caido el
smtp con unos cuantos errores en el log. Lo que quería era algún tipo de
comentario y consejo sobre por qué puede haber sido. Si creeis que es
recursos de la máquina, si se puede reconfigurar de forma que al caer levante
sóla bien y tal...
La máquina es una HP: PIII a 800Mhz, 384MB Ram y bastante disco duro (IDE). Ya
lo sé... cutre cutre... 0:-)
Normalmente el amavisd utiliza el 20% de la ram, pero hay picos (que duran
varias horas) donde tiene pillado el 97 - 98% de la memoria.
Os comento todo esto por si creeis que lo que necesito es más memoria y listo,
o si por el contrario, aunque le ponga 1 GB de RAM, el amavis se la va a
chupar toda y va a caer igual....
Tengo datos de rendimiento de toda la noche de la máquina (Nagios powered!).
Antes de la caida la CPU estaba muy petada y la memoria RAM y SWAP al 100% y
99% respectivamente.
¿os ha pasado algo parecido o siempre teneis maquinones en produccion?
El problema tiene pinta de ser más del amavis, siento si alguno considera esto
un poco offtopic.
Os pasteo las líneas interesantes del log...
LOS FATAL!!
Feb 9 00:48:27 localhost postfix/qmgr[12193]: FATAL: scan_dir_push: open
directory incoming/2: Cannot allocate memory
Feb 9 00:48:27 localhost master[16231]: FATAL: master_spawn:
exec /usr/lib/postfix/smtp: Cannot allocate memory
Feb 9 00:50:16 localhost postfix/smtpd[16222]: FATAL: connect #11 to
subsystem private/rewrite: Connection refused
Un poquito antes pasaron estos WARNING: (El "BAD COMMAND STARTUP" a que se
puede deber?)
Feb 9 00:47:35 localhost postfix/master[12189]: warning:
process /usr/lib/postfix/smtpd pid 16229 killed by signal 9
Feb 9 00:47:36 localhost postfix/master[12189]:
warning: /usr/lib/postfix/smtpd: bad command startup -- throttling
Feb 9 00:47:41 localhost postfix/smtpd[16222]: warning: dict_ldap_connect:
Unable to bind to server ldap://127.0.0.1:389 as cn=...
Feb 9 00:48:27 localhost postfix/smtpd[16228]: warning: premature
end-of-input on public/cleanup socket while reading input attribute name
Feb 9 00:48:29 localhost postfix/smtpd[16228]: warning: problem talking to
service rewrite: Connection reset by peer
Feb 9 00:52:14 localhost postfix/smtp[16087]: warning: B5FB743AB2: flush
service failure
Feb 9 00:52:37 localhost postfix/smtp[16220]: warning: E575C43AB3: defer
service failure
Y ya no hay más líneas de log hasta que lo he levantado esta mañana, jeje
Saludos y a ver si alguien me comenta algo, muchas gracias por leer hasta aquí
Ender.
PD - versiones:
postfix 2.1.5-5
clamav 0.81-2
spamassassin 3.0.2-1
amavisd-new 20030616p10-5
Más información sobre la lista de distribución Postfix-es