Skript zur Anonymisierung von Postfix Logdateien

Peter Heitzer Peter.Heitzer at rz.uni-regensburg.de
Do Mär 3 15:41:03 CET 2016


>>> On 03/03/2016 at 13:08, Patrick Ben Koetter <p at sys4.de> wrote: 
> * Peter Heitzer <Peter.Heitzer at rz.uni-regensburg.de>:
>> Gibt es ein fertiges Skript, um Postfix Logdateien (/var/log/mail) so zu
>> anonymisieren, daß so eine Datei bedenkenlos für Auswertungszwecke
>> weitergegeben werden kann?
>> Es müssen alle Mailadressen, IP-Adressen und Hostnamen so umgesetzt werden,

> daß
>> keinerlei Rückschlüsse auf die Originaldaten mehr
>> möglich sind. Ein Hash ist IMO nicht ausreichend, da es möglich ist, bei
>> bekannter Hashfunktion für lokale Mailadressen die Hashes zu
>> berechnen und dann mit den anonymisierten Daten zu vergleichen. Lokale
>> Mailadressen sind vom Campus aus via LDAP abrufbar.
>> 
>> Meine Idee wäre, für eine Logdatei z.B. alle Local Parts (links vom @) und
>> alle Domain Parts (rechts vom @) in Arrays einzulesen und
>> dann nur den Index zu verwenden, also localpart12345 at domainpart54321.
>> 
>> Vielleicht hat schon jemand so etwas fertig, ansonsten muss ich mir selber

> was
>> schreiben.
> 
> Tadaaaa! https://github.com/sys4/loganon
Ist für den Zweck leider nicht geeignet, da es jede Logdatei für sich
anonymisiert. Für den
Empfänger der anonymisierten Daten ist eine zeitliche Konstanz notwendig,
d.h.
vornamex.nachnamey at domain muss dauerhaft auf z.B. mailadresse4711 umgesetzt
werden.
Ich werde mir selber was schreiben, was jede neue Mailadresse in eine
Datenbankzeile einträgt
und mit einer laufenden Nummer versieht. Damit hat jede Adresse eine
eindeutige ID und kann
ohne Zugriff auf die Datenbank auch nicht rückgewandelt werden.

 


Mehr Informationen über die Mailingliste postfix-users