Curățarea datelor ( ing. Curățarea datelor ) este procesul de identificare și corectare a erorilor, inconsecvențelor de date în scopul îmbunătățirii calității acestora, uneori clasificate ca parte integrantă a minării de date .
Curățarea datelor se realizează pe seturi specifice de date din baze de date sau fișiere. Nevoia de curățare a datelor apare cel mai adesea atunci când se integrează diverse sisteme informaționale ( depozite de date , sisteme de management al resurselor întreprinderii, sisteme de management al relațiilor cu clienții ).
Sursele de date din sisteme diferite sunt adesea împrăștiate și în stări diferite. Transformările sunt efectuate automat (după un set de reguli) sau manual (interactiv).
Cele mai tipice domenii care trebuie curățate și corectate în sistemele de informații corporative sunt informațiile despre persoane și organizații, adresa și informațiile de contact, iar orice informații de referință introduse manual sub formă de text sunt, de asemenea, supuse curățării.