Data Quality Critical | Data Quality Challengess | Data Quality Tools | Data Quality Initiative

Data Quality

Mark Mosley (2008) mengatakan Data Quality adalah level data yang menyatakan data tersebut akurat, lengkap, terbaru, konsisten dan sesuai dengan semua kebutuhan bisnis.

Data quality characters
  • Accuracy
Sejauh mana data dengan benar seperti yang di deskripsikan.
  • Accessibility
·         Data dapat dengan mudah diakses, dan dimengerti, serta dapat digunakan sesuai dengan keperluan.
  • Completeness
·         Sejauh mana seluruh data yang dibutuhkan tersedia.
  • Consistency
·         Konsistensi data berarti bahwa data di seluruh perusahaan harus sinkron dengan satu sama lain
  • Integrity
·         Setiap data harus berhubungan atau dapat dihubungkan dengan data - data yang lain.
  • Timeliness
·         Data harus merepresentasikan dengan waktu saat itu.


Data quality challenges
  •  Sumber data
·         Penuaan data, Kesalahan input, Penipuan, Sistem Konversi
  • Validasi Data
Duplikasi data
Beberapa atribut yang tercampur dalam satu field
Ejaan yang berbeda untuk nama yang sama
Tidak adanya atribut kunci
  •  Biaya besar untuk menjaga kualitas data

Data Quality Tools
  • Data auditing
Data Auditing meningkatkan akurasi dan kebenaran data pada sumbernya. Tools ini pada umumnya membandingkan data di database sumber dengan aturan bisnis yang ada.
  • Data Cleansing
Data Cleansing digunakan dalam staging area. Data Cleansing berguna untuk melakukan standarisasi, dan verifikasi data terhadap data yang tidak dikenali. Beberapa fitur yang terdapat dalam Data Cleansing adalah :
1. Data Parsing : Memecah nilai dalam bentuk yang kecil untuk digunakan pada tahap selanjutnya.
2. Data Standarization : Mengubah elemen – elemen data kedalam bentuk standar.
3. Data Correction and verification : Melakukan pengecekan data terhadap data yang tidak dikenali, terutama pada lokasi atau alamat.
4. Data Transformation : Menjamin konsistensi pemetaan data dari sistem sumber dengan data warehouse.
5. Householding : Menggabungkan individual data yang memiliki kesamaan alamat
  • Data Migration
Data Migration digunakan untuk mengekstrak data dari sumber untuk dikirim ke staging area dan dari staging area ke data warehouse.

Data Quality Initiative
Untuk menjalankan program ini, terdapat beberapa langkah yang harus dilakukan 
  • Data Stewardship Program : Bertujuan untuk memberikan konsultasi dan bantuan mengenai penanganan data yang berkualitas
  •  Mengatur tujuan dan harapan dari program Data Quality
  •  Melihat dan mengawasi program Data Quality