Posts

Showing posts from November, 2014

Data Quality Critical | Data Quality Challengess | Data Quality Tools | Data Quality Initiative

Data Quality Mark Mosley (2008) mengatakan Data Quality adalah level data yang menyatakan data tersebut akurat, lengkap, terbaru, konsisten dan sesuai dengan semua kebutuhan bisnis. Data quality characters Accuracy Sejauh mana data dengan benar seperti yang di deskripsikan. Accessibility ·          D ata dapat dengan mudah diakses, dan dimengerti, serta dapat digunakan sesuai dengan keperluan. Completeness ·          Sejauh mana seluruh data yang dibutuhkan tersedia. Consistency ·          Konsistensi data berarti bahwa data di seluruh perusahaan harus sinkron dengan satu sama lain Integrity ·          Setiap data harus berhubungan atau dapat dihubungkan dengan data - data yang lain. Timeliness ·          Data harus merepresentasikan dengan waktu saat itu. Data quality challenges  Sumber data ·          Penuaan data, Kesalahan input, Penipuan, Sistem Konversi Validasi Data Duplikasi data Beberapa atribut yang tercampur dalam satu fi

ETL Data Warehouse !!!!!!!

ETL (Extraction Transformation Load) Proses ETL ( Extraction, Transformation, Loading ) merupakan proses yang harus dilalui dalam pembentukan data warehouse (Kimball, 2004). Berikut adalah penjelasan dari tiap proses. Extract Ekstraksi data adalah proses dimana data diambil atau diekstrak dari berbagai database sistem operasional yang ada, baik menggunakan query, atau aplikasi ETL. Metode Ekstrasi, yaitu : Umum - Statis - Terjadwal       * Berdasarkan Waktu       * Berdasarkan perbedaan - Seketika       * Mekanisme log transaksi       * Mekanisme basis data triger       * Sumber Aplikasi Logikal - Ekstrasi full Dimana pengambilan data dari database OLTP secara keseluruhan tidak di ambil beberapa point saja. - Ekstrasi incremental Dimana pengambilan data dari database OLTP berdasarkan point tertentu   Fisik   - Online Pengambilan data secara langsung ke dalam database yang di tuju atau sudah ter integrasi - Offline Pengambilan data dari sumber eksternal (h