Posts

Data Transformation Service (2)

PERBEDAAN DTS DAN SSIS DTS : DTS adalah sekumpulan dari obyek yang digunakan sebagai alat ETS Tools untuk mengekstrak , mentransform dan memuat informasi dari sebuah database DTS adalah bagian dari Microsoft SQL Server 2000 Menggunakan Activex Script Tidak ada cara cepat Transformasi yang tersedia terbatas Tidak didukung fungsi Business Intelegent Hanya bisa dikembangkan di server local SSIS : SSIS adalah sebuah alat yang disediakan Microsoft untuk mengekstrak data dari sumber lain SSIS adalah komponen dari Microsoft SQL Server 2005 Menggunakan Scripting Language Ada cara cepat Tersedianya fitur tranformasi yang sangat besar Didukung oleh fungsi Business Intellegent Dapat dikembangkan di berbagai server menggunakan BIDS

Data Transformation Service (1)

DTS adalah memindahkan data dari database OLTP ke data warehouse dengan tujuannya. Hal ini dilakukan ketika validasi, cleaning up, konsolidasi, dan mengubah data yang diperlukan. (Vieria, Robert, 2000, p91) Selain berfungsi untuk melakukan import, export dan transport data yang beragam antara satu atau lebih sumber data, seperti misalnya SQL Server, Microsoft Excel atau Microsoft Access, DTS juga menyediakan hubungan berupa ODBC (Open Database Connectivity) data source yang disupport oleh OLE DB Provider for ODBC dan service seperti logging package execution details, controlling transactions dan penanganan variable global. Tool-tool yang tersedia untuk menciptakan dan mengeksekusi DTS packages Import Export Wizzard Import/Export Wizard untuk membangun DTS packages sederhana dan mensupport perpindahan data dan transformasi sederhana. Import Export Wizzard DTS Designer DTS Designer mengimplementasikan DTS object model graphically yang memungkinkan user untuk menciptaka

Data Quality Critical | Data Quality Challengess | Data Quality Tools | Data Quality Initiative

Data Quality Mark Mosley (2008) mengatakan Data Quality adalah level data yang menyatakan data tersebut akurat, lengkap, terbaru, konsisten dan sesuai dengan semua kebutuhan bisnis. Data quality characters Accuracy Sejauh mana data dengan benar seperti yang di deskripsikan. Accessibility ·          D ata dapat dengan mudah diakses, dan dimengerti, serta dapat digunakan sesuai dengan keperluan. Completeness ·          Sejauh mana seluruh data yang dibutuhkan tersedia. Consistency ·          Konsistensi data berarti bahwa data di seluruh perusahaan harus sinkron dengan satu sama lain Integrity ·          Setiap data harus berhubungan atau dapat dihubungkan dengan data - data yang lain. Timeliness ·          Data harus merepresentasikan dengan waktu saat itu. Data quality challenges  Sumber data ·          Penuaan data, Kesalahan input, Penipuan, Sistem Konversi Validasi Data Duplikasi data Beberapa atribut yang tercampur dalam satu fi

ETL Data Warehouse !!!!!!!

ETL (Extraction Transformation Load) Proses ETL ( Extraction, Transformation, Loading ) merupakan proses yang harus dilalui dalam pembentukan data warehouse (Kimball, 2004). Berikut adalah penjelasan dari tiap proses. Extract Ekstraksi data adalah proses dimana data diambil atau diekstrak dari berbagai database sistem operasional yang ada, baik menggunakan query, atau aplikasi ETL. Metode Ekstrasi, yaitu : Umum - Statis - Terjadwal       * Berdasarkan Waktu       * Berdasarkan perbedaan - Seketika       * Mekanisme log transaksi       * Mekanisme basis data triger       * Sumber Aplikasi Logikal - Ekstrasi full Dimana pengambilan data dari database OLTP secara keseluruhan tidak di ambil beberapa point saja. - Ekstrasi incremental Dimana pengambilan data dari database OLTP berdasarkan point tertentu   Fisik   - Online Pengambilan data secara langsung ke dalam database yang di tuju atau sudah ter integrasi - Offline Pengambilan data dari sumber eksternal (h

Star Schema | Snow Flake Schema | Star Flake Schema

Image
Dimensional Modelling adalah desain logic yang mempresentasikan dalam brntuk standart dan mudah di pahami sehingga mendukung untuk akses terhadap data sangat cepat.   Tabel Fakta adalah tabel utama dalam konsep   pemodelan dimensional dimana hasil perhitungan bisnis disimpan.   Tabel Dimensi berisi penjelasan deskriptif dari sebuah bisnis dan memiliki banyak kolom atau atribut. Star Schema Adalah Struktuk logikal yang memiliki tabel fakta yang terdiri atas data faktual ditengahnya, dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data. Karakteristik Pusat dari star disebut fact table Fact table mempunyai sebuah nilai aggregate dari data-data yang berasal dari tabel dimensi Setiap tabel dimensi berelasi langsung dengan fact table Tabel dimensi beisikan data tentang informasi atau waktu Relasi antara fact table dengan dimensi-dimensinya adalah 1 – N (one to many) Primary key pada tabel dimensi aka