Posts

Showing posts from 2014

Data Transformation Service (2)

PERBEDAAN DTS DAN SSIS DTS : DTS adalah sekumpulan dari obyek yang digunakan sebagai alat ETS Tools untuk mengekstrak , mentransform dan memuat informasi dari sebuah database DTS adalah bagian dari Microsoft SQL Server 2000 Menggunakan Activex Script Tidak ada cara cepat Transformasi yang tersedia terbatas Tidak didukung fungsi Business Intelegent Hanya bisa dikembangkan di server local SSIS : SSIS adalah sebuah alat yang disediakan Microsoft untuk mengekstrak data dari sumber lain SSIS adalah komponen dari Microsoft SQL Server 2005 Menggunakan Scripting Language Ada cara cepat Tersedianya fitur tranformasi yang sangat besar Didukung oleh fungsi Business Intellegent Dapat dikembangkan di berbagai server menggunakan BIDS

Data Transformation Service (1)

DTS adalah memindahkan data dari database OLTP ke data warehouse dengan tujuannya. Hal ini dilakukan ketika validasi, cleaning up, konsolidasi, dan mengubah data yang diperlukan. (Vieria, Robert, 2000, p91) Selain berfungsi untuk melakukan import, export dan transport data yang beragam antara satu atau lebih sumber data, seperti misalnya SQL Server, Microsoft Excel atau Microsoft Access, DTS juga menyediakan hubungan berupa ODBC (Open Database Connectivity) data source yang disupport oleh OLE DB Provider for ODBC dan service seperti logging package execution details, controlling transactions dan penanganan variable global. Tool-tool yang tersedia untuk menciptakan dan mengeksekusi DTS packages Import Export Wizzard Import/Export Wizard untuk membangun DTS packages sederhana dan mensupport perpindahan data dan transformasi sederhana. Import Export Wizzard DTS Designer DTS Designer mengimplementasikan DTS object model graphically yang memungkinkan user untuk menciptaka

Data Quality Critical | Data Quality Challengess | Data Quality Tools | Data Quality Initiative

Data Quality Mark Mosley (2008) mengatakan Data Quality adalah level data yang menyatakan data tersebut akurat, lengkap, terbaru, konsisten dan sesuai dengan semua kebutuhan bisnis. Data quality characters Accuracy Sejauh mana data dengan benar seperti yang di deskripsikan. Accessibility ·          D ata dapat dengan mudah diakses, dan dimengerti, serta dapat digunakan sesuai dengan keperluan. Completeness ·          Sejauh mana seluruh data yang dibutuhkan tersedia. Consistency ·          Konsistensi data berarti bahwa data di seluruh perusahaan harus sinkron dengan satu sama lain Integrity ·          Setiap data harus berhubungan atau dapat dihubungkan dengan data - data yang lain. Timeliness ·          Data harus merepresentasikan dengan waktu saat itu. Data quality challenges  Sumber data ·          Penuaan data, Kesalahan input, Penipuan, Sistem Konversi Validasi Data Duplikasi data Beberapa atribut yang tercampur dalam satu fi

ETL Data Warehouse !!!!!!!

ETL (Extraction Transformation Load) Proses ETL ( Extraction, Transformation, Loading ) merupakan proses yang harus dilalui dalam pembentukan data warehouse (Kimball, 2004). Berikut adalah penjelasan dari tiap proses. Extract Ekstraksi data adalah proses dimana data diambil atau diekstrak dari berbagai database sistem operasional yang ada, baik menggunakan query, atau aplikasi ETL. Metode Ekstrasi, yaitu : Umum - Statis - Terjadwal       * Berdasarkan Waktu       * Berdasarkan perbedaan - Seketika       * Mekanisme log transaksi       * Mekanisme basis data triger       * Sumber Aplikasi Logikal - Ekstrasi full Dimana pengambilan data dari database OLTP secara keseluruhan tidak di ambil beberapa point saja. - Ekstrasi incremental Dimana pengambilan data dari database OLTP berdasarkan point tertentu   Fisik   - Online Pengambilan data secara langsung ke dalam database yang di tuju atau sudah ter integrasi - Offline Pengambilan data dari sumber eksternal (h

Star Schema | Snow Flake Schema | Star Flake Schema

Image
Dimensional Modelling adalah desain logic yang mempresentasikan dalam brntuk standart dan mudah di pahami sehingga mendukung untuk akses terhadap data sangat cepat.   Tabel Fakta adalah tabel utama dalam konsep   pemodelan dimensional dimana hasil perhitungan bisnis disimpan.   Tabel Dimensi berisi penjelasan deskriptif dari sebuah bisnis dan memiliki banyak kolom atau atribut. Star Schema Adalah Struktuk logikal yang memiliki tabel fakta yang terdiri atas data faktual ditengahnya, dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data. Karakteristik Pusat dari star disebut fact table Fact table mempunyai sebuah nilai aggregate dari data-data yang berasal dari tabel dimensi Setiap tabel dimensi berelasi langsung dengan fact table Tabel dimensi beisikan data tentang informasi atau waktu Relasi antara fact table dengan dimensi-dimensinya adalah 1 – N (one to many) Primary key pada tabel dimensi aka

Contoh perubahan dari tabel database biasa di rubah menjadi star schema

Image
Contoh Tabel User HR dari Database Oracle : Setelah dilakukan pemisahan dan penyendirian dari tabel user HR yang ada dalam Database Oracle, maka jika di ubah menjadi model Star Schema akan menjadi seperti ini, dimana primary key dari tabel fact masuk ke dalam semua tabel dimension :  

Kebutuhan dan perancangan pembuatan Data Warehouse pada perusahaan Teh Tong Tji (Arsitektur DW)

Image
Gambar di atas merupakan arsitektur data warehouse perusahaan teh tong tji dari paper yang saya jadikan referensi. Melihat dari gambar arsitektur data warehouse di atas arsitektur tersebut menggunakan staging area di mana terlihat dari data sources tidak di gambarkan dengan garis yang secara langsung mengarah kepada data warehouse data. di lihat dari arsitekturnya data source ke data warehouse melalui transformasi proses atau dengan kata awamnya convert. Mengapa menggunakan staging area di dalam pengiriman data operasional ke data warehouse data itu perlu di bersihkan dan di proses / di olah sehingga data tersebut dapat dengan mudah di load oleh user. sumber staging area : http://kelolahilmu.blogspot.com/2013/09/arsitektur-dan-infrastruktur-data.html