Data warehouse atau disebut dengan gudang data adalah database yang digunakan untuk pelaporan dan analisa data. Data warehouse merupakan repositori pusat data yang dibuat dengan mengintegrasikan data, dari satu atau lebih dari sumber yang berbeda. saat ini data warehouse digunakan untuk menyimpan sata historis dan untuk membuat laporan terupdate sebagai laporan manajemen seperti perbandingan tahunan.
Definisi dari data warehouse berfokus pada penyimpanan data. Sumber utama data dibersihkan, diubah, katalog dan dibuat tersedia untuk digunakan oleh para manajer dan profesional bisnis lainnya untuk penambangan data, pengolahan analisis online, riset pasar dan mendukung keputusan (Marakas & O'Brien 2009).
Data warehouse dapat dibagi lagi menjadi data mart untuk meningkatkan inerja dan kemudahan penggunaan di area tertentu. Dimana data mart merupakan gudang data kecil yang difokuskan pada wilayah tertentu yang menarik. atau dengan cara lain, pada sebuah oraganisasi dapat membuat sebuah satu atau lebih data mart sebagai langkah pertama menuju sebuah gudang data perusahaan yang lebih besar dan lebih kompleks.
Karakteristik data warehouse menurut Inmon, yaitu :
a. Subject Oriented (Berorientasi subject)
Data ware house berorientasi subject artinya data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu. Data warehouse diorganisasikan disekitar subject-subject utama dari perusahaan(customer, product, dan sales). Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data. Jadi dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap proses. Secara garis besar perbedaan antara data operasional dan data warehouse dapa di lihat pada tabel berikut ini.
Data Operasiaonal dan Data Warehouse
| Data Operasional | Data Warehouse |
| Dirancang berorientasi hanya pasa aplikasi dan fungsi tertentu | Dirancang berdasarkan pada subjek-subjek tertentu(utama) |
| Fokusnya pada desain database dan proses | fokusnya pada pemodelan data dan desain data |
| Berisi rincian atau detail data | Berisi data-data history yang akan dipakai dalam proses analisis |
| Relasi antar table berdasarkan aturan terkini (selalu mengikuti aturan terbaru) | Banyak aturan bisnis dapat tersaji antara tabel-tabel |
b. Integrated (Terintegrasi)
Data warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegritasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang enunjang keseluruan konsep data warehouse sendiri. Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara seperti konsistensi dalam penanaman variabel, konsisten dalam ukuran variabel, konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data.
c. Time-variant (REntang waktu)
Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse, kita dapat menggunakan cara antara lain :
- Pertama menyajikan data warehouse pada rentan waktu tertentu, misalkan antara 5 sampai 10 tahun kedepan.
- Kedua dengan menggunakan variasi/perbedaan waktu yang disajikan dalam data warehouse baik implicit secara explicit dengan unsur waktu dalam hari, minggu, bulan, dsb. Secara implicit misalkan pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.
- Cara yang ketiga, variasi waktu yang disajikan data warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan tempilan dari sebagian data tertentu sesuaikeinginan pemakai dari keseluaruhan data yang ada bersifat read-only.
Maksut dari non-volatile adalah data pada data warehouse tidak di update secara real time tetapi direfresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan, Database tersebut secara kontinyu(berkesinambungan) menyerap data baru ini, kemudian secara incremental(berkembang secara teratur) disatukan dengan data sebelumnya. Berbeda dengan database operasional yang dapat melakukan maintenance terhadap data yang mengubah isi dari database sedangkan pada data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses fata warehouse seperti melakukan query atau menampilkan laporan yang dibutuhkan, tidak ada kegiatan uploading data).
Arsitektur Data Warehouse
Arsitektur yang dimaksut adalah bagaimana data warehouse dibangun, arsitektur tidak ada yang benar dan salah tetapi suatu arsitektur dibangun tergantung situasi dan kondisi. arsitektur data warehouse akan berpengaruh pada penggunaan dan pemeliharaan.
Lapisan-lapisan arsitektur data warehouse :1. Operasional database layer / lapisan basis data operasional
- Sumber data(source) untuk data warehose
- Data lengkap, data hari ke hari
- Mempunyai nilai saat ini (data berarti)
- Tingkat kemungkinan sata besar.
- Tools untuk mengekstrak, mengubah dan mengambil(load) data.
- Meliputi karakteristik data warehouse.
- File data tersimpan / Direktori
- Lebih detil dari direktori data sistem, maksudnya lebih mendalam dan file data yang tersedia sebelumnya.
- Ada Petunjuk untuk keseluruhan warehouse dan ada petunjuk data yang dapat diaksesreport khss ntk di analisis.
- Akses data dan juga untuk laporan dan analisis.
- Tools Business Intelligence masuk ke tahap ini.
Keuntungan Data Warehouse
- Data warehouse menyediakan model data yang bervariasi dan tidak tergantung pada satu sumber data saja. Hail ini memudahkan pimpinan perusahaan/manager membuat laporan dan menganalisa.
- Saat membuka data yang ada dalam data warehouse, data yang tidak konsisten akan diketahui dan secepatnya dirubah. Mendukung proses pembuatan laporan, agar keputusan yang diambil adalah keputusan yang benar sesuai data.
- Keamanan informasi didalam data warehouse terjamin, karena data warehouse terpisah dengan database operasional.
- Data warehouse menyediakan berbagai macam bentuk laporan yang terbaru.
- Data warehouse tidak cocok untuk data yang tidak terstruktur.
- Data perlu di extract, diubah, dan di load ke data warehouse, sehingga membutuhkan waktu (delay) kerja untuk data warehouse yang belum terbentuk.
- Semakin lama masa hidup bisnis yang menggunakan data warehouse, maka semakin banyak biaya yang dikeluarkan oleh perusahaan untuk memodifikasi teknilogi data warehouse tidak berkualitas, sehinggga laporan tidak optimal.
sumber :
http://blog.ub.ac.id/benzeven/2010/11/02/dataware-house/
http://en.wikipedia.org/wiki/Data_warehouse
http://informatika.web.id/category/data-warehouse

Tidak ada komentar:
Posting Komentar