Data Warehouse

Diposting pada

Selamat datang di Pakdosen.co.id, web digital berbagi ilmu pengetahuan. Kali ini PakDosen akan membahas tentang Data Warehouse? Mungkin anda pernah mendengar kata Data Warehouse? Disini PakDosen membahas secara rinci tentang pengertian, menurut para ahli, karakteristik, istilah, proses, keuntungan, contoh . Simak Penjelasan berikut secara seksama, jangan sampai ketinggalan. 

Data-Warehouse

Pengertian Data Warehouse

Data Warehouse (Bahasa Inggris: Data Warehouse) adalah sistem komputer untuk pengarsipan dan analisis data historis perusahaan seperti data penjualan, gaji dan informasi lainnya dari operasi sehari-hari. Secara umum, organisasi menyalin informasi dari sistem operasi seperti penjualan dan sumber daya manusia ke gudang data pada jadwal reguler, misalnya, setiap malam atau setiap akhir pekan.

Manajemen kemudian dapat melakukan kueri dan analisis yang kompleks (mis. Penambangan data, penambangan data) dari informasi ini tanpa melelahkan sistem operasi.


Pengertian Data Warehouse Menurut Para Ahli

Pemahaman tentang data warehouse dapat bervariasi, tetapi memiliki inti yang sama, beberapa pengertian dari para ahli berikut:


1. Menurut W.H. Inmon dan Richard DH

Data Warehouse adalah pengumpulan data yang memiliki jenis pengumpulan data yang berorientasi pada topik, terintegrasi, variasi waktu, dan tetap untuk mendukung proses pengambilan keputusan manajemen.


2. Menurut Vidette Poe

Data Warehouse adalah database hanya baca yang berfungsi sebagai dasar untuk sistem pendukung keputusan.


3. Menurut Paul Lane

Data Warehouse adalah database relasional yang lebih digunakan untuk meminta dan menganalisis proses transaksi dan biasanya berisi data transaksi historis dan mungkin data dari sumber lain. Gudang data memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan perusahaan untuk menggabungkan / menggabungkan data dari berbagai sumber.


4. Menurut Ramelho

Gudang Data adalah pendekatan penyimpanan data yang memigrasikan sumber data yang heterogen (yang biasanya tersebar di beberapa basis data OLTP) ke penyimpanan data yang terpisah dan homogen.


5. Menurut Usama Fayyad (1996)

Pengguna menerapkan keahlian mereka dan komputer melakukan analisis data yang canggih untuk memilih data yang tepat dan memasukkannya ke dalam format yang sesuai untuk pengambilan keputusan.

Oleh karena itu Gudang Data adalah metode perancangan basis data yang mendukung DSS (Sistem Pendukung KEPUTUSAN) dan EIS (Sistem Informasi Eksekutif). Secara fisik, data warehouse adalah database, tetapi desain data warehouse dan database sangat berbeda. Dalam desain database tradisional menggunakan normalisasi, menormalkan data warehouse bukan cara terbaik.

Baca Lainnya :  Pengertian Literasi Keuangan

Gudang data memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan perusahaan untuk menggabungkan / menggabungkan data dari berbagai sumber. Dengan demikian, data warehouse adalah metode dalam perancangan basis data yang berkaitan dengan DSS (Decission Support System) dan EIS (Executive Information System).

Secara fisik, data warehouse adalah database, tetapi desain data warehouse dan database sangat berbeda. Dalam desain database tradisional menggunakan normalisasi, menormalkan data warehouse bukan cara terbaik.


Karakteristik Data Warehouse

Sistem database ini memiliki fitur yang membedakannya dari database lain. Ada empat karakteristik yang menjadi ciri basis data ini, yaitu:


  • Berorientasi pada subjek (berorientasi pada subjek)

Ini berarti bahwa gudang data bertema dirancang untuk menganalisis data berdasarkan masalah spesifik dalam organisasi dan bukan pada proses atau fungsi aplikasi tertentu. Gudang data diatur sesuai dengan topik utama perusahaan seperti (pelanggan, produk dan penjualan) dan tidak diatur dalam area aplikasi utama (penagihan pelanggan, pengendalian inventaris, dan penjualan produk).

Ini karena gudang data harus menyimpan data yang mendukung keputusan, bukan aplikasi yang digerakkan oleh data. Dengan kata lain, data yang disimpan tidak terkait dengan topik proses.


  • Kepemilikan data terintegrasi (data terintegrasi)

Gudang Data dapat menyimpan data dari berbagai sumber dalam format yang konsisten dan terintegrasi. Oleh karena itu, data tidak dapat rusak karena data adalah entitas yang mendukung konsep keseluruhan dari gudang data itu sendiri.

Persyaratan integrasi sumber data dapat dipenuhi dalam sejumlah cara yang konsisten dalam penamaan variabel, ukuran variabel, pengodean, dan struktur yang konsisten dalam atribut fisik data.

Contoh Lingkungan Operasi Ada banyak aplikasi yang dapat dijalankan oleh pengembang yang berbeda. Karena itu, mungkin ada variabel dalam aplikasi ini yang memiliki tujuan yang sama, tetapi berbeda nama dan format.

Variabel ini harus dikonversi ke nama yang sama dan format yang disepakati. Jadi tidak ada kebingungan karena perbedaan nama, format dan sebagainya. Data kemudian dapat dikategorikan sebagai data terintegrasi berdasarkan konsistensinya.


  • Dibuat dalam jangka waktu tertentu

Semua data dalam gudang data dapat disebut akurat atau valid dalam periode waktu tertentu. Untuk menampilkan interval waktu yang digunakan untuk mengukur keakuratan data warehouse, kita dapat menggunakan metode berikut:

  1. Cara termudah untuk menghadirkan data warehouse dalam periode waktu tertentu, misalnya antara 5 hingga 10 tahun mendatang.
  2. Cara kedua, menggunakan variasi dalam perbedaan waktu / diwakili dalam data warehouse, baik implisit atau eksplisit, eksplisit dengan elemen waktu dalam satu hari, minggu, bulan, dll. Tersirat, misalnya, jika data berada di akhir setiap bulan atau digandakan setiap triwulan. Elemen waktu tetap ada dalam data.
  3. Cara ketiga, variasi waktu dari data warehouse, diwakili oleh serangkaian foto lama. Snapshot adalah tampilan data yang paling spesifik yang memenuhi kebutuhan pengguna. Semua data yang ada hanya baca-saja.

  • Data yang disimpan bersifat permanen (non-volatile).

Fitur keempat dari gudang data tidak stabil. Ini berarti bahwa data dalam gudang data tidak diperbarui secara waktu nyata, tetapi diperbarui secara teratur dalam sistem operasi. Data baru yang ditambahkan ke basis data itu sendiri bukanlah suatu perubahan.

Baca Lainnya :  √Grafik adalah

Basis data ini terus menyerap data baru dan kemudian langkah demi langkah bersama dengan data sebelumnya. Tidak seperti database operasional yang dapat memperbarui, menyisipkan, dan menghapus data yang mengubah isi database gudang data, hanya ada dua peristiwa untuk mengedit data yang berisi data (mengambil data) dan akses data (akses ke gudang data seperti Kueri atau Tampilan ) laporan diperlukan, tidak ada aktivitas penyegaran data).

Gudang Data adalah pendekatan penyimpanan data yang memigrasikan sumber data yang heterogen (yang biasanya tersebar di beberapa basis data OLTP) ke penyimpanan data yang terpisah dan homogen. Keuntungan dicapai dengan menggunakan data warehouse berikut (Ramelho).

Sementara kombinasi data mining dan verifikasi penemuan mewakili pengembangan data mining masa depan yang menggabungkan hipotesis dan pendekatan penemuan.

Pengembangan ini didasarkan pada alasan yang sama di mana konsep sistem pendukung keputusan (DSS) didasarkan. Dengan konsep ini, pengguna dan komputer dapat bekerja sama untuk menyelesaikan masalah.

Pengguna menerapkan keahlian mereka dan komputer melakukan analisis data yang canggih untuk memilih data yang tepat dan memasukkannya ke dalam format yang sesuai untuk pengambilan keputusan. Setelah Usama Fayyad (1996).


Istilah yang Berhubungan dengan Data Warehouse

Istilah terkait gudang data:


  • Data Mart

Merupakan bagian dari gudang data yang mendukung pembuatan laporan dan analisis data untuk unit, bagian atau operasi perusahaan.


  • Online Analytical Processing (OLAP)

Ini adalah pemrosesan basis data yang menggunakan tabel fakta dan dimensi untuk menampilkan berbagai bentuk laporan, analisis, dan kueri dari sejumlah besar data.


  • Pemrosesan transaksi online (OLTP)

Adalah pemrosesan yang menyimpan data tentang operasi transaksi sehari-hari.


  • Tabel dimensi

Tabel berisi kategori dengan data ringkasan terperinci yang dapat dilaporkan. Laporan hasil juga dapat ditentukan dalam tabel fakta sebagai dimensi waktu (dalam bentuk bulanan, triwulanan, dan tahunan).


  • Tabel fakta

Ini adalah tabel yang umumnya berisi angka dan data historis, di mana kunci yang dihasilkan (kunci) sangat unik karena kunci tersebut terdiri dari kunci asing (foreign key), yang merupakan kunci utama (primary key) dari beberapa dimensi tabel terkait .


  • DSS

Merupkan sistem yang memberi pengguna informasi yang menjelaskan bagaimana sistem ini dapat menganalisis situasi dan mendukung keputusan yang baik.


Proses KDD (Knowledge Discovery in Database)

Proses Knowledge Discovery in Database (KDD) umumnya dapat digambarkan sebagai berikut:


1. Pemilihan data

Pemilihan pengumpulan data operasional (pemilihan) Data darurat harus dilakukan sebelum langkah penggalian informasi dalam KDD dimulai. Hasil pemilihan data yang digunakan untuk proses penambangan data disimpan dalam file terpisah dari basis data operasional.


2. Pra-pemrosesan / pembersihan

Sebelum proses penambangan data dapat dilakukan, proses pembersihan data harus dilakukan untuk menjadi fokus KDD.

Proses pembersihan mencakup, antara lain, menghilangkan duplikasi data, memeriksa ketidakkonsistenan data dan memperbaiki kesalahan dalam data, seperti B. Kesalahan pengetikan.

Proses pengayaan juga dilakukan di mana data “diperkaya” dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, data atau informasi eksternal.

Baca Lainnya :  Cara Membuat Cookies

3. Transformasi

Pengkodean adalah proses transformasi data sehingga data tersebut cocok untuk proses penambangan data. Pengkodean dalam proses KDD adalah proses kreatif dan sangat tergantung pada jenis atau pola informasi yang dicari dalam database


4. Penambangan data

Penambangan data menggunakan teknik atau metode untuk menemukan pola atau informasi menarik dalam data yang dipilih. Teknik, metode, dan algoritma dalam penambangan data sangat berbeda. Memilih metode atau algoritma yang tepat sangat tergantung pada tujuan umum dan proses KDD.


5. Interpretasi / evaluasi

Informasi sampel yang dihasilkan dari proses penambangan data harus ditampilkan dalam bentuk yang mudah dipahami oleh pihak yang berkepentingan. Fase ini merupakan bagian dari proses KDD, yang disebut interpretasi. Fase ini termasuk memeriksa apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada.

Baris proses KDD terdiri dari lima tahap, seperti yang dijelaskan sebelumnya. Namun, dalam proses KDD yang sebenarnya, itu hanya bisa diulang atau diulang langkah demi langkah. Pada setiap langkah dalam proses KDD, seorang analis dapat kembali ke fase sebelumnya.

Misalnya, selama proses pengkodean atau penambangan data, analis menentukan bahwa pembersihan tidak berkinerja sempurna, atau analis dapat menemukan data atau informasi baru untuk “memperkaya” data yang ada.

KDD mencakup seluruh proses pencarian pola atau informasi dalam database, dari pemilihan dan kompilasi data hingga representasi pola dalam bentuk yang mudah dipahami oleh pihak yang berkepentingan. Penambangan data adalah salah satu komponen dalam KDD yang berfokus pada mengekstraksi pola tersembunyi dalam database.


Keuntungan Data Warehouse

Berikut ini adalah beberapa manfaat dari data warehouse, yang meliputi:


1. Pengembalian investasi yang berpotensi tinggi

Organisasi perlu menjalankan sejumlah besar sumber daya untuk memastikan keberhasilan implementasi data warehouse dengan biaya yang sangat bervariasi. Nilai investasi yang diinvestasikan mengembalikan lebih cepat dengan data warehouse.


2. Keunggulan kompetitif

Keunggulan kompetitif dapat diraih dengan memberi para pembuat keputusan akses ke data yang sebelumnya sangat tidak mungkin.


3. Meningkatkan produktivitas pembuat keputusan perusahaan

Pergudangan data dapat meningkatkan produktivitas pembuat keputusan dengan membuat basis data terintegrasi yang konsisten, berbasis topik, dan dalam sejarah data. Dengan memindahkan data ke bentuk yang lebih bermakna, gudang data memungkinkan manajer bisnis untuk melihat analisis yang lebih substansial, akurat, dan konsisten.


Contoh Data Warehouse

Toko serba ada mencatat setiap penjualan barang dengan alat POS (Point of Sales). Database penjualan dapat mencapai beberapa GB per hari untuk jaringan di supermarket nasional.

Namun, pertumbuhan yang cepat dari akumulasi data telah menciptakan kondisi yang sering disebut sebagai “kaya akan data tetapi miskin informasi”. Tidak jarang catatan data dibiarkan sendiri seolah-olah itu adalah “data kuburan” (kuburan data).


Demikian Penjelasan Materi Tentang Data Warehouse: 5 Pengertian Menurut Para Ahli, Karakteristik, Istilah, Proses, Keuntungan dan Contoh
Semoga Materinya Bermanfaat Bagi Siswa-Siswi