Data
Warehousing
Data
warehouse berisi data gabungan dari banyak sumber, ditambah dengan ringkasan
dan mecakup periode waktu yang lama. Arsitektur data warehousing umum
diilustrasikan pada Gambar 25.10.
Gambar
25.10 Arsitektur Data Warehouse
Tugas penting dalam
mengatur warehouse adalah mencatat data yang sedang disimpan di
dalamnya.pembukuan ini dilalakukan dengan menyimpan informasi tentang data
warehouse dalam katalog sistem. Katalog sistem yang berhubungan dengan
warehouse sangat besar dan sering disimpan dan diatur dalam database terpisah
yang disebut repositor metadata.
Ukuran dan komplekasitas katalog sebagian berkaitan dengan ukuran dan
kompleksitas warehouse dan sebagian karena banyak informasi administratif yang
harus diatur.
Nilai warehouse pada
akhirnya berada dalam analisis yang di-enable-nya, data dalam warehouse
biasanya diakses dan dianalisis menggunakan berbagai alat, termasuk mesin query
OLAP,algoritma data mining, alat visualisasi informasi, paket statistik dan
report generator.
Online Analitycal
Processing (OLAP)
OLAP merupakan salah satu bagian dari Data Warehouse, OLAP adalah sebuah sistem informasi yang sering digunakan pada suatu organissasi atau perusahaan dalam mengelola bisnis. Sedangkan seperti kita tahu, bisnis intelegen berguna mengumpulkan semua data mentah untuk diproses menjadi informasi yang berguna sebagai alat untuk menentukan keputusan/kebijakan.
Di dalam OLAP terdapat beberapa proses dalam pengambilan keputusan, yaitu :
1.Slicing dan Dicing
Slicing dan dicing adalah operasi untuk melihat data sebagai visualisasi dari kubus. Dengan slicing dan dicing pengguna dapat melihat data dari beberapa perspektif. Pengguna dapat mengekstrak bagian dari data agregrated dan dapat memeriksa dengan detail berdasarkan dimensi-dimensi yang diinginkan. Data Agregrated merupakan data praperhitungan (precalculated) dalam bentuk rangkuman data (data summarized) sehingga query pada kubus (cube) lebih cepat. Slicing memotong kubus sehingga dapat memfokuskan pada perspektif yang spesifik (pada suatu dimensi). Sedangkan dicing memberikan kemampuan untuk melihat pemilihan data pada dua dimensi atau lebih. Yaitu dengan merotasi cube pada perspektif yang lain sehingga pengguna dapat melihat lebih spesifik terhadap data yang dianalisis.
2.Roll up dan drill down
Drill down dan roll up adalah operasi untuk melihat data global atau detail disepanjang level hiraraki dimensi. Roll up untuk melihat data secara global atau rangkuman (summary). Drill down memandu pengguna untuk memperoleh data yang lebih detail. Drill down ini biasa digunakan untuk menjawab pertanyaan atas suatu kasus tertentu. Misalnya untuk menjawab pertanyaan ketika sebuah summary number (ratarata atau jumlah) di bawah atau di atas harapan.
Dari tiga jurnal yang kami peroleh, disebutkan beberapa tahapan dalam membuat sistem informasi akademik dengan metode Data Warehouse dan OLAP, yaitu :
1.Perancangan Arsitektur Data Warehouse
Perancangan dibuat untuk menentukan informasi yang akan ditampilkan. Jurnal ini mengambil contoh sistem informasi akademik, di dalamnya meliputi informasi mengenai jumlah calon mahasiswa, jumlah mahasiswa baru pada fakultas tersebut, jumlah lulusan yang sekaligus dikelompokkan berdasarkan nilai Indeks Prestasi Kumulatif beserta prosentasenya.
2.Pemodelan Data Dimensional
Seperti yang telah dijelaskan, bahwa Data Warehouse memiliki banyak model skema, pemodelan berguna untuk mengelompokkan data yang akan digunakan dalam sistem.
3.Pembuatan Prototipe Data
Tujuan dari pembuatan prototipe data warehouse adalah untuk mengetahui kesesuaian antara kebutuhan pengguna dengan data warehouse yang dibuat.
Kesimpulan OLAP merupakan salah satu bagian dari Data Warehouse, Data Warehouse sebuah kumpulan database namun tidak bisa mengambil keputusan, maka dibutuhkan metode OLAP. Dalam prosesnya, Data disimpan dalam data warehouse dalam bentuk multidimensi dioptimasi untuk pencarian kembali (retrieval) untuk OLAP (Online Analytical Processing). Setelah itu dilakukan analisis multidimensi yang memberikan kemampuan untuk melakukan query dan membuat laporan (reporting). Suatu cara melihat data dengan multidimensi tersebut dikenal dengan nama kubus (cube). Kubus ini menjadi struktur OLAP yang utama yang digunakan untuk melihat data (view). Analisis menggunakan kubus ini memberikan fasilitas banyak dimensi untuk melihat data yang diinginkan. Sehingga memungkinkan untuk mengakses data dengan lebih mudah dan cepat untuk menjawab pertanyaan yang dikemukakan.
DATA MINING
Data
mining terdiri dari penemuan tren atau pola yang menarik dalam dataset besar
untuk memamdu
Pengambilan
keputusan mengenai aktifitas yang akan dating. Pola yang di identifikasi oleh
alat tersebut dapat diberikan pandangan yang berguna dan tidak terduga kepada
analis data sehingga dapat di investigasi secara lebih cermat dan berurutan,
mungkin dengan menggunakan alat decision support lain.
Pengantar
data mining
Data
mining dihubungkan dengan subarea statistik yang disebut exploratory data analysis,
yang mempunyai tujuan yang sama dan berdasarkan pada ukuran statistic. Data
mining jjuga berhubungan dekat dengan subarea dari kecerdasan buatan yang
disebut knowledge discovery dan machine learning. Karakteristik penting yang
membedakan data mining adalah volume data yang sangat besar , meskipun ide dari
area studi yang bersangkutan dapat diterapkkan pada masalah data mining,
skalabillitas yang berhubungan dengan ukuran data adalah criteria baru yang
penting.
Menemukan
tren yang bergguna dalam dataset adalah definisi data mining yang agak tidak
tetap Dallam hal tertentu semua query database dapat dianggap hanya melakukan
hal ini. Query SQL dikonstruksi dengan menggunakan aljabar relasional (dengan
beberapa perluasan). Olap menyeddiakan idiom query dengan level lebih tinggi
berdasarkan pada model data multidimensi dan data mining menyediakan operasi
anallisyang penting abstrak. Kita dapat menganggap tugas data mining lain
sebagai “Query” yang kompleks yang ditentukkkan pda level tinggi, dengan beberapa
parameter yang dapat di deffinisikan pengguna dan dimana algoritma tertentu di
implementasikan.
SQL/MM
: SQL/MM Data Mining : SQL/MM: perluasan data mining standar SQL:1999 mendukung
empat jjenis model data mining: frequent item dan aturan asosiasi, cluster dari
record, regression tree dan classification tree. Jenis data ini memainkan
beberapa peranan . beberapa dari mereka mempresentasikan kelas model tertentu
(misalnya, DM_Regresionmodal, DM_Clusteringmodal); beberapa menentukan
parameterinput untuk algooritma mining (misalnya, DM_logicalDataSpec,
DataMiningData); dan beberapa mempresentasikan hasil pengeksekusian algoritma
minning (misalnya,, DM_RegResult, DM_ClusResult; dapat ddigunakan dari system
database SQL:1999. Model data mining dapat ddieksportasi dalam format XML
standar yang disebut Predictive model markup language (PMML).
Sumber
: ramakrisnan ,raghu., sistem manajemen
database, edisi 3, 2003, jurnal sistem informatika hlm. 667 – 668.
gehrke,
johannes., sistem manajemen database,
edisi 3, jurnal sistem informasi hlm. 351-353
.bmp)
Tidak ada komentar:
Posting Komentar