Tugas 2 Datawarehouse

Unduh sebagai docx, pdf, atau txt
Unduh sebagai docx, pdf, atau txt
Anda di halaman 1dari 5

1. Snowflake Model snowflake merupakan perluasan dari star dimana ia juga mempunyai satu atau lebih dimensi.

Hanya saja pada snowflake, tabel yang berelasi pada fact table hanya tabel dimensi utama, sedangkan tabel yang lain dihubungkan pada tabel dimensi utama. Model snowflake ini hampir sama seperti teknik normalisasi Snowflake schema adalah jenis variasi star schema yang terlihat menyerupai butiran salju. Berisi tabel dimensi dan fact tabel. Dimana tabel dimensi tersebut dinormalisasi menjadi sebuah hirarki yang terorganisasi. Tujuan dari normalisasi tabel dimensi adalah mengurangi redudancy. Tujuannya untuk memelihara kapasitas disk atau memori. Skema bunga salju ini mirip dengan skema bintang Namun, dalam skema kepingan salju, dimensi yang dinormalisasi ke dalam tabel beberapa terkait, sedangkan dimensi's skema bintang adalah denormalized dengan dimensi masing-masing diwakili oleh sebuah tabel tunggal. Sebuah bentuk kepingan salju yang kompleks muncul ketika dimensi sebuah skema kepingan salju yang rumit, memiliki beberapa tingkat hubungan, dan meja anak memiliki tabel beberapa orangtua ("garpu di jalan"). The "snowflaking" efek hanya mempengaruhi tabel dimensi dan tabel bukan fakta. Didalam data warehouse bisa terdapat star - snowflake schema apabila : - terdapat root yang unik. - Setiap reference didalam poin root menuju ke subgraph didalam data warehouse graph. Contoh dari snowflake schema : *Gambar sesuai sumber dari E-book Advanced Topics In Database Research vol 5 Keuntungan dari snowflake schema, mengurangi beberapa redundancy dengan membagi table yang umum, meningkatkan query performance tentang meminimalisasi penyimpanan data didalam disk, dan meningkatkan fleksibilitas dari suatu aplikasi karena terjadinya normalization lowers.

Menggunakan Common Star and snowflake schemas yang paling sering ditemukan dalam dimensi data warehouse dan data mart di mana kecepatan pengambilan data lebih penting daripada efisiensi manipulasi data. Dengan demikian, tabel dalam skema ini tidak

dinormalisasi banyak, dan sering dirancang pada tingkat normalisasi singkat bentuk normal ketiga . Keputusan apakah akan menggunakan skema bintang atau skema kepingan salju harus mempertimbangkan kekuatan relatif dari platform database yang dimaksud dan alat query untuk dipekerjakan. Star skema Star harus disukai dengan alat query yang sebagian besar pengguna untuk mengekspos struktur tabel yang mendasari, dan dalam lingkungan dimana kebanyakan query sederhana di alam. skema Snowflake sering lebih baik dengan tool query yang lebih canggih yang mengisolasi pengguna dari struktur tabel baku dan untuk lingkungan memiliki banyak query dengan kriteria yang kompleks. Manfaat dari "snowflaking"

Beberapa OLAP tools pemodelan database multidimensi yang menggunakan data mart dimensi sebagai sumber data yang dioptimalkan untuk skema kepingan salju. Jika dimensi sangat tipis (yaitu sebagian besar nilai yang mungkin untuk dimensi tidak memiliki data) dan / atau dimensi memiliki daftar yang sangat panjang atribut yang dapat digunakan dalam query, tabel dimensi dapat menempati proporsi yang signifikan dari database dan snowflaking mungkin tepat. Dalam hal ini, tabel-tabel yang menggambarkan dimensi sudah akan ada dan biasanya akan dinormalisasi. A snowflake schema will therefore be easier to implement. Skema kepingan salju sehingga akan lebih mudah untuk diimplementasikan. Skema kepingan salju kadang-kadang dapat mencerminkan cara di mana pengguna berpikir tentang data. Pengguna dapat memilih untuk menghasilkan query dengan menggunakan skema bintang dalam beberapa kasus, walaupun ini mungkin atau mungkin tidak tercermin dalam organisasi yang mendasari database. Beberapa pengguna mungkin ingin mengajukan pertanyaan ke database yang menggunakan alat-alat konvensional pelaporan multidimensi, tidak dapat dinyatakan dalam skema bintang sederhana. Hal ini khususnya umum dalam data mining dari database pelanggan, di mana persyaratan umum adalah untuk menemukan faktor umum antara pelanggan yang membeli produk yang memenuhi kriteria yang kompleks. snowflaking Beberapa biasanya akan diperlukan untuk memungkinkan alat query yang sederhana untuk membentuk seperti query, terutama bila penyediaan bentuk-bentuk dari query tidak diantisipasi ketika gudang data pertama kali dirancang.

Contoh: Snowflake schema

Adapun keuntungan menggunakan model snowflake adalah : Pemakain space yang lebih sedikit Update dan maintenance yang lebih mudah Sedangkan kerugian menggunakan model ini yaitu : Model lebih komplek dan rumit Proses query lebih lambat Performance yang kurang bagus

Star Schema
skema bintang (juga disebut bintang- bergabung skema, data kubus, atau skema multi-dimensi) adalah gaya paling sederhana dari data warehouse skema . Skema bintang terdiri dari satu atau lebih fakta tabel referensi sejumlah tabel dimensi .

Sebuah teknik pemodelan dimensi di mana suatu tabel fakta detail terkait dengan tabel dimensi. Data dalam data warehouse dan data mart diakses oleh pengguna-akhirInformasi yang terkandung di dalam gudang data / data mart harus mudah bagi pengguna-akhir untuk penggunaan dan akses. desain Denormalized lebih mudah untuk end-user untuk digunakan daripada desain yang sangat normal, namun desain ini lebih sulit untuk merancang dan memelihara. Star Schema Diagram model grafis pengguna akhir melihat (yakni, tampilan denormalized) tentang bagaimana informasi diakses.

Model
Fakta bahwa data warehouse membantu menganalisa diklasifikasikan sepanjang dimensi yang berbeda:

Ini mencakup sejumlah besar data agregat, seperti harga dan unit terjual. There may be multiple fact tables in a star schema. Mungkin ada beberapa fakta tabel dalam skema bintang. tabel Dimensi, yang biasanya lebih kecil dari tabel fakta, termasuk atribut yang menggambarkan fakta-fakta. Often this is a separate table for each dimension. Seringkali ini adalah tabel terpisah untuk masing-masing dimensi. Dimensi tabel dapat bergabung ke tabel fakta (s) yang diperlukan.

Dimensi tabel memiliki sederhana kunci utama , sedangkan tabel fakta memiliki satu set kunci asing yang membentuk sebuah senyawa kunci primer terdiri dari kombinasi tombol dimensi yang relevan. Adalah umum untuk tabel dimensi untuk mengkonsolidasikan data yang berlebihan di kolom paling butiran, dan karena itu diberikan dalam bentuk normal kedua Fakta tabel biasanya dalam bentuk normal ketiga karena data semua tergantung di kedua dimensi satu atau semua dari mereka, bukan pada kombinasi dari beberapa dimensi. Skema bintang adalah cara untuk menerapkan database multi-dimensi (MDDB) fungsionalitas menggunakan mainstream database relasional : 'organisasi yang paling komitmen yang diberikan kepada database relasional, DBMS multi-dimensi khusus kemungkinan untuk menjadi mahal dan tidak nyaman. Alasan lain untuk menggunakan skema bintang adalah kesederhanaannya untuk pengguna: query tidak pernah kompleks karena hanya bergabung dan kondisi melibatkan fakta dan meja satu tingkat tabel dimensi, tanpa dependensi tidak langsung untuk tabel lain yang mungkin lebih baik normalisasi kepingan salju skema .

Karakteristik dari model ini adalah : Pusat dari star disebut fact table Fact table mempunyai sebuah nilai aggregate dari data-data yang berasal dari tabel dimensi Setiap tabel dimensi berelasi langsung dengan fact table Tabel dimensi beisikan data tentang informasi atau waktu Relasi antara fact table dengan dimensi-dimensinya adalah 1 N (one to many) Primary key pada tabel dimensi akan menjadi key pada fact table atau dapat diakatakan bahwa fact table memiliki kombinasi key dari tabel dimensi tersebut

Anda mungkin juga menyukai