PENGENALAN DATA MINING
Serangkaian proses untuk menggali nilai
tambah berupa informasi yang selama ini tidak diketahui secara manual dari
suatu basisdata dengan melakukan penggalian pola-pola dari data dengan tujuan
untuk memanipulasi data menjadi informasi yang lebih berharga yang diperoleh
dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari
data yang terdapat dalam basisdata. Data Mining juga dikenal dengan KDD
(Knowledge Discovery in Database), Ekstrasi Pengetahuan (Knowledge
Extraction), Analisa data/pola dan kecerdasan bisnis (business intelligence)
dan merupakan alat yang penting untuk memanipulasi data untuk penyajian
informasi sesuai kebutuhan user dengan tujuan untuk membantu dalam analisis
koleksi pengamatan perilaku.
Secara umum definisi data-mining dapat
diartikan sebagai berikut :
Ø Proses penemuan pola yang menarik
dari data yang tersimpan dalam jumlah besar.
Ø Ekstraksi dari suatu informasi yang
berguna atau menarik (non-trivial, implisit, sebelumnya belum diketahui
potensial kegunaannya) pola atau pengetahuan dari data yang disimpan dalam
jumfah besar.
Ø Ekplorasi dari analisa secara
otomatis atau semiotomatis terhadap data-data dalam jumlah besar untuk mencari
pola dan aturan yang berarti.
Karakteristik data mining sebagai
berikut:
Ø Data mining berhubungan dengan
penemuan sesuatu yang tersembunyi dan pola data tertentu yang tidak diketahui
sebelumnya.
Ø Data mining biasa menggunakan data
yang sangat besar. Biasanya data yang besar digunakan untuk membuat hasil lebih
dapat dipercaya.
Ø Data mining berguna untuk membuat
keputusan kritis.
B. Tahapan
Data Mining
Ada beberapa tahapan dalam
pembangunan data mining, yaitu :

Integrasi
data merupakan penggabungan data dari berbagai database ke dalam satu database
baru. Tidak jarang data yang diperlukan untuk data mining tidak hanya berasal
dari satu database tetapi juga berasal dari beberapa database atau file teks.
Integrasi data dilakukan pada atribut-aribut yang mengidentifikasikan
entitas-entitas yang unik seperti atribut nama, jenis produk, nomor pelanggan
dan lainnya.
2. Seleksi Data (Data Selection) & Transformasi data (Data
Transformation)
Data
yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu
hanya data yang sesuai untuk dianalisis yang akan diambil dari database.
Data
diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data
mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum
bisa diaplikasikan.
3. Proses mining
Merupakan suatu proses utama saat
metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari
data.
4. Evaluasi pola (pattern evaluation) & Presentasi
pengetahuan (knowledge presentation)
Untuk mengidentifikasi pola-pola menarik kedalam knowledge
based yang ditemukan. Dalam tahap ini hasil dari teknik data mining berupa
pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah
hipotesa yang ada memang tercapai. Bila ternyata hasil yang diperoleh tidak
sesuai hipotesa ada beberapa alternatif yang dapat diambil seperti
menjadikannya umpan balik untuk memperbaiki proses data mining.
Sedangkan Persentase Pengetahuan Merupakan visualisasi dan
penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan
yang diperoleh pengguna.
Mungkin sekian pengenalan kita dengan Data Mining, Untuk
selanjutnya kita akan membahas tentang metode dan algoritma yang
terdapat dalam data mining. Terima Kasih

0 komentar:
Posting Komentar