Data Mining : Pengertian, Atribut, Nilai-Nilai, Teknik, dan Contohnya

Posted on

Apakah Anda sedang mencari Data Mining : Pengertian, Atribut, Nilai-Nilai, Teknik, dan Contohnya, jika iya? maka Anda berada di website yang tepat.

Semoga artikel berikut ini dapat bermanfaat.

Sebuah data sangatlah bermanfaat bagi sebuah persahaan untuk memperoleh informasi yang bermanfaat guna untuk pengambilan keputusan dalam suatu bisnis. Pada artikel sebelumnya kita telah membahas mengenai data mining, proses data minning, metode dan juga iplementasi data mining. Selanjutnya kita akan masuk ke pembahasan berikutnya yaitu pengertian, karakteristik, atribut dan teknik data mining.

Atribut adalah bagian data, yang mewakili karakteristik atau feature dari objek data. Atribut, dimensi, feature, dan variabel sering digunakan secara bergantian dalam literatur. Istilah dimensi ini umumnya digunakan dalam literatur data warehouse. Dalam literatur Machine learning cenderung menggunakan istilah feature, sementara statistik lebih menggunakan istilah variabel. 

Atribut yang menggambarkan objek pelanggan dapat mencakup, misalnya, ID pelanggan, nama, dan alamat. Nilai-nilai yang diamati untuk atribut tertentu disebut dengan observasi. Satu set atribut yang digunakan untuk menggambarkan suatu objek tertentu disebut atribut vektor (atau vektor feature). Distribusi data yang melibatkan satu atribut (atau variabel) disebut univariate. 

Pengertian Data Mining

Data mining atau Knowledge discovery from data merupakan ekstrasi pola atau pengetahuan yang menarik (non-trivial, implisit, sebelumnya belum diketahui, potensial kegunaanya) dari data yang disimpan dalam jumlah yang besar. Data mining berhubungan erat dengan analisa data dan penggunaan perangkat lunak untuk menemukan kesamaan dan pola dalam sekumpulan data yang disimpan dalam jumlah yang besar.

Data mining merupakan proses mengekstrak informasi yang valid, bermanfaat, sebelumnya belum diketahui dari sebuah data yang dapat digunakan sebagai pertimbangan pengambilan keputusan. Dalam sebuah bisnis informasi yang diekstrak haruslah sesuai dengan data statistik berarti untuk mendukung sebuah keputusan. Dimana proses data mining memberikan hasil yang benar dan bermanfaat untuk kepentingan bisnis. Penggunaan data mining pada beberapa bidang usaha dapat menghasilkan sebuah informasi yang bermanfaat.

Sebuah informasi yang bermaanfaat dari data mining melalui proses yang rumit seperti menggunakan ilmu matematika, teknik statistik, machine learning bahkan artificial intelligence dan lain sebagainya. Dimana proses yang dilewati akan mengidentifikasi dan mengekstrak informasi dari sekumpulan data dalam jumlah besar.

Atribut Data dalam Data Mining

Atribut merupakan sifat dari suatu objek data yang memiliki nilai yang beragam atau berbeda-beda. Pada umumnya tipe atribut terdiri dari :

1. Atribut Diskrit (kualitatif)

Atribut diskrit merupakan atribut yang memiliki himpunan nilai-nilai yang berhingga atau nilai tak hingga yang dapat dihitung, dan disajikan dalam bentuk integer atau bukan integer. Contoh :Ienis kelamin, status, dan pendidikan, dimana domainUenis kelamin) = {L, P}, adapun yang termasuk dalam atribut ini adalah:

  • Atribut Nominal, nilai atribut berupa nama yang membedakan dengan nilai lainnya(=,<>). Contoh: Nim, kode pos, nomor ktp.
  • Atribut Ordinal, nilai atribut berupa nama yang memiliki arti informasi terurut (<, <= , >=, >). Contoh: Nilai rapor (sangat baik, baik, cukup, dan kurang).

2. Atribut Numerik (kuantitatif)

Atribut diskrit merupakan atribut yang dapat diukur atau dihitung secara langsung sebagai variabel angka atau bilangan. Contohnya umur dan gaji.Domain(umur) = domain(gaji) = bilangan riil positif. Adapun yang termasuk dalam atribut numerik adalah sebagai berikut:

  • Atribut Interval, perbedaan dari dua nilai atribut yang memiliki makna berarti (+, -) data diukur pada skala interval. Contoh: Tanggal, temperatur, IQ.
  • Atribut Rasio,  perbedaan dan rasio dari dua nilai atribut memiliki perbedaan berarti (*, /). Contoh: Umur, tinggi, panjang, lebar.

Atribut berdasarkan jumlah nilainya dibedakan menjadi dua yaitu :

  1. Atribut Diskrit (Discrete Attribute) yaitu atribut yang hanya menggunakan sebuah himpunan nilai berhingga atau himpunan nilai tak berhingga yang dapat dihitung. Contoh: zip codes, jumlah, atau himpunan kata dalam kumpulan dokumen. Sering dinyatakan sebagai variabel bilangan bulat (integer). Catatan: atribut biner merupakan kasus khusus dari atribut diskrit.
  2. Atribut Kontinyu (Continudus Attribute) yaitu atribut yang menggunakan bilangan riil sebagai nilai atribut. Contoh: suhu, ketinggian atau berat. Pada kenyataannya, nilai riil hanya dapat diukur dan dinyatakan menggunakan sejumlah digit yang berhinggaAtribut kontinyu secara khusus dinyatakan sebagai variabel decimal (floating-point).

Nilai-Nilai Atribut Dalam Data Mining

Nilai- nilai atribut adalah angka atau simbol yang memberi nilai pada atribut tersebut. Perbedaan antara atribut dan nilai- nilai atribut.

  1. Atribut yang sama dapat dipetakan ke nilai atribut yang berbeda. Contoh: ketinggian dapat diukur dengan satuan kaki atau meter.
  2. Atribut yang berbeda dapat dipetakan ke himpunan nilai yang sama. Contoh: Nilai atribut untuk ID dan umur adalah bilangan bulat,tetapi sifat dari nilai atribut dapat berbeda. ID tidak terbatas tetapi umur mempunyai nilai minimal dan nilai maksimal.

Tipe dari suatu atribut tergantung pada sifat yang dimiliki berikut ini:

  • Pembeda (Distinctness): = 1
  • Urutan (Order):  <>
  • Penjumlahan (Addition): + –
  • Perkalian (Multiplication): * /

Teknik Data Mining

Teknik data mining terbagi menjadi berbagai jenis berdasarkan tugas yang dilakukannya. Diantaranya adalah sebagai berikut :

  • Klasifikasi (classification), merupakan salah satu teknik dari sebuah prediksi. Teknik ini biasa digunakan dalam pembuatan model yang dapat melakukan pemetaan dari setiap himpunan variabel, kemudian menggunakan model itu untuk memberi nilai target pada himpunan variabel baru yang diperoleh.
  • Clustering, digunakan untuk mengelompokan data-data ke dalam sejumlah kelompok (cluster) berdasarkan karakteristik setiap data pada kelompok yang ada. Semua data yang masuk dalam batas kesamaan dengan kelompoknya akan bergabung dalam kelompok tersebut, begitupun sebaliknya.
  • Asosiasi (association), digunakan untuk menemukan pola yang mengganmbarkan fitur dalam sebuah data. Mendeteksi kumpulan atribut yang muncul bersamaan dalam frekuensi yang sering dan membentuk sejumlah kaida dari kumpulan tersebut.
  • Anomali, berkaitan dengan pengamatan sebuah data dari sejumlah data yang signifikan memiliki karakteristik yang berbeda dari data yang lain. Dimana algoritma apada teknik ini haruslah mempunyai error yang rendah.

Contoh Atribut Data Mining

1. Atribut Diskrit (kualitatif)

  • Contoh Atribut Nominal : Misalkan warna rambut dan status perkawinan adalah dua atribut dari data orang. Nilai yang mungkin untuk warna rambut adalah hitam, coklat, pirang, merah, hitam pucat, abu-abu, dan putih. Status perkawinan memiliki nilai atribut lajang, menikah, bercerai, dan janda. Baik warna rambut maupun status perkawinan adalah atribut nominal. Contoh lain dari atribut nominal adalah atribut pekerjaan dengan nilai-nilainya adalah guru, dokter gigi, programmer, petani, dan sebagainya
  • Contoh Atribut ordinal : Pangkat dan jabatan profesi. Atribut ordinal berguna untuk melakukan penilaian subjektif terhadap kualitas sesuatu objek yang tidak dapat diukur secara obyektif; atribut ordinal sering digunakan dalam survei untuk peringkat. Dalam satu survei, para peserta diminta untuk menilai tingkat kepuasan mereka sebagai pelanggan.Kepuasan pelanggan memiliki kategori ordinal berikut ini: 0: sangat tidak puas,1: agak tidak puas, 2: netral, 3: puas, dan 4: sangat puas. Atribut ordinal juga dapat diperoleh dari iskritisasi nilai atribut numerik dengan membagi rentang nilai menjadi urutan kategoria
  • Contoh Atribut Biner : Terdapat atribut yang menggambarkan merokok pada pasien, 1 menunjukkan bahwa pasien merokok,sementara 0 menunjukkan bahwa pasien tidak merokok. Demikian pula, seandainya ada pasien menjalani tes medis yang memiliki dua kemungkinan hasil. Atribut Tes medis bersifat biner, dengan nilai 1 berarti hasil tes untuk pasien positif, sedangkan 0 berarti hasilnya negatif. Atribut biner simetris jika keduanya emiliki nilai bobot yang sama; Artinya, tidak ada kekhususan mengenai hasil mana yang harus dikodekan sebagai 0 atau 1. Misalkan atribut gender yang dengan nila atributnya laki dan perempuan. Atribut biner adalah asimetris jika hasil dari nilai nilainya tidak sama pentingnya seperti hasil positif dan negatif dari tes medis untuk HIV. Dengan mengkodekan hasil yang paling penting, biasanya 1 (mis., HIV positif) dan yang lainnya dengan 0 (mis., HIV negatif)

2. Atribut Numerik (kuantitatif)

  • Contoh Atribut skala interval  : Atribut suhu adalah Skala interval. Misalkan kita memiliki nilai suhu di luar ruangan untuk beberapa hari yang berbeda dari suatu objek. Dengan mengurutkan nilai, kita mendapatkan peringkat objek yang berkenaan dengan suhu. Selain itu, kita bisa mengukur perbedaan antara nilai.Misalnya, a suhu 20o C adalah lima derajat lebih tinggi dari suhu 15oC. Contoh lain kalender tahun adalah. Misalnya, tahun 2002 dan 2010 terpisah delapan tahun. Karena atribut skala interval adalah numerik, kita dapat menghitung nilai ratarata, ukuran median dan modus dari kecenderungan terpusat
  • Contoh Atribut Skala Ratio : Atribut tentang pengukuran berat badan, tinggi badan, jumlah kata dalam dokumen.

Baca juga : Tipe Data Primitif : Pengertian dan Jenis-Jenis Tipe Data Primitif dalam Bahasa Pemrograman

Demikian yang dapat Teknik area bagikan, tentang Data Mining : Pengertian, Atribut, Nilai-Nilai, Teknik, dan Contohnya. Sekian dan terima kasih telah mengunjungi www.teknikarea.com, semoga bermanfaat dan sampai jumpa lagi di artikel Education berikutnya.