Pilihlah dataset yang kalian inginkan. Namun sebelum memilih, yang harus diperhatikan pada saat memilih dataset adalah jenis dataset yang akan dipilih seperti multivariate, time-series, dll. Serta perhatikan kategori classification / Regressionnya dan juga jenis atributnya. Dan disini saya akan menggunakan Ecoli Data Set.
Berdasarkan dataset yang telah dipilih, maka kita akan mendapatkan informasi detail dari dataset yang akan digunakan adalah :
Dataset Characteristics : Multivariate
Attribute Characteristics : Real Associated
Tasks : Classification
Number of Instances : 336
Number of Attributes : 8
Missing Values? : No
Area : Life
Date Donated : 1996 – 09 – 01
Number of Web Hits : 133343
Attribute Information :
1. Sequence Name
2. mcg
3. gvh
4. lip
5. chg
6. aac
7. alm1
8. alm2
9. Class Distribution
Selanjutnya, kita masuk ke dalam Data Folder. Lalu pilih ecoli.data.
Maka akan muncul tampilan seperti yang ada di bawah ini. Tampilan tersebut adalah dataset yang bisa kita gunakan. Dan langkah selanjutnya adalah lakukan copy paste pada notepad.
Lalu ubah spasi menjadi , (koma). Dengan cara Replace All. Dan tambahkan attribute Sequence Name,mcg,gvh,lip,chg,aac,alm1,alm2, Class Distribution pada bagian atas dataset.
Dan sekarang kita mulai melakukan klasifikasi menggunakan Decision Tree
1. Buka Aplikasi WEKA, lalu pilih Explorer.
2. Masukkan file .csv yang telah dibuat. Dengan cara Klik Open File >> Cari File .csv >> Ubah File of Type dengan CSV data Files >> Klik Open.
3. Lakukan klasifikasi Naive Bayes, dengan cara Buka Tab Classify >> Klik Choose >> Pilih Bayes >> Klik NaiveBayes.
4. Lalu ubah Test Option menjadi Use Training Set dan Klik Start.
5. Hasil dari klasifikasi menggunakan metode Naive Bayes adalah seperti gambar di bawah ini:
Jadi klasifikasi Ecoli Dataset menggunakan metode Naive Bayes memiliki akurasi sebesar 92%.
ConversionConversion EmoticonEmoticon