Cara menggunakan hasil klasifikasi pada WEKA

Beranda > Data Mining, Klasifikasi, Tak Berkategori > Cara menggunakan hasil klasifikasi pada WEKA

Cara menggunakan hasil klasifikasi pada WEKA

26 Juni 2011 Ismail Sunni Tinggalkan komentar Go to comments

Setelah melakukan pemilihan metode untuk melakukan klasifikasi, dan sudah menemukan metode yang paling cocok, tentu kita akan menggunakan hasilnya untuk memprediksi hasil klasifikasi dari sekumpulan data yang baru. Di sini, akan dijelaskan mengenai cara menggunakan hasil klasifikasi tersebut di WEKA.

Anggaplah kita sudah menemukan metode yang pas. Misal, dalam kasus ini, dengan J48 alias pohon C4.5. Catatan : kalau gambarnya tidak jelas, bisa diklik untuk memperbesar.

Pilih test options–>supplied test set–>klik set
Test options
Pilih file yang akan diprediksi
Pilih file

Kita bisa menggunakan file dari komputer kita atau dari jaringan. Untuk contoh kali ini, akan menggunakan file lokal. File yang bisa digunakan sebagai data, harus memiliki atribut yang sama dengan data training. Mulai dari banyak atribut dan tipe atribut. Untuk data tes yang akan diprediksi kelasnya, isi kelas yang akan diprediksi dengan tanda tanya “?”
Klik close untuk melanjutkan.
Kemudian klik start untuk memulai prediksi
Klik Start

Start saya tandai dengan warna merah. Setelah mengklik start, WEKA akan melakukan proses, dan memunculkan sesuatu di bagian output (warna biru). Tapi, kok semuanya 0 ? Tenang saja, memang seperti itu. Kita belum selesai.
Klik kanan pada result list
Klik kanan, Visualize Classifier Error

Selanjutnya, pada kolom result list, klik kanan pada hasil yang baru saja Anda jalankan. Selanjutnya, pilih “Visualize Classifier Error“
Muncul jendela baru
Jendela baru

Untuk kali ini, tidak usah pedulikan gambar-gambar aneh tersebut. Cukup lanjutkan dengan klik save. Dan simpan sesuai dengan nama favorit Anda. :). Saya menyimpan dengan nama lontong.arff.
Selesai – Baca hasil.
Setelah langkah 5, sebenarnya sudah selesai. Tapi, kita lanjutkan untuk melihat prediksi dari si WEKA ini. Cari file yang baru saja Anda simpan. Bisa langsung Anda buka dengan notepad++ atau cara yang lebih enak dilihat.
Cara lebih enak – ARFF viewer.
Buka lagi jendela WEKA yang paling pertama muncul ketika Anda menjalankan WEKA. Pilih tab tools –> pilih ARFF viewer.

Pilh arff viewer
Pilih file yang akan dibuka
Akan muncul jendela baru. Langsung pilih file->open->pilih file Anda
Tara…
Hasil

Bisa dilihat, kolom yang saya warnai merah merupakan prediksi yang dilakukan oleh WEKA

Setelah melakukan pemilihan metode untuk melakukan klasifikasi, dan sudah menemukan metode yang paling cocok, tentu kita akan menggunakan hasilnya untuk memprediksi hasil klasifikasi dari sekumpulan data yang baru. Di sini, akan dijelaskan mengenai cara menggunakan hasil klasifikasi tersebut di WEKA.

Sebenarnya, langkahnya cukup sederhana. Cuman, gambarnya saja yang kegedean.

Referensi : http://maya.cs.depaul.edu/classes/ect584/weka/classify.html

Kategori:Data Mining, Klasifikasi, Tak Berkategori Tag:klasifikasi, WEKA

Komentar (46) Trackbacks (0) Tinggalkan komentar Lacak balik

Tita

27 Juni 2011 pukul 11:49

Balas

hip hip horeeee.. 😀
alhamdulillah..
hatur nuhun, tengkyu banget yah..

ada lagi..
(maaf, nanya terus..)
rule yang uda jadi dibuat, bisa g digunakan untuk mengklasifikasikan data baru?
kalo bisa gimana caranya?

greget ih kamu meni bisaan.. hehe
makasih banyak yah 😀
- ismailsunni
  
  27 Juni 2011 pukul 16:55
  
  Balas
  
  lhoh? bukannya kayak yang ditulis dipostingan ini? menggunakan hasil klasifikasi buat memprediksi data baru…
  atau saya salah nangkep maksudnya?
  
  he.. ndak papa… saya juga sedang belajar kok… kalau ada yang nanya, malah jadi sekalian belajarnya…
Tita

29 Juni 2011 pukul 08:58

Balas

menurut saya mah postingan ini menjelaskan cara melihat hasil klasifikasi dari data yang sudah dibuat pohon keputusannya..
yang saya tanyakan, saya permisalan aja yah:
saya ada data 1000, saya gunakan 700 untuk di training jadi puhon keputusan dan jadi rule. nah yang 300 lagi kan belum diapa-apakan, saya mau klasifikasikan yang sisa itu menggunakan rule yang sudah jadi tersebut, tanpa harus di training lagi. nah di weka ada g caranya???
ismailsunni

29 Juni 2011 pukul 09:57

Balas

Oh, maksudnya, di save hasil rule nya supaya bisa digunakan di lain waktu?
Kalau dari hasil eksplorasi saya, hal itu memungkinkan, karena WEKA mampu menggenerate kode Java untuk beberapa metode tertentu, misal J48. Caranya, sebelum memulai klasifikasi, pilih more options, pada “test options”, selanjutnya, tandau pada pilihan “Output source code” *terletak di bagian paling bawah. Nanti, WEKA akan menggenerate source dalam Java.

Tapi, saya sendiri belum sempat mencoba source tersebut.
Tita

29 Juni 2011 pukul 11:12

Balas

hem, uda dicoba, trus gimana lagi?
apa harus buat programnya di java?
lagi libur?
bisa ol ym?
- ismailsunni
  
  29 Juni 2011 pukul 13:40
  
  Balas
  
  iya, tinggal diimplementasikan ke Java.
  Iya, sedang libur, tanggal merah. Kalau sedang terkoneksi internet, saya ol ym.
Tita

30 Juni 2011 pukul 10:05

Balas

saya lupa ym nya uda di uninstal, hehe
biasanya kalo ol kapan aja?
saya mau coba dulu yang g pake aplikasi dan g mengklasifikasikan kasus baru..
doakan ya!!

makasih banyak :DD
- ismailsunni
  
  30 Juni 2011 pukul 16:56
  
  Balas
  
  Kalau OL, biasanya malem sih.
  Semoga sukses…
Tita

1 Juli 2011 pukul 10:48

Balas

yahh..
hehe..
makasih yah 😀
handaph

26 Juli 2011 pukul 21:04

Balas

saya mau buat aplikasi data mining gunakan bahasa pemrograman java tp saya buta sama sekali dengan weka, help me tutorial dasar gunakan weka gan….help me send my email muhammadfazeriansyah@gmail.com/muhammadfazeriansyah@rocketmail.com. Tolong saya……terimakasih sebanyak banyaknya buat yg bisa menolong saya.
Agoezt Biak Kayong

19 Agustus 2011 pukul 15:06

Balas

maaf mengganggu….saya Agus, mau nanya, hasil dari visualisasi tree pada weka, gaimna kita bisa menyimpan hasil gambarnya ke dalam microshop work/ jpg??
mohon penyelasannya. sebelmnya saya ucapkan terima kasih.
klu udah ada kirim ke email saya aja: agoezt21@gmail.com
fazeri

29 Agustus 2011 pukul 06:06

Balas

tolong……tolong……….
vivi

11 Oktober 2011 pukul 19:31

Balas

maaf,..
mau tnya donk,..kalo diatas kan yang di jelasin hasil klasifikasinya,bisa dikatakan data tesnya..
kalo untuk training datanya gimana cara nentuinya dl tuh??
soalnya kan training data itu uda ada kls nya kalo dlm knn..

thank’s

vivi
- ismailsunni
  
  11 Oktober 2011 pukul 21:29
  
  Balas
  
  maksudnya nentuin apanya training data ya?
andien

20 Oktober 2011 pukul 07:46

Balas

alhmdulillah..makasih banyak ya mas.. postingannya sgt membantu untuk tugas akhirku.. mohon bimbingannya ya mas.. terimakasih
Ching

23 Januari 2012 pukul 21:27

Balas

tolong beritau cara dari awal untuk menggunakan Weka, makasih sangat maz…
- ismailsunni
  
  24 Januari 2012 pukul 00:07
  
  Balas
  
  saya rasa, postingan di blog ini sudah cukup untuk sekadar digunakan sebagai panduan menggunakan WEKA. Mulai dari file input hingga melakukan klasifikasi. Silahkan dibaca. 🙂
agus triono

11 Mei 2012 pukul 07:36

Balas

maaf mau nanya lagi, gaimana munculkan klasifikasi menggunakan id3 pada weka soalnya yg muncul pada choose hanya j48 sedangkan klu kita milih id3 warna abu-abu dak tudak bisa distar.
mohon bantuannya
- ismailsunni
  
  11 Mei 2012 pukul 08:53
  
  Balas
  
  Kalau versi aslinya memang tidak bisa. Kalau ingin memvisualisasikan yang id3, bisa coba Modified WEKA. Silahkan baca di http://davis.wpi.edu/~xmdv/weka/.
  Saya sendiri belum mencobanya, tetapi di sana dikatakan : “This modified version of Weka also supports the Tree Visualizer for the ID3 algorithm.”
  Selamat mencoba 🙂
agus triono

14 Mei 2012 pukul 23:46

Balas

sory mas nanya lagi, klu masalah yang saya tanyakan sebelumnya Alhamdulillah sudah dapat soalnya data saya masih bercampur dengn data kontinu jadi harus di deskritkan terlebih dahulu. cuma yang saya tanyakan sekarang adalah untuk menampilkan visual tree nya yg nggak bisa. gaimna ya???
dari kmren blum ketemu solusinya….:)
- ismailsunni
  
  15 Mei 2012 pukul 07:31
  
  Balas
  
  sudah mencoba menggunakan Modified WEKA? bisa dilihat di http://davis.wpi.edu/~xmdv/weka/
istiaprillani

16 Mei 2012 pukul 15:54

Balas

salam kenal mas mau tanya ttg beberapa hal yang masih saya kurang mengerti. semoga bisa membantu 🙂
jadi gini, saya punya data asli A (100 record) lalu saya split menjadi data training (75record) dan data testing (25 record). kemudian saya mau mengeluarkan/menghasilkan nilai performansi Precision, dan Recall dari data A tsb menggunakan klasifikasi KNN pada weka.
Bisa bantu saya ngsi tau step by step yg harus saya lakuin mas?
Terimakasih sebelumnya.
istiaprillani

16 Mei 2012 pukul 19:00

Balas

Oiya, sama mau tanya kl misalnya dari data training yg saya mksd diatas mau dibentuk modelnya menggunakan KNN classifier gimana ya caranya? trus data testing nya mau diuji pake model yg dihasilkan itu. Gimana ya mas solusinya? Mohon bantuannya, makasi 🙂
- ismailsunni
  
  17 Mei 2012 pukul 00:21
  
  Balas
  
  1. Untuk memisah menjadi 75 data training dan 25 data tes sama seperti mengklasifikasikan biasa. Hanya, pada test option, pilihlah percentage split, dengan nilai 75%. Hal ini berarti 75% dari data kita akan digunakan sebagai data training, dan 25% digunakan sebagai data test.
  2. Kalau KNN, pilih classifiernya IBk. Untuk mengetesnya, dilakukan dengan cara biasa. Kalau kita punya data test yang benar-benar berbeda dari data pembentuk model, gunakan test option use training set.
  
  Saran : Baca tulisan saya mengenai “Test Options pada WEKA” di blog ini.
  - istiaprillani
    
    17 Mei 2012 pukul 00:54
    
    Udah dicoba mas. Tapi kenapa nilai Precison sm Recall nya selalu 1 ya. saya bingung apa ada yg salah gt.
    Jd begini mas, saya ada tugas mengenai hasil imputasi missing value begini:
    “Data latih hasil imputasi dan data latih asli .arff dibentuk modelnya dg menggunakan KNN classifier untuk kemudian diuji menggunakan data uji yang sama. Bila nilai Precision, Recall data hasil imputasi mendekati Precision dan Recall data asli, maka metode imputasinya berhasil”
    
    Jadi langkah saya begini:
    1. Data Asli (100 record) dibagi menjadi 2 yaitu data latih (75 record), dan data uji (25 record) *classnya dikosongkan*
    2. Data hasil imputasi (100 record) diambil data latih (75 record) saja *baris2nya sama dg yang saya ambil pada Data Asli.
    3. Saya lakukan langkah2 pada postingan diatas dengan menggunakan data latih pada poin 1 dan data latih pada poin 2 untuk mengklasifikasi data uji pad poin 1. Sehingga terbentuk 2 file data uji dari versi data asli dan data imputasi.
    4. Kemudian data uji dari versi data asli saya klasifikasikan kembali dg KNN, menggunakan “use training set” dan nilai Precision dan Recall yang keluar 1.
    5. Sama dg poin 4, data uji versi data imputasi saya klasifikasikan pke KNN, dan nilai Precision, Recall yang keluar juga 1.
    
    Nah, apakah cara saya menerjemahakan soal ini sudah tepat yaitu dengan menggunakan cara saya tsb? Karena setelah saya coba nilai Precision dan Recall nya selalu 1 baik untuk data asli maupun data hasil imputasinya. Mohon pencerahannya mgkn saya ada yg keliru 🙂
kireina sulisty

13 November 2012 pukul 09:09

Balas

mas, mau tanya..knp ya pas saya mau menggunakan test set malah katanya data train dan data testing tidak kompatibel? padahal nama atributnya sudah sama persis , kelas yang mau dijadikan tes sudah saya buat tanda “?” mohon penjelasanya mas…
- ismailsunni
  
  19 November 2012 pukul 21:54
  
  Balas
  
  waduh, saya juga bingung ngejawabnya… lha cuman diceritain. Bisa liat contoh datanya?
kireina sulisty

26 November 2012 pukul 15:35

Balas

iya mas..ternyata yang salah datanya,(masih campur) ..sekarang udah bisa, makasih ya mas….hehehheh, makasih banget sangat bermanfaat banget..
- Dewi Sri Rahayu
  
  19 Mei 2013 pukul 23:11
  
  Balas
  
  kireina sulisty :
  iya mas..ternyata yang salah datanya,(masih campur) ..sekarang udah bisa, makasih ya mas….hehehheh, makasih banget sangat bermanfaat banget..
  
  mba….aq gtu jg…tp aq msih lum bisa uga nie…gmn caranya ya???
che2

27 Maret 2013 pukul 08:53

Balas

maaf,,,mas mau tanya,,,,,bisa g’ dijelaskan kenapa yach pada waktu kita sudah masuk ke Pengujian visualisasi tree,,,,ada atribut yang tidak muncul pada pohon keputusannya.contohnya kita punya atribut 5 macam,yaitu nilai total rata-rata,nilai Bahasa indonesia,Nilai Bahasa Inggris,Nilai MM,Nilai IPA,prestasi pendukung,sama keterangan penerimaan,,,,,,,disini atribut yang tidak muncul pada saat visualisasi tree adalah atribut prestasi pendukung,,,dengan jumlah data yang diinputkan ada 100…..Mohon penjelasannya,,,,,,,,,,,,
- Ismail Sunni
  
  27 Maret 2013 pukul 18:10
  
  Balas
  
  Mungkin, atribut prestasi tambahan tidak diperlukan dalam prosesnya, bisa saja prestasi tambahan itu memiliki dependensi terhadap atribut lain.
Dewi Sri Rahayu

19 Mei 2013 pukul 23:00

Balas

mas mau nanyak…
kenapa waktu qt masukan data uji pada supplied test set itu instances a bukan jumlah datanya tp tanda tanya”?”…..
trus waktu di stars malah keluar test set not compatibel.itu gimaya ya mas…
mohon bantuannya.
leily

22 Mei 2013 pukul 15:27

Balas

terima kasih atas postingannya yang bermanfaat.
haris

19 Juli 2013 pukul 08:27

Balas

aneh, udah ngikutin tutorialnya, data yang diprediksi masih kosong,,
kenapa ya?
Adhitya Mahatva

19 November 2013 pukul 20:31

Balas

maaf saya mw tanya , saya sudah masukkan datanya tapi pas saya mw “CHOSE” dan memilih j48 ternyata warnanya abu-abu -_- , mohon segera di beri jawaban 😦 atau bisa kirim via email adhityamywordpress@gmail.com

thx sblmnya
Jose Franklin

4 Desember 2014 pukul 16:19

Balas

permisi,
saya mau tanya apakah aplikasi weka bisa di integrasi dengan aplikasi lain seperti web, java, dll karena ketika kita supplied test dan melihat hasilnya, pasti orang awam tidak akan tahu langsung hasilnya, karena berisi conffusion matrix dll
jadi seandainya bisa,
ada attribute cuaca, kelembaban, suhu, angin dan bermain atau tidak
jadi hanya tinggal menginput masing2 atribut dan ada tombol prediksi, nah dibalik tombol prediksi itu adalah algoritma weka sehingga terjawab hasilnya!
kira – kira apakah bisa ? soalnya biar saya bisa menjelaskan sidang saya dengan baik
- Ismail Sunni
  
  8 Desember 2014 pukul 08:01
  
  Balas
  
  Seharusnya, bisa. Karena WEKA ada library-nya, jadi cukup pakai library itu di web Anda.
sayyidatu

19 Desember 2014 pukul 19:48

Balas

permisi, boleh tanya nggak kalo data traning dan testingnya sama boleh nggak ya ?
atau misalkan dari data 120 yang 40 dijadikan training dan 80 dijadikan testing, trimakasihh
- Ismail Sunni
  
  5 Maret 2015 pukul 15:37
  
  Balas
  
  Boleh, memang biasanya seperti itu. Tapi lebih baik menggunakan 10-fold cross validation untuk menghindari over-fitting.
ikhwan

19 Mei 2015 pukul 09:55

Balas

mw nanya gan saya coba proses penyimpanan hasil klasikikasi dengan save result buffer..tapi gak bisa di buka kembali..tolong pencerahannya…(baru menggunakan weka)
jerry

31 Juli 2015 pukul 08:17

Balas

Mas sy punya data dalam bentuk sav lalu saya ingin mengconvert ke dalam bentuk arff gimana caranya ya? Makasih
hendri

4 Agustus 2015 pukul 12:19

Balas

Misi mas, mohon bantuannya,
Saya sudah trial dan error gak nemu solusi nih.
Selalu muncul “Problem evaluating classifier : Train and test set are not compatible”, kira” apa yang salah ya?

Data Training
sepal,lenght,in,cm,class
5.7,3.8,1.7,0.3,Iris-setosa
5.1,3.8,1.5,0.3,Iris-setosa
5.4,3.4,1.7,0.2,Iris-setosa
5.1,3.7,1.5,0.4,Iris-setosa
4.6,3.6,1.0,0.2,Iris-setosa
5.1,3.3,1.7,0.5,Iris-setosa
4.8,3.4,1.9,0.2,Iris-setosa
5.8,2.7,4.1,1.0,Iris-versicolor
6.2,2.2,4.5,1.5,Iris-versicolor
5.6,2.5,3.9,1.1,Iris-versicolor
5.9,3.2,4.8,1.8,Iris-versicolor
6.1,2.8,4.0,1.3,Iris-versicolor
6.3,2.5,4.9,1.5,Iris-versicolor
6.1,2.8,4.7,1.2,Iris-versicolor
6.4,2.9,4.3,1.3,Iris-versicolo
7.7,3.0,6.1,2.3,Iris-virginica
6.3,3.4,5.6,2.4,Iris-virginica
6.4,3.1,5.5,1.8,Iris-virginica
6.0,3.0,4.8,1.8,Iris-virginica
6.9,3.1,5.4,2.1,Iris-virginica
6.7,3.1,5.6,2.4,Iris-virginica
6.9,3.1,5.1,2.3,Iris-virginica
5.8,2.7,5.1,1.9,Iris-virginica

Data testing yang saya masukan ke dalam Supplied test set
sepal,lenght,in,cm,class
sepal,lenght,in,cm,class
5.4,3.7,1.5,0.2,?
4.8,3.4,1.6,0.2,?
4.8,3.0,1.4,0.1,?
4.3,3.0,1.1,0.1,?
5.8,4.0,1.2,0.2,?
5.7,4.4,1.5,0.4,?
5.4,3.9,1.3,0.4,?
5.1,3.5,1.4,0.3,?
5.0,2.0,3.5,1.0,?
5.9,3.0,4.2,1.5,?
6.0,2.2,4.0,1.0,?
6.1,2.9,4.7,1.4,?
5.6,2.9,3.6,1.3,?
6.7,3.1,4.4,1.4,?
5.6,3.0,4.5,1.5,?
6.8,3.2,5.9,2.3,?
6.7,3.3,5.7,2.5,?
6.7,3.0,5.2,2.3,?
6.3,2.5,5.0,1.9,?
6.5,3.0,5.2,2.0,?
6.2,3.4,5.4,2.3,?
5.9,3.0,5.1,1.8,?

Data ini saya gunakan untuk latihan, dan saya ambil dari UCI.
Makasih mas atas jawabanya.
Aufa

1 November 2015 pukul 11:30

Balas

Cara untuk ngeliat akurasinya gmn?
Mgkn ada yg bisa bantu saya
nursiah

3 Juni 2017 pukul 11:30

Balas

tanya mas, saya mau melakukan tahap asosiasion di weka, namun apriorinya disabble, apa harus melakukan tahan estimation dan lainnya dulu baru bisa melakukan tahap asosiation?
Tegar

3 Maret 2018 pukul 13:24

Balas

Makasih kaka bermanfaat banget ngebantu banget nih 😁 sukses terus ya
rosss

10 November 2021 pukul 16:52

Balas

kak kok hasil visualisasi eror tidak bisa di save kenapa ya