Beranda > Data Mining, Klasifikasi, Tak Berkategori > Cara menggunakan hasil klasifikasi pada WEKA

Cara menggunakan hasil klasifikasi pada WEKA

Setelah melakukan pemilihan metode untuk melakukan klasifikasi, dan sudah menemukan metode yang paling cocok, tentu kita akan menggunakan hasilnya untuk memprediksi hasil klasifikasi dari sekumpulan data yang baru. Di sini, akan dijelaskan mengenai cara menggunakan hasil klasifikasi tersebut di WEKA.

Anggaplah kita sudah menemukan metode yang pas. Misal, dalam kasus ini, dengan J48 alias pohon C4.5. Catatan : kalau gambarnya tidak jelas, bisa diklik untuk memperbesar.

  1. Pilih test options–>supplied test set–>klik set

    Test options

    Test options

  2. Pilih file yang akan diprediksi
    Pilih file

    Pilih file

    Kita bisa menggunakan file dari komputer kita atau dari jaringan. Untuk contoh kali ini, akan menggunakan file lokal. File yang bisa digunakan sebagai data, harus memiliki atribut yang sama dengan data training. Mulai dari banyak atribut dan tipe atribut. Untuk data tes yang akan diprediksi kelasnya, isi kelas yang akan diprediksi dengan tanda tanya “?”
    Klik close untuk melanjutkan.

  3. Kemudian klik start untuk memulai prediksi
    Klik Start

    Klik Start

    Start saya tandai dengan warna merah. Setelah mengklik start, WEKA akan melakukan proses, dan memunculkan sesuatu di bagian output (warna biru). Tapi, kok semuanya 0 ? Tenang saja, memang seperti itu. Kita belum selesai.

  4. Klik kanan pada result list
    Klik kanan, Visualize Classifier Error

    Klik kanan, Visualize Classifier Error

    Selanjutnya, pada kolom result list, klik kanan pada hasil yang baru saja Anda jalankan. Selanjutnya, pilih “Visualize Classifier Error

  5. Muncul jendela baru
    Jendela baru

    Jendela baru

    Untuk kali ini, tidak usah pedulikan gambar-gambar aneh tersebut. Cukup lanjutkan dengan klik save. Dan simpan sesuai dengan nama favorit Anda. :). Saya menyimpan dengan nama lontong.arff.

  6. Selesai – Baca hasil.
    Setelah langkah 5, sebenarnya sudah selesai. Tapi, kita lanjutkan untuk melihat prediksi dari si WEKA ini.  Cari file yang baru saja Anda simpan. Bisa langsung Anda buka dengan notepad++ atau cara yang lebih enak dilihat.
  7. Cara lebih enak – ARFF viewer.
    Buka lagi jendela WEKA yang paling pertama muncul ketika Anda menjalankan WEKA. Pilih tab tools –> pilih ARFF viewer.

    Pilh arff viewer

    Pilh arff viewer

  8. Pilih file yang akan dibuka
    Akan muncul jendela baru. Langsung pilih file->open->pilih file Anda
  9. Tara…
    Hasil

    Hasil

    Bisa dilihat, kolom yang saya warnai merah merupakan prediksi yang dilakukan oleh WEKA

    Setelah melakukan pemilihan metode untuk melakukan klasifikasi, dan sudah menemukan metode yang paling cocok, tentu kita akan menggunakan hasilnya untuk memprediksi hasil klasifikasi dari sekumpulan data yang baru. Di sini, akan dijelaskan mengenai cara menggunakan hasil klasifikasi tersebut di WEKA.

Sebenarnya, langkahnya cukup sederhana. Cuman, gambarnya saja yang kegedean.

Referensi : http://maya.cs.depaul.edu/classes/ect584/weka/classify.html
  1. Tita
    27 Juni 2011 pukul 11:49

    hip hip horeeee.. 😀
    alhamdulillah..
    hatur nuhun, tengkyu banget yah..

    ada lagi..
    (maaf, nanya terus..)
    rule yang uda jadi dibuat, bisa g digunakan untuk mengklasifikasikan data baru?
    kalo bisa gimana caranya?

    greget ih kamu meni bisaan.. hehe
    makasih banyak yah 😀

    • 27 Juni 2011 pukul 16:55

      lhoh? bukannya kayak yang ditulis dipostingan ini? menggunakan hasil klasifikasi buat memprediksi data baru…
      atau saya salah nangkep maksudnya?

      he.. ndak papa… saya juga sedang belajar kok… kalau ada yang nanya, malah jadi sekalian belajarnya…

  2. Tita
    29 Juni 2011 pukul 08:58

    menurut saya mah postingan ini menjelaskan cara melihat hasil klasifikasi dari data yang sudah dibuat pohon keputusannya..
    yang saya tanyakan, saya permisalan aja yah:
    saya ada data 1000, saya gunakan 700 untuk di training jadi puhon keputusan dan jadi rule. nah yang 300 lagi kan belum diapa-apakan, saya mau klasifikasikan yang sisa itu menggunakan rule yang sudah jadi tersebut, tanpa harus di training lagi. nah di weka ada g caranya???

  3. 29 Juni 2011 pukul 09:57

    Oh, maksudnya, di save hasil rule nya supaya bisa digunakan di lain waktu?
    Kalau dari hasil eksplorasi saya, hal itu memungkinkan, karena WEKA mampu menggenerate kode Java untuk beberapa metode tertentu, misal J48. Caranya, sebelum memulai klasifikasi, pilih more options, pada “test options”, selanjutnya, tandau pada pilihan “Output source code” *terletak di bagian paling bawah. Nanti, WEKA akan menggenerate source dalam Java.

    Tapi, saya sendiri belum sempat mencoba source tersebut.

  4. Tita
    29 Juni 2011 pukul 11:12

    hem, uda dicoba, trus gimana lagi?
    apa harus buat programnya di java?
    lagi libur?
    bisa ol ym?

    • 29 Juni 2011 pukul 13:40

      iya, tinggal diimplementasikan ke Java.
      Iya, sedang libur, tanggal merah. Kalau sedang terkoneksi internet, saya ol ym.

  5. Tita
    30 Juni 2011 pukul 10:05

    saya lupa ym nya uda di uninstal, hehe
    biasanya kalo ol kapan aja?
    saya mau coba dulu yang g pake aplikasi dan g mengklasifikasikan kasus baru..
    doakan ya!!

    makasih banyak :DD

    • 30 Juni 2011 pukul 16:56

      Kalau OL, biasanya malem sih.
      Semoga sukses…

  6. Tita
    1 Juli 2011 pukul 10:48

    yahh..
    hehe..
    makasih yah 😀

  7. 26 Juli 2011 pukul 21:04

    saya mau buat aplikasi data mining gunakan bahasa pemrograman java tp saya buta sama sekali dengan weka, help me tutorial dasar gunakan weka gan….help me send my email muhammadfazeriansyah@gmail.com/muhammadfazeriansyah@rocketmail.com. Tolong saya……terimakasih sebanyak banyaknya buat yg bisa menolong saya.

  8. 19 Agustus 2011 pukul 15:06

    maaf mengganggu….saya Agus, mau nanya, hasil dari visualisasi tree pada weka, gaimna kita bisa menyimpan hasil gambarnya ke dalam microshop work/ jpg??
    mohon penyelasannya. sebelmnya saya ucapkan terima kasih.
    klu udah ada kirim ke email saya aja: agoezt21@gmail.com

  9. 29 Agustus 2011 pukul 06:06

    tolong……tolong……….

  10. vivi
    11 Oktober 2011 pukul 19:31

    maaf,..
    mau tnya donk,..kalo diatas kan yang di jelasin hasil klasifikasinya,bisa dikatakan data tesnya..
    kalo untuk training datanya gimana cara nentuinya dl tuh??
    soalnya kan training data itu uda ada kls nya kalo dlm knn..

    thank’s

    vivi

    • 11 Oktober 2011 pukul 21:29

      maksudnya nentuin apanya training data ya?

  11. andien
    20 Oktober 2011 pukul 07:46

    alhmdulillah..makasih banyak ya mas.. postingannya sgt membantu untuk tugas akhirku.. mohon bimbingannya ya mas.. terimakasih

  12. Ching
    23 Januari 2012 pukul 21:27

    tolong beritau cara dari awal untuk menggunakan Weka, makasih sangat maz…

    • 24 Januari 2012 pukul 00:07

      saya rasa, postingan di blog ini sudah cukup untuk sekadar digunakan sebagai panduan menggunakan WEKA. Mulai dari file input hingga melakukan klasifikasi. Silahkan dibaca. 🙂

  13. agus triono
    11 Mei 2012 pukul 07:36

    maaf mau nanya lagi, gaimana munculkan klasifikasi menggunakan id3 pada weka soalnya yg muncul pada choose hanya j48 sedangkan klu kita milih id3 warna abu-abu dak tudak bisa distar.
    mohon bantuannya

    • 11 Mei 2012 pukul 08:53

      Kalau versi aslinya memang tidak bisa. Kalau ingin memvisualisasikan yang id3, bisa coba Modified WEKA. Silahkan baca di http://davis.wpi.edu/~xmdv/weka/.
      Saya sendiri belum mencobanya, tetapi di sana dikatakan : “This modified version of Weka also supports the Tree Visualizer for the ID3 algorithm.”
      Selamat mencoba 🙂

  14. agus triono
    14 Mei 2012 pukul 23:46

    sory mas nanya lagi, klu masalah yang saya tanyakan sebelumnya Alhamdulillah sudah dapat soalnya data saya masih bercampur dengn data kontinu jadi harus di deskritkan terlebih dahulu. cuma yang saya tanyakan sekarang adalah untuk menampilkan visual tree nya yg nggak bisa. gaimna ya???
    dari kmren blum ketemu solusinya….:)

  15. istiaprillani
    16 Mei 2012 pukul 15:54

    salam kenal mas mau tanya ttg beberapa hal yang masih saya kurang mengerti. semoga bisa membantu 🙂
    jadi gini, saya punya data asli A (100 record) lalu saya split menjadi data training (75record) dan data testing (25 record). kemudian saya mau mengeluarkan/menghasilkan nilai performansi Precision, dan Recall dari data A tsb menggunakan klasifikasi KNN pada weka.
    Bisa bantu saya ngsi tau step by step yg harus saya lakuin mas?
    Terimakasih sebelumnya.

  16. istiaprillani
    16 Mei 2012 pukul 19:00

    Oiya, sama mau tanya kl misalnya dari data training yg saya mksd diatas mau dibentuk modelnya menggunakan KNN classifier gimana ya caranya? trus data testing nya mau diuji pake model yg dihasilkan itu. Gimana ya mas solusinya? Mohon bantuannya, makasi 🙂

    • 17 Mei 2012 pukul 00:21

      1. Untuk memisah menjadi 75 data training dan 25 data tes sama seperti mengklasifikasikan biasa. Hanya, pada test option, pilihlah percentage split, dengan nilai 75%. Hal ini berarti 75% dari data kita akan digunakan sebagai data training, dan 25% digunakan sebagai data test.
      2. Kalau KNN, pilih classifiernya IBk. Untuk mengetesnya, dilakukan dengan cara biasa. Kalau kita punya data test yang benar-benar berbeda dari data pembentuk model, gunakan test option use training set.

      Saran : Baca tulisan saya mengenai “Test Options pada WEKA” di blog ini.

      • istiaprillani
        17 Mei 2012 pukul 00:54

        Udah dicoba mas. Tapi kenapa nilai Precison sm Recall nya selalu 1 ya. saya bingung apa ada yg salah gt.
        Jd begini mas, saya ada tugas mengenai hasil imputasi missing value begini:
        “Data latih hasil imputasi dan data latih asli .arff dibentuk modelnya dg menggunakan KNN classifier untuk kemudian diuji menggunakan data uji yang sama. Bila nilai Precision, Recall data hasil imputasi mendekati Precision dan Recall data asli, maka metode imputasinya berhasil”

        Jadi langkah saya begini:
        1. Data Asli (100 record) dibagi menjadi 2 yaitu data latih (75 record), dan data uji (25 record) *classnya dikosongkan*
        2. Data hasil imputasi (100 record) diambil data latih (75 record) saja *baris2nya sama dg yang saya ambil pada Data Asli.
        3. Saya lakukan langkah2 pada postingan diatas dengan menggunakan data latih pada poin 1 dan data latih pada poin 2 untuk mengklasifikasi data uji pad poin 1. Sehingga terbentuk 2 file data uji dari versi data asli dan data imputasi.
        4. Kemudian data uji dari versi data asli saya klasifikasikan kembali dg KNN, menggunakan “use training set” dan nilai Precision dan Recall yang keluar 1.
        5. Sama dg poin 4, data uji versi data imputasi saya klasifikasikan pke KNN, dan nilai Precision, Recall yang keluar juga 1.

        Nah, apakah cara saya menerjemahakan soal ini sudah tepat yaitu dengan menggunakan cara saya tsb? Karena setelah saya coba nilai Precision dan Recall nya selalu 1 baik untuk data asli maupun data hasil imputasinya. Mohon pencerahannya mgkn saya ada yg keliru 🙂

  17. kireina sulisty
    13 November 2012 pukul 09:09

    mas, mau tanya..knp ya pas saya mau menggunakan test set malah katanya data train dan data testing tidak kompatibel? padahal nama atributnya sudah sama persis , kelas yang mau dijadikan tes sudah saya buat tanda “?” mohon penjelasanya mas…

    • 19 November 2012 pukul 21:54

      waduh, saya juga bingung ngejawabnya… lha cuman diceritain. Bisa liat contoh datanya?

  18. kireina sulisty
    26 November 2012 pukul 15:35

    iya mas..ternyata yang salah datanya,(masih campur) ..sekarang udah bisa, makasih ya mas….hehehheh, makasih banget sangat bermanfaat banget..

    • 19 Mei 2013 pukul 23:11

      kireina sulisty :
      iya mas..ternyata yang salah datanya,(masih campur) ..sekarang udah bisa, makasih ya mas….hehehheh, makasih banget sangat bermanfaat banget..

      mba….aq gtu jg…tp aq msih lum bisa uga nie…gmn caranya ya???

  19. che2
    27 Maret 2013 pukul 08:53

    maaf,,,mas mau tanya,,,,,bisa g’ dijelaskan kenapa yach pada waktu kita sudah masuk ke Pengujian visualisasi tree,,,,ada atribut yang tidak muncul pada pohon keputusannya.contohnya kita punya atribut 5 macam,yaitu nilai total rata-rata,nilai Bahasa indonesia,Nilai Bahasa Inggris,Nilai MM,Nilai IPA,prestasi pendukung,sama keterangan penerimaan,,,,,,,disini atribut yang tidak muncul pada saat visualisasi tree adalah atribut prestasi pendukung,,,dengan jumlah data yang diinputkan ada 100…..Mohon penjelasannya,,,,,,,,,,,,

    • 27 Maret 2013 pukul 18:10

      Mungkin, atribut prestasi tambahan tidak diperlukan dalam prosesnya, bisa saja prestasi tambahan itu memiliki dependensi terhadap atribut lain.

  20. 19 Mei 2013 pukul 23:00

    mas mau nanyak…
    kenapa waktu qt masukan data uji pada supplied test set itu instances a bukan jumlah datanya tp tanda tanya”?”…..
    trus waktu di stars malah keluar test set not compatibel.itu gimaya ya mas…
    mohon bantuannya.

  21. leily
    22 Mei 2013 pukul 15:27

    terima kasih atas postingannya yang bermanfaat.

  22. haris
    19 Juli 2013 pukul 08:27

    aneh, udah ngikutin tutorialnya, data yang diprediksi masih kosong,,
    kenapa ya?

  23. 19 November 2013 pukul 20:31

    maaf saya mw tanya , saya sudah masukkan datanya tapi pas saya mw “CHOSE” dan memilih j48 ternyata warnanya abu-abu -_- , mohon segera di beri jawaban 😦 atau bisa kirim via email adhityamywordpress@gmail.com

    thx sblmnya

  24. Jose Franklin
    4 Desember 2014 pukul 16:19

    permisi,
    saya mau tanya apakah aplikasi weka bisa di integrasi dengan aplikasi lain seperti web, java, dll karena ketika kita supplied test dan melihat hasilnya, pasti orang awam tidak akan tahu langsung hasilnya, karena berisi conffusion matrix dll
    jadi seandainya bisa,
    ada attribute cuaca, kelembaban, suhu, angin dan bermain atau tidak
    jadi hanya tinggal menginput masing2 atribut dan ada tombol prediksi, nah dibalik tombol prediksi itu adalah algoritma weka sehingga terjawab hasilnya!
    kira – kira apakah bisa ? soalnya biar saya bisa menjelaskan sidang saya dengan baik

    • 8 Desember 2014 pukul 08:01

      Seharusnya, bisa. Karena WEKA ada library-nya, jadi cukup pakai library itu di web Anda.

  25. sayyidatu
    19 Desember 2014 pukul 19:48

    permisi, boleh tanya nggak kalo data traning dan testingnya sama boleh nggak ya ?
    atau misalkan dari data 120 yang 40 dijadikan training dan 80 dijadikan testing, trimakasihh

    • 5 Maret 2015 pukul 15:37

      Boleh, memang biasanya seperti itu. Tapi lebih baik menggunakan 10-fold cross validation untuk menghindari over-fitting.

  26. ikhwan
    19 Mei 2015 pukul 09:55

    mw nanya gan saya coba proses penyimpanan hasil klasikikasi dengan save result buffer..tapi gak bisa di buka kembali..tolong pencerahannya…(baru menggunakan weka)

  27. jerry
    31 Juli 2015 pukul 08:17

    Mas sy punya data dalam bentuk sav lalu saya ingin mengconvert ke dalam bentuk arff gimana caranya ya? Makasih

  28. hendri
    4 Agustus 2015 pukul 12:19

    Misi mas, mohon bantuannya,
    Saya sudah trial dan error gak nemu solusi nih.
    Selalu muncul “Problem evaluating classifier : Train and test set are not compatible”, kira” apa yang salah ya?

    Data Training
    sepal,lenght,in,cm,class
    5.7,3.8,1.7,0.3,Iris-setosa
    5.1,3.8,1.5,0.3,Iris-setosa
    5.4,3.4,1.7,0.2,Iris-setosa
    5.1,3.7,1.5,0.4,Iris-setosa
    4.6,3.6,1.0,0.2,Iris-setosa
    5.1,3.3,1.7,0.5,Iris-setosa
    4.8,3.4,1.9,0.2,Iris-setosa
    5.8,2.7,4.1,1.0,Iris-versicolor
    6.2,2.2,4.5,1.5,Iris-versicolor
    5.6,2.5,3.9,1.1,Iris-versicolor
    5.9,3.2,4.8,1.8,Iris-versicolor
    6.1,2.8,4.0,1.3,Iris-versicolor
    6.3,2.5,4.9,1.5,Iris-versicolor
    6.1,2.8,4.7,1.2,Iris-versicolor
    6.4,2.9,4.3,1.3,Iris-versicolo
    7.7,3.0,6.1,2.3,Iris-virginica
    6.3,3.4,5.6,2.4,Iris-virginica
    6.4,3.1,5.5,1.8,Iris-virginica
    6.0,3.0,4.8,1.8,Iris-virginica
    6.9,3.1,5.4,2.1,Iris-virginica
    6.7,3.1,5.6,2.4,Iris-virginica
    6.9,3.1,5.1,2.3,Iris-virginica
    5.8,2.7,5.1,1.9,Iris-virginica

    Data testing yang saya masukan ke dalam Supplied test set
    sepal,lenght,in,cm,class
    sepal,lenght,in,cm,class
    5.4,3.7,1.5,0.2,?
    4.8,3.4,1.6,0.2,?
    4.8,3.0,1.4,0.1,?
    4.3,3.0,1.1,0.1,?
    5.8,4.0,1.2,0.2,?
    5.7,4.4,1.5,0.4,?
    5.4,3.9,1.3,0.4,?
    5.1,3.5,1.4,0.3,?
    5.0,2.0,3.5,1.0,?
    5.9,3.0,4.2,1.5,?
    6.0,2.2,4.0,1.0,?
    6.1,2.9,4.7,1.4,?
    5.6,2.9,3.6,1.3,?
    6.7,3.1,4.4,1.4,?
    5.6,3.0,4.5,1.5,?
    6.8,3.2,5.9,2.3,?
    6.7,3.3,5.7,2.5,?
    6.7,3.0,5.2,2.3,?
    6.3,2.5,5.0,1.9,?
    6.5,3.0,5.2,2.0,?
    6.2,3.4,5.4,2.3,?
    5.9,3.0,5.1,1.8,?

    Data ini saya gunakan untuk latihan, dan saya ambil dari UCI.
    Makasih mas atas jawabanya.

  29. Aufa
    1 November 2015 pukul 11:30

    Cara untuk ngeliat akurasinya gmn?
    Mgkn ada yg bisa bantu saya

  30. nursiah
    3 Juni 2017 pukul 11:30

    tanya mas, saya mau melakukan tahap asosiasion di weka, namun apriorinya disabble, apa harus melakukan tahan estimation dan lainnya dulu baru bisa melakukan tahap asosiation?

  31. Tegar
    3 Maret 2018 pukul 13:24

    Makasih kaka bermanfaat banget ngebantu banget nih 😁 sukses terus ya

  32. 10 November 2021 pukul 16:52

    kak kok hasil visualisasi eror tidak bisa di save kenapa ya

  1. No trackbacks yet.

Tinggalkan Balasan ke istiaprillani Batalkan balasan