Deteksi Persentase Kemiripan Teks Menggunakkan Algoritma Cosine Similarity
Penerapan Algoritma Elgamal Untuk Enkripsi Dan Dekripsi File Teks
Sistem Pakar Untuk Mendiagnosa Penyakit Kulit Pada Manusia Menggunakkan Metode Certainty Factor (CF)
Penerapan algoritma nearest neighbor untuk memprediksi data pengajuan pinjaman calon nasabah baru
Pengelompokkan data menggunakkan algoritma k-means clustering
Sistem Pendukung Keputusan Seleksi Karyawan Baru Menggunakkan Algoritma Topsis
Implementasi Program Algoritma RSA Untuk Enkripsi Dan Dekripsi File Teks
Perhitungan Metode Fuzzy AHP Dalam Pemilihan Karyawan Terbaik
Menurut kamus besar bahasa Indonesia, prediksi adalah hasil dari kegiatan memprediksi atau meramal atau memperkirakan. Pengertian prediksi secara istilah akan sangat tergantung pada konteks atau permasalahannya. Berbeda dengan pengertian prediksi secara bahasa yang berarti ramalan atau perkiraaan yang sudah menjadi pengertian yang baku.
Di dalam Data Mining, prediksi hamper sama dengan klasifikasi dan estimasi, kecuali bahwa prediksi nilai dari hasil akan ada di masa mendatang (Kusrini dan Emha Taufiq Luthfi, 2009).
Prediksi digunakan untuk memperkirakan nilai masa mendatang, misalnya memprediksi stok barang satu tahun ke depan. Fungsi ini mencakup metode Neural Network, Decision Tree, dan Nearest Neighbor. Prediksi menggunakan beberapa variable atatu field-field basis data untuk memprediksi nilai-nilai variabel masa mendatang yang diperlukan, yang belum diketahui saat ini
Nearest Neighbor adalah pendekatan untuk mencari kasus dengan menghitung kedekatan antara kasus baru dengan kasus lama, yaitu berdasarkan pada pencocokan bobot dari sejumlah fitur yang ada (Kusrini dan Emha Taufiq Luthfi, 2009).
Misalkan diinginkan untuk mencari solusi terhadap seorang pasien baru dengan menggunakan solusi dari pasien terdahulu. Untuk mencari kasus pasien mana yang akan digunakan maka dihitung kedekatan kasus pasien baru dengan semua kasus pasien lama. Kasus pasien lama dengan kedekatan terbesarlah yang akan diambil solusinya untuk digunakan pada kasus pasien baru (Kusrini dan Emha Taufiq Luthfi, 2009)
Adapun rumus untuk melakukan penghitungan kedekatan antara 2 kasus adalah sebagai berikut :
dengan keterangan sebagai berikut :
T : kasus baru
S : kasus yang ada dalam penyimpanan
n : jumlah atribut dalam masing-masing kasus
i : atribut individu antara 1 s/d n
f : fungsi similarity atribut i antara kasus T
w : bobot yang diberikan pada atribut ke i
Data penentuan resiko pinjaman dana di Bank Perkreditan Rakyat terdiri dari 8 atribut, dimana 7 atribut prediktor dan 1 atribut label, seperti yang ditunjukkan pada tabel berikut :
Tabel 1 : Daftar Atribut dan Nilai Atributnya | |
---|---|
Atribut | Nilai Atribut |
Jumlah Pinjaman |
<= 20.000.000 > 20.000.000 s/d <= 50.000.000 > 50.000.000 s/d <= 75.000.000 > 75.000.000 |
Tujuan Pinjam |
Investasi Konsumtif Modal Kerja |
Jangka Waktu |
12 Bulan 24 Bulan 36 Bulan 48 Bulan 60 Bulan 72 Bulan |
Kondisi Debitur |
Cukup Baik Baik Sangat Baik |
Pekerjaan Debitur |
Ibu Rumah Tangga Mahasiswa PNS Karyawan Pegawai Swasta Pegawai Pajak Wiraswasta |
Penghasilan Debitur per Bulan |
< 2.500.000 2.500.000 s/d 6.500.000 > 6.500.000 |
Jaminan |
BPKB kendaraan Roda Dua BPKB kendaraan Roda Empat Sertifikat Tanah Sertifikat Rumah SK PNS Tanpa Agunan |
Resiko Peminjaman | ? |
Dari pengelompokkan atribut diatas, maka langkah selanjutnya adalah melakukan analisa proses dalam data mining dengan menggunakan Algoritma Nearest Neighbor.
Untuk mengukur jarak masing-masing atribut, perlu diberikan bobot. Bobot yang diberikan, nilainya antara 0 dan 1, dimana 0 menandakan atribut tidak berpengaruh dan 1 menandakan atribut sangat berpengaruh.
Pemberian bobot pada masing-masing atribut dapat dilihat pada tabel berikut :
Tabel 2 : Bobot Pada Masing-Masing Prediktor | ||
---|---|---|
No. | Atribut | Bobot |
1. | Jumlah Pinjaman | 0.8 |
2. | Tujuan Pinjam | 0.8 |
3. | Jangka Waktu | 0.8 |
4. | Kondisi Debitur | 0.6 |
5. | Pekerjaan Debitur | 0.6 |
6. | Penghasilan Debitur per Bulan | 0.6 |
7. | Jaminan | 0.5 |
1. Untuk Kedekatan nilai atribut Jumlah Pinjaman ditunjukkan di tabel berikut :
Tabel 3 : Kedekatan Nilai Atribut Jumlah Pinjaman | ||
---|---|---|
No. | Atribut Jumlah Pinjaman | Nilai |
1. | A1 | 100 |
2. | A2 | 80 |
3. | A3 | 60 |
4. | A4 | 40 |
Setelah dilakukan klasifikasi Jumlah Pinjaman, berikutnya melakukan pencarian nilai kedekatan atribut Jumlah Pinjaman yaitu dilihat pada tabel berikut :
A1 | A2 | A3 | A4 | |
---|---|---|---|---|
A1 | 1 | 0.8 | 0.6 | 0.4 |
A2 | 0.8 | 1 | 0.75 | 0.5 |
A3 | 0.6 | 0.75 | 1 | 0.667 |
A4 | 0.4 | 0.5 | 0.667 | 1 |
2. Kedekatan nilai atribut Tujuan Pinjam ditunjukkan di tabel berikut :
Tabel 4 : Kedekatan Nilai Atribut Tujuan Pinjam | ||
---|---|---|
No. | Atribut Tujuan Pinjam | Nilai |
1. | B1 | 100 |
2. | B2 | 70 |
3. | B3 | 40 |
Setelah dilakukan klasifikasi Tujuan Pinjam, berikutnya melakukan pencarian nilai kedekatan atribut Tujuan Pinjam yaitu dilihat pada tabel berikut :
B1 | B2 | B3 | |
---|---|---|---|
B1 | 1 | 0.7 | 0.4 |
B2 | 0.7 | 1 | 0.571 |
B3 | 0.4 | 0.571 | 1 |
3. Kedekatan nilai atribut Jangka Waktu ditunjukkan di tabel berikut :
Tabel 5 : Kedekatan Nilai Atribut Jangka Waktu | ||
---|---|---|
No. | Atribut Jangka Waktu | Nilai |
1. | C1 | 100 |
2. | C2 | 90 |
3. | C3 | 80 |
4. | C4 | 70 |
5. | C5 | 60 |
6. | C6 | 50 |
Setelah dilakukan klasifikasi Jangka Waktu, berikutnya melakukan pencarian nilai kedekatan atribut Jangka Waktu yaitu dilihat pada tabel berikut :
C1 | C2 | C3 | C4 | C5 | C6 | |
---|---|---|---|---|---|---|
C1 | 1 | 0.9 | 0.8 | 0.7 | 0.6 | 0.5 |
C2 | 0.9 | 1 | 0.889 | 0.778 | 0.667 | 0.556 |
C3 | 0.8 | 0.889 | 1 | 0.875 | 0.75 | 0.625 |
C4 | 0.7 | 0.778 | 0.875 | 1 | 0.857 | 0.714 |
C5 | 0.6 | 0.667 | 0.75 | 0.857 | 1 | 0.833 |
C6 | 0.5 | 0.556 | 0.625 | 0.714 | 0.833 | 1 |
4. Kedekatan nilai atribut Kondisi Debitur ditunjukkan di tabel berikut :
Tabel 6 : Kedekatan Nilai Atribut Kondisi Debitur | ||
---|---|---|
No. | Atribut Kondisi Debitur | Nilai |
1. | D1 | 100 |
2. | D2 | 70 |
3. | D3 | 40 |
Setelah dilakukan klasifikasi Kondisi Debitur, berikutnya melakukan pencarian nilai kedekatan atribut Kondisi Debitur yaitu dilihat pada tabel berikut :
D1 | D2 | D3 | |
---|---|---|---|
D1 | 1 | 0.7 | 0.4 |
D2 | 0.7 | 1 | 0.571 |
D3 | 0.4 | 0.571 | 1 |
5. Kedekatan nilai atribut Pekerjaan Debitur ditunjukkan di tabel berikut :
Tabel 7 : Kedekatan Nilai Atribut Pekerjaan Debitur | ||
---|---|---|
No. | Atribut Pekerjaan Debitur | Nilai |
1. | E1 | 100 |
2. | E2 | 90 |
3. | E3 | 80 |
4. | E4 | 70 |
5. | E5 | 60 |
6. | E6 | 50 |
Setelah dilakukan klasifikasi Pekerjaan Debitur, berikutnya melakukan pencarian nilai kedekatan atribut Pekerjaan Debitur yaitu dilihat pada tabel berikut :
E1 | E2 | E3 | E4 | E5 | E6 | |
---|---|---|---|---|---|---|
E1 | 1 | 0.9 | 0.8 | 0.7 | 0.6 | 0.5 |
E2 | 0.9 | 1 | 0.889 | 0.778 | 0.667 | 0.556 |
E3 | 0.8 | 0.889 | 1 | 0.875 | 0.75 | 0.625 |
E4 | 0.7 | 0.778 | 0.875 | 1 | 0.857 | 0.714 |
E5 | 0.6 | 0.667 | 0.75 | 0.857 | 1 | 0.833 |
E6 | 0.5 | 0.556 | 0.625 | 0.714 | 0.833 | 1 |
6. Kedekatan nilai atribut Penghasilan Debitur Per Bulan ditunjukkan di tabel berikut :
Tabel 8 : Kedekatan Nilai Atribut Penghasilan Debitur Per Bulan | ||
---|---|---|
No. | Atribut Penghasilan Debitur Per Bulan | Nilai |
1. | F1 | 100 |
2. | F2 | 70 |
3. | F3 | 40 |
Setelah dilakukan klasifikasi Penghasilan Debitur Per Bulan, berikutnya melakukan pencarian nilai kedekatan atribut Penghasilan Debitur Per Bulan yaitu dilihat pada tabel berikut :
F1 | F2 | F3 | |
---|---|---|---|
F1 | 1 | 0.7 | 0.4 |
F2 | 0.7 | 1 | 0.571 |
F3 | 0.4 | 0.571 | 1 |
7. Kedekatan nilai atribut Jaminan ditunjukkan di tabel berikut :
Tabel 9 : Kedekatan Nilai Atribut Jaminan | ||
---|---|---|
No. | Atribut Jaminan | Nilai |
1. | G1 | 100 |
2. | G2 | 90 |
3. | G3 | 80 |
4. | G4 | 70 |
5. | G5 | 60 |
6. | G6 | 50 |
Setelah dilakukan klasifikasi Jaminan, berikutnya melakukan pencarian nilai kedekatan atribut Jaminan yaitu dilihat pada tabel berikut :
G1 | G2 | G3 | G4 | G5 | G6 | |
---|---|---|---|---|---|---|
G1 | 1 | 0.9 | 0.8 | 0.7 | 0.6 | 0.5 |
G2 | 0.9 | 1 | 0.889 | 0.778 | 0.667 | 0.556 |
G3 | 0.8 | 0.889 | 1 | 0.875 | 0.75 | 0.625 |
G4 | 0.7 | 0.778 | 0.875 | 1 | 0.857 | 0.714 |
G5 | 0.6 | 0.667 | 0.75 | 0.857 | 1 | 0.833 |
G6 | 0.5 | 0.556 | 0.625 | 0.714 | 0.833 | 1 |
Setelah menentukan kedekatan nilai atribut dari masing-masing atribut prediktor, maka proses selanjutnya adalah melakukan proses perhitungan berdasarkan data training yang akan digunakan.
Pada uji coba ini, digunakan 3 record sample data training dari 65 record data training.
Sample data training yang akan digunakan dapat dilihat pada tabel berikut :
Tabel 10 : Sample data training | ||||||||
---|---|---|---|---|---|---|---|---|
No. | Jumlah Pinjaman (Rp) | Tujuan Pinjam (Jenis Kredit) | Jangka Waktu | Kondisi Debitur saat ini | Pekerjaan Debitur | Penghasilan / Bln (Rp.) | Jaminan | Resiko |
1. | > 20.000.000 s/d <= 50.000.000 | Modal Kerja | 36 Bulan | Cukup Baik | Pegawai Swasta | 2.500.000 s/d 6.500.000 | Sertifikat Tanah | Sedang |
2. | <= 20.000.000 | Modal Kerja | 12 Bulan | Baik | Wiraswasta | < 2.500.000 | BPKB Kendaraan Roda Dua | Tinggi |
3. | <= 20.000.000 | Konsumtif | 36 Bulan | Baik | Pegawai Swasta | 2.500.000 s/d 6.500.000 | Kendaraan Roda Empat | Rendah |
Misalkan ada kasus baru pada data testing dengan nilai atribut seperti pada Tabel 11. Kasus baru tersebut akan dihitung kedekatannya dengan kasus lama yang terdapat pada data training table 10
Tabel 11 : Data Testing | |||||||
---|---|---|---|---|---|---|---|
No. | Jumlah Pinjaman (Rp) | Tujuan Pinjam (Jenis Kredit) | Jangka Waktu | Kondisi Debitur saat ini | Pekerjaan Debitur | Penghasilan / Bln (Rp.) | Jaminan |
4. | > 20.000.000 s/d <= 50.000.000 | Konsumtif | 60 Bulan | Baik | Pegawai Swasta | 2.500.000 s/d 6.500.000 | BPKB Kendaraan Roda Dua |
Perhitungan kedekatan kasus baru pada data testing pada Tabel 11 dengan 3 kasus lama pada data training pada Tabel 10, yaitu:
Tabel 12 : Kedekatan Kasus Baru Dengan Kasus Nomor 1 | |||||
---|---|---|---|---|---|
No. | Atribut | Nilai Atribut Kasus Nomor 1 | Nilai Atribut Kasus Baru | Kedekatan (a) | Bobot (b) |
1. | Jumlah Pinjaman | > 20.000.000 s/d <= 50.000.000 | > 20.000.000 s/d <= 50.000.000 | 1 | 0.8 |
2. | Tujuan Pinjam | Modal Kerja | Konsumtif | 0.571 | 0.8 |
3. | Jangka Waktu | 36 Bulan | 60 Bulan | 0.75 | 0.8 |
4. | Kondisi Debitur | Cukup Baik | Baik | 0.7 | 0.6 |
5. | Pekerjaan Debitur | Pegawai Swasta | Pegawai Swasta | 1 | 0.6 |
6. | Penghasilan Debitur Per Bulan | 2.500.000 s/d 6.500.000 | 2.500.000 s/d 6.500.000 | 1 | 0.6 |
7. | Jaminan | Sertifikat Tanah | BPKB Kendaraan Roda Dua | 0.8 | 0.5 |
Dari tabel diatas, dapat dihitung kedekatan kasus baru dengan kasus nomor 1, dengan cara : Similarity = ((a1*b1)+(a2*b2)+(a3*b3)+(a4*b4)+(a5*b 5)+(a6*b6)+(a7*b7)) / (b1+b2+b3+b4+b5+b6+b7) Similarity = ((1*0.8)+(0.571*0.8)+(0.75*0.8)+(0.7*0.6) +(1*0.6)+(1*0.6)+(0.8*0.5)) / (0.8+0.8+0.8+0.6+0.6+0.6+0.5) Similarity = 0.825 |
Tabel 13 : Kedekatan Kasus Baru Dengan Kasus Nomor 2 | |||||
---|---|---|---|---|---|
No. | Atribut | Nilai Atribut Kasus Nomor 2 | Nilai Atribut Kasus Baru | Kedekatan (a) | Bobot (b) |
1. | Jumlah Pinjaman | <= 20.000.000 | > 20.000.000 s/d <= 50.000.000 | 0.8 | 0.8 |
2. | Tujuan Pinjam | Modal Kerja | Konsumtif | 0.571 | 0.8 |
3. | Jangka Waktu | 12 Bulan | 60 Bulan | 0.6 | 0.8 |
4. | Kondisi Debitur | Baik | Baik | 1 | 0.6 |
5. | Pekerjaan Debitur | Wiraswasta | Pegawai Swasta | 0.667 | 0.6 |
6. | Penghasilan Debitur Per Bulan | < 2.500.000 | 2.500.000 s/d 6.500.000 | 0.7 | 0.6 |
7. | Jaminan | BPKB Kendaraan Roda Dua | BPKB Kendaraan Roda Dua | 1 | 0.5 |
Dari tabel diatas, dapat dihitung kedekatan kasus baru dengan kasus nomor 2, dengan cara : Similarity = ((a1*b1)+(a2*b2)+(a3*b3)+(a4*b4)+(a5*b 5)+(a6*b6)+(a7*b7)) / (b1+b2+b3+b4+b5+b6+b7) Similarity = ((0.8*0.8)+(0.571*0.8)+(0.6*0.8)+(1*0.6)+ (0.667*0.6)+(0.7*0.6)+(1*0.5)) / (0.8+0.8+0.8+0.6+0.6+0.6+0.5) Similarity = 0.744 |
Tabel 14 : Kedekatan Kasus Baru Dengan Kasus Nomor 3 | |||||
---|---|---|---|---|---|
No. | Atribut | Nilai Atribut Kasus Nomor 3 | Nilai Atribut Kasus Baru | Kedekatan (a) | Bobot (b) |
1. | Jumlah Pinjaman | <= 20.000.000 | > 20.000.000 s/d <= 50.000.000 | 0.8 | 0.8 |
2. | Tujuan Pinjam | Konsumtif | Konsumtif | 1 | 0.8 |
3. | Jangka Waktu | 36 Bulan | 60 Bulan | 0.75 | 0.8 |
4. | Kondisi Debitur | Baik | Baik | 1 | 0.6 |
5. | Pekerjaan Debitur | Pegawai Swasta | Pegawai Swasta | 1 | 0.6 |
6. | Penghasilan Debitur Per Bulan | 2.500.000 s/d 6.500.000 | 2.500.000 s/d 6.500.000 | 1 | 0.6 |
7. | Jaminan | BPKB Kendaraan Roda Empat | BPKB Kendaraan Roda Dua | 0.9 | 0.5 |
Dari tabel diatas, dapat dihitung kedekatan kasus baru dengan kasus nomor 3, dengan cara : Similarity = ((a1*b1)+(a2*b2)+(a3*b3)+(a4*b4)+(a5*b5)+ (a6*b6)+(a7*b7)) / (b1+b2+b3+b4+b5+b6+b7) Similarity = ((0.8*0.8)+(1*0.8)+(0.75*0.8)+(1*0.6)+(1*0.6) +(1*0.6)+(0.9*0.5)) / (0.8+0.8+0.8+0.6+0.6+0.6+0.5) Similarity = 0.913 |
Melihat dari ke tiga kasus tersebut, maka yang mempunyai nilai tertinggi adalah kasus ketiga, melihat dari kasus yang tertinggi bahwa kasus itulah yang merupakan kasus yang terdekat dengan kasus baru.
Berarti yang mendekati dengan kasus baru adalah kasus ke tiga. Maka klasifikasi resiko pinjaman dana pada kasus baru adalah Rendah.
Begitulah langkah-langkah perhitungan algoritma nearest neighbor, untuk mencoba program-nya, dapat mengclick demo program dibawah
Demo langsung program :
Klik Disini
Penerapan Metode Bayes Dalam Sistem Pakar
- Algoritma -
Sistem Pendukung Keputusan Menggunakkan Metode AHP
- Algoritma -
Perhitungan Metode Fuzzy AHP Dalam Pemilihan Karyawan Terbaik
- Algoritma -
About PayahTidur
Jasa Konsultasi Dan Pembuatan Program. Sudah Berpengalaman Lebih Dari 10 Tahun Dalam Dunia
Pemrograman.
Pengerjaan Cepat dan Harga Terjangkau.
PayahTidur Products
Sistem Pakar
SPK (Sistem Pendukung Keputusan)
Data Minning
JST (Jaringan Syaraf Tiruan)
Images Proccesing (Pengolahan Citra)
Sistem Informasi Geografis (SIG)
E-Commerce Website
Sistem Informasi
PayahTidur Skills
PHP
Microsoft Visual Studio
Android Mobile
JST (Jaringan Syaraf Tiruan)
Maps Google
Laravel Framework / CI Framework
Matlab
Java