Euclidean Distance merupakan persamaan matematika yang digunakan untuk menghitung jarak pada dua buah objek. Euclidean distance biasa digunakan untuk menghitung jarak antara dua titik pada sistem koordinat kartesian dimana sebuah titik memiliki dua nilai yaitu x dan y atau biasa dinotasikan dengan (x,y). Selain titik, Euclidean Distance juga dapat digunakan untuk menghitung jarak antar dua buah data yang memiliki n-buah fitur. Penggunaan euclidean distance untuk menghitung jarak antar data banyak digunakan pada beberapa bidang ilmu seperti pengenalan pola dan kecerdasan buatan.
Jika terdapat dua buah titik p dan q maka persamaan untuk menghitung jarak euclidean dari kedua titik tersebut dapat menggunakan persamaan berikut :
Dimana :
adalah jarak antara p dan q.
Pada koordinat kartesian, titik p dan q masing - masing memiliki dua nilai yang menunjukkan lokasi kedua titik tersebut yaitu x dan y. Maka jarak euclidean dari kedua titik tersebut dapat dihitung menggunakan persamaan berikut :
Contoh, diketahui dua buah titik yaitu A dan B dengan nilai masing - masing titik pada sumbu x dan y yaitu :
A = (1,1)
B = (6,5)
Maka jarak euclidean antara kedua titik tersebut yaitu :
Dari hasil perhitungan diatas diperoleh jarak euclidean antara titik A dan B adalah sebesar 6.4031 yang mana merepresentasikan panjang garis lurus yang menghubungkan titik A dan B.
Multidimension Euclidean Distance
Jarak euclidean juga dapat digunakan untuk menghitung jarak antara dua buah data yang memiliki dimensi fitur yang lebih dari satu. Pada kasus ini, jarak euclidean biasa digunakan untuk menghitung nilai perbedaan antara dua buah data. Pada beberapa metode klasifikasi dan pengelompokkan, jarak euclidean digunakan sebagai referensi untuk menyatakan sejauh mana perbedaan antara dua buah data. Pada data dengan dimensi lebih dari dua, jarak euclidean dapat dihitung menggunakan persamaan berikut :
Dimana :
= fitur-fitur dari data p
= fitur-fitur dari data q
Contoh, asumsikan terdapat dua buah data sebagai berikut :
Nama | Speed | Body | Technique |
Agus | 87 | 46 | 77 |
Angga | 66 | 81 | 56 |
Bagaimana menghitung perbedaan antara Agus dan Angga? Dari data diatas dapat dilihat terdapat dua buah data yaitu Agus dan Angga dengan fitur Speed, Body, dan Technique. Untuk menghitung berapa besar perbedaan antara Agus dan Angga menggunakan jarak euclidean dapat dilakukan sebagai berikut :
Berdasarkan perhitungan diatas diperoleh perbedaan antara Agus dan Angga adalah 45.9021. Perbedaan antar data dapat digunakan untuk mencari data terdekat dari dua alternatif data yang biasa digunakan pada proses klasifikasi dan clustering. Sebagai contoh sederhana, diketahui terdapat dua pemain yang sudah bergabung dengan tim saat ini yaitu Agus dan Angga dengan posisi masing - masing adalah winger dan defender. Jika tim menerima seorang pemain baru katakanlah dengan nama Santoso dengan statistik Speed = 71, Body = 76, Tech = 66 maka akan ditempatkan dimanakah pemain baru tersebut?
Nama | Speed | Body | Technique | Position |
Agus | 87 | 46 | 77 | Winger |
Angga | 66 | 81 | 56 | Defender |
Santoso | 71 | 76 | 66 | ??? |
Menggunakan jarak euclidean kita akan menghitung perbedaan antara Santoso dengan Agus dan Angga :
Berdasarkan hasil perhitungan jarak euclidean diatas dapat dilihat perbedaan Santoso dengan Angga lebih kecil dibandingkan dengan perbedaan Santoso dengan Agus sehingga dapat disimpulkan bahwa Santoso memiliki kemiripan yang lebih besar ke Angga dibandingkan dengan Agus sehingga Santoso akan diberikan posisi yang sama dengan Angga yaitu Defender.
Nama | Speed | Body | Technique | Position |
Agus | 87 | 46 | 77 | Winger |
Angga | 66 | 81 | 56 | Defender |
Santoso | 71 | 76 | 66 | Defender |
Contoh diatas merupakan contoh sederhana bagaimana mengaplikasikan jarak euclidean pada klasifikasi. Sekian dulu artikel kali ini, semoga bermanfaat, stay stuned.. 😉