TEOREMA BAYES
Teorema Bayes dikemukakan oleh seorang pendeta
presbyterian Inggris pada tahun 1763 yang bernama Thomas Bayes . Teorema Bayes
ini kemudian disepurnakan oleh Laplace. Teorema Bayes digunakan untuk
menghitung probabilitas terjadinya suatu peistiwa berdasarkan pengaruh yang
didapat dari hasil observasi.
Teorema ini menerangkan hubungan antara probabilitas
terjadinya peristiwa A dengan syarat peristiwa B telah terjadi dan probabilitas
terjadinya peristiwa B dengan syarat peristiwa A telah terjadi. Teorema ini
didasarkan pada prinsip bahwa tambahan informasi dapat memperbaiki
probabilitas.
Teorema
Bayes adalah teorema yang digunakan dalam statistika untuk
menghitung peluang untuk suatu hipotesis, Bayes Optimal Classifier
menghitung peluang dari suatu kelas dari masing-masing kelompok atribut yang
ada, dan menentukan kelas mana yang paling optimal. Umumnya kelompok atribut E
direpresentasikan dengan sekumpulan nilai atribut (x1,x2,x3,….,xn) dimana xi
adalah nilai atribut Xi. C adalah variable klasifikasi dan c adalah nilai dari
C. Pengklasifikasian adalah sebuah fungsi yang menugaskan data tertentu kedalam
sebuah kelas. Dari sudut pandang peluang, berdasarkan aturan Bayes kedalam
kelas c adalah untuk menentukan pilihan kelas, digunakan peluang maksimal dari
seluruh C dalam C, Karena nilai konstan untuk semua kelas, maka dapat
diabaikan.
Pengklasifikasian
menggunakan Teorema Bayes ini membutuhkan biaya komputasi yang mahal (waktu
prosessor dan ukuran memory yang besar) karena kebutuhan untuk menghitung nilai
probabilitas untuk tiap nilai dari perkalian kartesius untuk tiap nilai atribut
dan tiap nilai kelas. Data latih untuk Teorema Bayes membutuhkan paling tidak
perkalian kartesius dari seluruh kelompok atribut yang mungkin, jika misalkan
ada 16 atribut yang masingmasingnya berjenis Boolean tanpa missing value, maka
data latih minimal yang dibutuhkan oleh Teorema Bayes untuk digunakan dalam
klasifikasi adalah 2^16 = 65.536 data, sehingga ada 3 masalah yang dihadapi
untuk menggunakan teorema Bayes dalam pengklasifikasian, yaitu :
- Kebanyakan
data latih tidak memiliki varian klasifikasi sebanyak itu (oleh
karenanya sering diambil sample). - Jumlah atribut dalam data sample dapat berjumlah lebih banyak (lebih dari 16).
-
Jenis
nilai atribut dapat berjumlah lebih banyak [lebih dari 2 – Boolean]
terlebih lagi untuk jenis nilai atribut yang bersifat tidak terbatas 1 – ∞ seperti
numeric dan kontiniu. -
Jika
suatu data X tidak ada dalam data latih, maka data X tidak dapat di
klasifikasikan, karena peluang untuk data X di klasifikasikan kedalam suatu
kelas adalah sama untuk tiap kelas yang ada.
Untuk
mengatasi berbagai permasalahan diatas, berbagai varian dari pengklasifikasian
yang menggunakan Teorema Bayes diajukan, salah satunya adalah Naïve Bayes,
yaitu penggunaan Teorema Bayes dengan asumsi keidependenan atribut. Asumsi
keidependenan atribut akan menghilangkan kebutuhan banyaknya jumlah data latih
dari perkalian kartesius seluruh atribut yang dibutuhkan untuk
mengklasifikasikan suatu data.
Dampak
negative dari asumsi Naïve tersebut adalah keterkaitan yang ada antara
nilainilai atribut diabaikan sepenuhnya. Dampak ini secara intuitif akan
berpengaruh dalam pengklasifikasian, namun percobaan empiris mengatakan
sebaliknya. Hal ini tentu saja cukup mengejutkan, karena dalam pengaplikasian
dunia nyata, asumsi diabaikannya keterkaitan antara atribut selalu dilanggar.
Pertanyaan
yang muncul adalah apakah yang menyebabkan baiknya performa yang didapatkan
dari pengaplikasian asumsi Naïve ini? Karena secara intuitif, asumsi
keidependenan atribut dalam dunia nyata hampir tidak pernah terjadi. Seharusnya
dengan asumsi tersebut performa yang dihasilkan akan buruk. Domingos dan
Pazzani (1997) pada papernya untuk menjelaskan performa Naïve Bayes dalam
fungsi zero-one loss.
Fungsi
zero-one loss ini mendefinisikan error hanya sebagai pengklasifikasian yang
salah. Tidak seperti fungsi error yang lain seperti squared error, fungsi
zero-one loss tidak memberi nilai suatu kesalahan perhitungan peluang selama
peluang maksimum ditugaskan kedalam kelas yang benar. Ini berarti bahwa Naïve Bayes
dapat mengubah peluang posterior dari tiap kelas, tetapi kelas dengan nilai
peluang posterior maksimum jarang diubah.
Dalam teori probabilitas dan statistika, teorema Bayes
adalah sebuah teorema dengan dua penafsiran berbeda. Dalam penafsiran Bayes,
teorema ini menyatakan seberapa jauh derajat kepercayaan subjektif harus
berubah secara rasional ketika ada petunjuk baru. Dalam penafsiran frekuentis
teorema ini menjelaskan representasi invers probabilitas dua kejadian. Teorema
ini merupakan dasar dari statistika Bayes dan memiliki penerapan dalam sains,
rekayasa, ilmu ekonomi (terutama ilmu ekonomi mikro), teori permainan,
kedokteran dan hukum. Penerapan teorema Bayes untuk memperbarui kepercayaan
dinamakan inferens Bayes.
Contoh Soal :
Sebuah perkantoran biasanya membutuhkan tenaga listrik yang cukup agar semua aktifitas pekerjaannya terjamin dari adanya pemutusan aliran listrik. Terdapat dua sumber listrik yang digunakan PLN dan Generator. Bila listrik PLN padam maka secara otomatis generator akan menyala dan memberikan aliran listrik untuk seluruh perkantoran. Masalah yang selama ini mengganggu adalah ketidak satabilan arus (voltage) Listrik. Selama beberapa tahun terakhir, diketahui bahwa perkantoran itu menggunakan listrik PLN adalah 0.9 dan peluang menggunakan generator adalah 0.1 peluang terjadi ketidak stabilan pada arus PLN maupun generator masing-masing 0.2 dan 0.3.
Permasalahan ini di ilustrasikan Sebagai berikut :
E : Peristiwa listrik PLN digunakan
Ec : Peristiwa listrik Generator digunakan
A : Peristiwa terjadinya ketidak stabilan arus
Peristiwa A dapat ditulis sebagai gabungan dua kejadian yang lepas
Sebuah perkantoran biasanya membutuhkan tenaga listrik yang cukup agar semua aktifitas pekerjaannya terjamin dari adanya pemutusan aliran listrik. Terdapat dua sumber listrik yang digunakan PLN dan Generator. Bila listrik PLN padam maka secara otomatis generator akan menyala dan memberikan aliran listrik untuk seluruh perkantoran. Masalah yang selama ini mengganggu adalah ketidak satabilan arus (voltage) Listrik. Selama beberapa tahun terakhir, diketahui bahwa perkantoran itu menggunakan listrik PLN adalah 0.9 dan peluang menggunakan generator adalah 0.1 peluang terjadi ketidak stabilan pada arus PLN maupun generator masing-masing 0.2 dan 0.3.
Permasalahan ini di ilustrasikan Sebagai berikut :
E : Peristiwa listrik PLN digunakan
Ec : Peristiwa listrik Generator digunakan
A : Peristiwa terjadinya ketidak stabilan arus
Peristiwa A dapat ditulis sebagai gabungan dua kejadian yang lepas
Dengan
menggunakan probabilitas bersyarat maka :
Diketahui:
P(E) = 0.9
P(E) = 0.9
P(E’) =
0.1
P(A|E) = 0.2
P(A|E) = 0.2
P(A|E’) = 0/3
Sehingga:
P(A) = P(E) . P(A|E) + P(E’) . P(A|E’)
P(A) = P(E) . P(A|E) + P(E’) . P(A|E’)
= (0.9).(0.2)+(0.2).(0.3)
= 0.21
= 0.21
Kembali pada permasalahan diatas, bila suatu saat diketahui terjadi ketidak stabilan arus listrik, maka berapakah probabilitas saat itu aliran listrik berasal dari generator ? Dengan menggunakan rumus probabilitas bersyarat diperoleh.
P(E’|A) = P(E’∩A)/P(A)
= P(E’).P(A|E’)/P(A)
= 0.03/0.21=0/143
Peristiwa B1,B2,….,Bk merupakan suatu sekatan(partisi) dari ruang sampel S dengan P(Bi)≠0 untuk i=1,2,…,k maka setiap peristiwa A anggota S berlaku:
Digunakan
bila ingin diketahui probabilitas P(B1|A),P(B2|A)….,P(Bk|A) dengan rumus
sebagai berikut :
Suatu generator telekomunikasi nirkabel mempunyai 3 pilihan tempat untuk membangun pemancar sinyal yaitu didaerah tengah kota, daerah kaki bukit dan daerah tepi pantai, dengan masing-masing mempunyai peluang 0.2,0.3 dan 0.5. Bila pemancar dibangun ditengah kota, peluang terjadi gangguan sinyal adalah 0.05. Bila pemancar dibangun dikaki bukit, peluang terjadinya gangguan sinyal adalah 0.06. Bila pemancar dibangun ditepi pantai, peluang gangguan sinyal adalah 0.08.
A. Berapakah peluang terjadinya gangguan sinyal ?
B. Bila diketahui telah terjadinya gangguan pada sinyal, berapa peluang bahwa operator tersebut ternyata telah membangun pemancar di tepi pantai ?
Misal :
A = Terjadi ganguan sinyal
B1 = Pemancar dibangun di tengah kota
B2 = Pemancar dibangun di kaki bukit
B3 = Pemancar dibangun di tepi pantai
Maka :
A. Peluang terjadinya ganguan sinyal
P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+P(B3)P(A|B3)
= (0,2).(0.05)+(0.3)(0.06)+(0.5)(0.08)=0.001+0.018+0.04=0.068
B. Diketahui telah terjadi gangguan pada sinyal, maka peluang bahwa operator ternyata telah membangun pemancar di tepi pantai.
Dapat dinyatakan dengan ,"peluang bersyarat bahwa operator membangun pemancar di tepi pantai bila diketahui telah terjadi gangguan sinyal".
A. Peluang terjadinya ganguan sinyal
P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+P(B3)P(A|B3)
= (0,2).(0.05)+(0.3)(0.06)+(0.5)(0.08)=0.001+0.018+0.04=0.068
B. Diketahui telah terjadi gangguan pada sinyal, maka peluang bahwa operator ternyata telah membangun pemancar di tepi pantai.
Dapat dinyatakan dengan ,"peluang bersyarat bahwa operator membangun pemancar di tepi pantai bila diketahui telah terjadi gangguan sinyal".
Sumber Penulisan :
https://id.wikipedia.org/wiki/Teorema_Bayes
http://ikhwan-perbaungan.blogspot.co.id/2014/09/teorema-bayes-dan-contoh-teorema-bayes.html
http://muhammadyaniishak.blogspot.co.id/2014/08/makalah-teorema-bayes.html
http://www.academia.edu/30231488/Probabilitas_dan_Statistika_Teorema_Bayes_
https://nerims.wordpress.com/2013/06/08/teorema-bayes/
Tidak ada komentar:
Posting Komentar