.quickedit{ display:none; }

Total Tayangan Halaman

Senin, 13 November 2017

TUGAS SOFTSKILL Pengantar Statistika (Teorema Bayes)



TEOREMA BAYES 

Teorema Bayes dikemukakan oleh seorang pendeta presbyterian Inggris pada tahun 1763 yang bernama Thomas Bayes . Teorema Bayes ini kemudian disepurnakan oleh Laplace. Teorema Bayes digunakan untuk menghitung probabilitas terjadinya suatu peistiwa berdasarkan pengaruh yang didapat dari hasil observasi.

Teorema ini menerangkan hubungan antara probabilitas terjadinya peristiwa A dengan syarat peristiwa B telah terjadi dan probabilitas terjadinya peristiwa B dengan syarat peristiwa A telah terjadi. Teorema ini didasarkan pada prinsip bahwa tambahan informasi dapat memperbaiki probabilitas.

Teorema Bayes adalah teorema yang digunakan dalam statistika untuk menghitung peluang untuk suatu hipotesis, Bayes Optimal Classifier  menghitung peluang dari suatu kelas dari masing-masing kelompok atribut yang ada, dan menentukan kelas mana yang paling optimal. Umumnya kelompok atribut E direpresentasikan dengan sekumpulan nilai atribut (x1,x2,x3,….,xn) dimana xi adalah nilai atribut Xi. C adalah variable klasifikasi dan c adalah nilai dari C. Pengklasifikasian adalah sebuah fungsi yang menugaskan data tertentu kedalam sebuah kelas. Dari sudut pandang peluang, berdasarkan aturan Bayes kedalam kelas c adalah untuk menentukan pilihan kelas, digunakan peluang maksimal dari seluruh C dalam C, Karena nilai konstan untuk semua kelas, maka dapat diabaikan.

Pengklasifikasian menggunakan Teorema Bayes ini membutuhkan biaya komputasi yang mahal (waktu prosessor dan ukuran memory yang besar) karena kebutuhan untuk menghitung nilai probabilitas untuk tiap nilai dari perkalian kartesius untuk tiap nilai atribut dan tiap nilai kelas. Data latih untuk Teorema Bayes membutuhkan paling tidak perkalian kartesius dari seluruh kelompok atribut yang mungkin, jika misalkan ada 16 atribut yang masingmasingnya berjenis Boolean tanpa missing value, maka data latih minimal yang dibutuhkan oleh Teorema Bayes untuk digunakan dalam klasifikasi adalah 2^16 = 65.536 data, sehingga ada 3 masalah yang dihadapi untuk menggunakan teorema Bayes dalam pengklasifikasian, yaitu :
  • Kebanyakan data latih tidak memiliki varian klasifikasi sebanyak itu (oleh
    karenanya sering diambil sample).
  • Jumlah atribut dalam data sample dapat berjumlah lebih banyak (lebih dari 16).
  • Jenis nilai atribut dapat berjumlah lebih banyak [lebih dari 2 – Boolean]
    terlebih lagi untuk jenis nilai atribut yang bersifat tidak terbatas 1 – ∞ seperti
    numeric dan kontiniu.
  • Jika suatu data X tidak ada dalam data latih, maka data X tidak dapat di
    klasifikasikan, karena peluang untuk data X di klasifikasikan kedalam suatu
    kelas adalah sama untuk tiap kelas yang ada.


Untuk mengatasi berbagai permasalahan diatas, berbagai varian dari pengklasifikasian yang menggunakan Teorema Bayes diajukan, salah satunya adalah Naïve Bayes, yaitu penggunaan Teorema Bayes dengan asumsi keidependenan atribut. Asumsi keidependenan atribut akan menghilangkan kebutuhan banyaknya jumlah data latih dari perkalian kartesius seluruh atribut yang dibutuhkan untuk mengklasifikasikan suatu data.
Dampak negative dari asumsi Naïve tersebut adalah keterkaitan yang ada antara nilainilai atribut diabaikan sepenuhnya. Dampak ini secara intuitif akan berpengaruh dalam pengklasifikasian, namun percobaan empiris mengatakan sebaliknya. Hal ini tentu saja cukup mengejutkan, karena dalam pengaplikasian dunia nyata, asumsi diabaikannya keterkaitan antara atribut selalu dilanggar.

Pertanyaan yang muncul adalah apakah yang menyebabkan baiknya performa yang didapatkan dari pengaplikasian asumsi Naïve ini? Karena secara intuitif, asumsi keidependenan atribut dalam dunia nyata hampir tidak pernah terjadi. Seharusnya dengan asumsi tersebut performa yang dihasilkan akan buruk. Domingos dan Pazzani (1997) pada papernya untuk menjelaskan performa Naïve Bayes dalam fungsi zero-one loss.

Fungsi zero-one loss ini mendefinisikan error hanya sebagai pengklasifikasian yang salah. Tidak seperti fungsi error yang lain seperti squared error, fungsi zero-one loss tidak memberi nilai suatu kesalahan perhitungan peluang selama peluang maksimum ditugaskan kedalam kelas yang benar. Ini berarti bahwa Naïve Bayes dapat mengubah peluang posterior dari tiap kelas, tetapi kelas dengan nilai peluang posterior maksimum jarang diubah.

Dalam teori probabilitas dan statistika, teorema Bayes adalah sebuah teorema dengan dua penafsiran berbeda. Dalam penafsiran Bayes, teorema ini menyatakan seberapa jauh derajat kepercayaan subjektif harus berubah secara rasional ketika ada petunjuk baru. Dalam penafsiran frekuentis teorema ini menjelaskan representasi invers probabilitas dua kejadian. Teorema ini merupakan dasar dari statistika Bayes dan memiliki penerapan dalam sains, rekayasa, ilmu ekonomi (terutama ilmu ekonomi mikro), teori permainan, kedokteran dan hukum. Penerapan teorema Bayes untuk memperbarui kepercayaan dinamakan inferens Bayes.

Contoh Soal :
Sebuah perkantoran biasanya membutuhkan tenaga listrik yang cukup agar semua aktifitas pekerjaannya terjamin dari adanya pemutusan aliran listrik. Terdapat dua sumber listrik yang digunakan PLN dan Generator. Bila listrik PLN padam maka secara otomatis generator akan menyala dan memberikan aliran listrik untuk seluruh perkantoran. Masalah yang selama ini mengganggu adalah ketidak satabilan arus (voltage) Listrik. Selama beberapa tahun terakhir, diketahui bahwa perkantoran itu menggunakan listrik PLN adalah 0.9 dan peluang menggunakan generator adalah 0.1 peluang terjadi ketidak stabilan pada arus PLN maupun generator masing-masing 0.2 dan 0.3.

Permasalahan ini di ilustrasikan Sebagai berikut :
E         : Peristiwa listrik PLN digunakan
Ec       : Peristiwa listrik Generator digunakan
A         : Peristiwa terjadinya ketidak stabilan arus

Peristiwa A dapat ditulis sebagai gabungan dua kejadian yang lepas


Dengan menggunakan probabilitas bersyarat maka :

Diketahui:
P(E)     = 0.9
P(E’)    = 0.1
P(A|E)  = 0.2
P(A|E’) = 0/3

Sehingga:
P(A) = P(E) . P(A|E) + P(E’) . P(A|E’)
        = (0.9).(0.2)+(0.2).(0.3)
        = 0.21
       
Kembali pada permasalahan diatas, bila suatu saat diketahui terjadi ketidak stabilan arus listrik, maka berapakah probabilitas saat itu aliran listrik berasal dari generator ? Dengan menggunakan rumus probabilitas bersyarat diperoleh.

P(E’|A) = P(E’∩A)/P(A)
            = P(E’).P(A|E’)/P(A)
            = 0.03/0.21=0/143

Peristiwa B1,B2,….,Bk merupakan suatu sekatan(partisi) dari ruang sampel S dengan P(Bi)≠0 untuk i=1,2,…,k maka setiap peristiwa A anggota S berlaku:


Digunakan bila ingin diketahui probabilitas P(B1|A),P(B2|A)….,P(Bk|A) dengan rumus sebagai berikut :


Suatu generator telekomunikasi nirkabel mempunyai 3 pilihan tempat untuk membangun pemancar sinyal yaitu didaerah tengah kota, daerah kaki bukit dan daerah tepi pantai, dengan masing-masing mempunyai peluang 0.2,0.3 dan 0.5. Bila pemancar dibangun ditengah kota, peluang terjadi gangguan sinyal adalah 0.05. Bila pemancar dibangun dikaki bukit, peluang terjadinya gangguan sinyal adalah 0.06. Bila pemancar dibangun ditepi pantai, peluang gangguan sinyal adalah 0.08.

A. Berapakah peluang terjadinya gangguan sinyal ?
B. Bila diketahui telah terjadinya gangguan pada sinyal, berapa peluang bahwa operator tersebut ternyata telah membangun pemancar di tepi pantai ?

Misal :
A          = Terjadi ganguan sinyal
B1        = Pemancar dibangun di tengah kota
B2        = Pemancar dibangun di kaki bukit
B3        = Pemancar dibangun di tepi pantai

Maka :
A. Peluang terjadinya ganguan sinyal
P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+P(B3)P(A|B3)
       = (0,2).(0.05)+(0.3)(0.06)+(0.5)(0.08)=0.001+0.018+0.04=0.068

B. Diketahui telah terjadi gangguan pada sinyal, maka peluang bahwa operator ternyata telah membangun pemancar di tepi pantai.

Dapat dinyatakan dengan ,"peluang bersyarat bahwa operator membangun pemancar di tepi pantai bila diketahui telah terjadi gangguan sinyal".



Sumber Penulisan :
https://id.wikipedia.org/wiki/Teorema_Bayes
http://ikhwan-perbaungan.blogspot.co.id/2014/09/teorema-bayes-dan-contoh-teorema-bayes.html
http://muhammadyaniishak.blogspot.co.id/2014/08/makalah-teorema-bayes.html
http://www.academia.edu/30231488/Probabilitas_dan_Statistika_Teorema_Bayes_
https://nerims.wordpress.com/2013/06/08/teorema-bayes/

Jumat, 03 November 2017

TUGAS SOFTSKILL Pengantar Statistika (Data Kecepatan Kendaraan Bermotor)


Polisi sedang mengamati kecepatan pengendara motor yang melintas di jalan raya. Data dibawah ini menunjukkan kecepatan pengendara motor.

15
32
45
46
42
39
68
47
18
31
48
49
56
52
39
48
69
61
44
42
38
52
55
58
62
58
48
56
58
48
47
52
37
64
29
55
38
29
62
49
69
18
61
55
49

Dari data 45 kecepatan kendaraan, buatlah tabel distribusi frekuensinya, dan hitunglah :
  1. Rata - rata (Mean)
  2. Nilai yang sering muncul (Modus)
  3. Nilai tengah (Median)
  4. Kuartil ke-3
  5. Desil ke-4
  6. Persentil ke-83
  7. Range
  8. Ragam (Varian)
  9. Simpangan baku (Standar deviasi)
Jawaban dari soal diatas dapat didownload disini.

Mengapa saya menguploadnya di Google Drive?
Karena saya sudah mencoba menulisnya di blog secara langsung, namun ada beberapa simbol yang tidak bisa ditampilkan oleh blog sehingga menjadi tidak jelas dibacanya, maka dari itu saya upload ke Google Drive.

Sekian, semoga bermanfaat~

Sumber referensi penulisan :
http://www.pelajaran.co.id/2016/13/ukuran-letak-data-kuartil-desil-persentil-penjelasan-rumus-dan-contoh-soal.html
http://www.materikelas.com/kuartil-desil-dan-persentil-rumus-dan-contoh-soal/
https://danioyo.wordpress.com/2017/04/25/kuartil-desil-dan-persentil-data-berkelompok/
https://mutiaoctivianti.wordpress.com/pengukuran-penyimpangan-range-deviasi-varian/
https://bellashabrina.wordpress.com/2013/10/06/ukuran-penyebaran-range-deviasi-rata-rata-varians-dan-standar-deviasi/