Cara Menentukan Jenis Pengedaran Probabiliti untuk Data

Isi kandungan:

Anonim

Apabila anda telah mengumpul data pada sistem atau proses anda, langkah seterusnya adalah untuk menentukan jenis taburan kebarangkalian yang ada. Jenis-jenis kebarangkalian distribusi adalah: seragam diskrit, Bernoulli, binomial, binomial negatif, Poisson, geometri, seragam berterusan, keluk biasa (kurva bel), eksponen, gamma dan beta. Menyeret walaupun beberapa dari senarai kemungkinan membuat menentukan yang mana nilai kuadrat R paling dekat lebih cepat.

Perkara yang anda perlukan

  • Perisian grafik

  • Cara mengira nilai kuadrat R (analisis terbaik patut)

Plot data untuk representasi visual jenis data.

Salah satu langkah pertama untuk menentukan pengagihan data yang ada - dan oleh itu jenis persamaan yang digunakan untuk memodelkan data - adalah untuk menolak apa yang tidak boleh. • Jika terdapat sebarang puncak dalam set data, ia tidak boleh menjadi pengagihan seragam diskret. • Jika data mempunyai lebih daripada satu puncak, ia bukan Poisson atau binomial. • Jika ia mempunyai lengkung tunggal, tiada puncak sekunder, dan mempunyai cerun yang perlahan pada setiap sisi, ia mungkin Poisson atau pengagihan gamma. Tetapi ia tidak boleh menjadi pengagihan seragam diskret. • Sekiranya data diedarkan secara sama rata, dan tanpa condong ke satu sisi, selamat untuk menolak pengedaran gamma atau Weibull. • Jika fungsi mempunyai pengedaran walaupun atau puncak di tengah-tengah hasil graphed, ia bukanlah taburan geometrik atau pengedaran eksponen. • Sekiranya berlakunya sesuatu faktor berbeza dengan pembolehubah alam sekitar, ia mungkin bukan sebaran Poisson.

Selepas jenis pengedaran kebarangkalian telah dikurangkan, lakukan analisis kuadrat R bagi setiap jenis kemungkinan kebarangkalian pengedaran. Yang mempunyai nilai kuadrat R paling tinggi kemungkinan besar betul.

Hilangkan satu titik data luar. Kemudian menghitung semula R kuasa dua. Jika jenis taburan kebarangkalian yang sama muncul sebagai perlawanan terdekat, maka terdapat keyakinan tinggi bahawa ini adalah taburan kebarangkalian yang betul untuk digunakan untuk set data.

Petua

  • Sekiranya data menunjukkan pelbagai puncak serpihan luas, mungkin dua proses berasingan berlaku atau produk yang dicampurkan bercampur-campur. Ulangi data dan kemudian analisa semula.

Amaran

Validasi persamaan yang dijana daripada set data kemudian untuk mengesahkan bahawa ia masih tepat untuk set data. Ada kemungkinan bahawa faktor persekitaran dan proses hanyut telah membuat persamaan dan model semasa tidak betul.

Disyorkan