Phân phối nhị thức


Phân phối nhị thức

Phân phối nhị thức là một phân phối rời rạc .

Nó mô tả kết quả của các kịch bản nhị phân, ví dụ như tung đồng xu, nó sẽ là đầu hoặc đuôi.

Nó có ba tham số:

n- số lần thử nghiệm.

p- xác suất xuất hiện của mỗi lần thử (ví dụ: tung đồng xu 0,5 mỗi lần).

size- Hình dạng của mảng được trả về.

Phân phối rời rạc: Phân phối được xác định tại các tập hợp sự kiện riêng biệt, ví dụ: kết quả của một lần tung đồng xu là rời rạc vì nó có thể chỉ là đầu hoặc đuôi trong khi chiều cao của người là liên tục vì nó có thể là 170, 170,1, 170,11, v.v.

Thí dụ

Với 10 lần thử nghiệm tung đồng xu tạo ra 10 điểm dữ liệu:

from numpy import random

x = random.binomial(n=10, p=0.5, size=10)

print(x)

Hình dung về phân phối nhị thức

Thí dụ

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

sns.distplot(random.binomial(n=10, p=0.5, size=1000), hist=True, kde=False)

plt.show()

Kết quả


Sự khác biệt giữa phân phối chuẩn và phân phối nhị thức

Sự khác biệt chính là phân phối chuẩn là liên tục trong khi nhị thức là rời rạc, nhưng nếu có đủ các điểm dữ liệu thì nó sẽ khá giống với phân phối chuẩn với loc và tỷ lệ nhất định.

Thí dụ

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

sns.distplot(random.normal(loc=50, scale=5, size=1000), hist=False, label='normal')
sns.distplot(random.binomial(n=100, p=0.5, size=1000), hist=False, label='binomial')

plt.show()

Kết quả