Phân phối nhị thức
Phân phối nhị thức
Phân phối nhị thức là một phân phối rời rạc .
Nó mô tả kết quả của các kịch bản nhị phân, ví dụ như tung đồng xu, nó sẽ là đầu hoặc đuôi.
Nó có ba tham số:
n
- số lần thử nghiệm.
p
- xác suất xuất hiện của mỗi lần thử (ví dụ: tung đồng xu 0,5 mỗi lần).
size
- Hình dạng của mảng được trả về.
Phân phối rời rạc: Phân phối được xác định tại các tập hợp sự kiện riêng biệt, ví dụ: kết quả của một lần tung đồng xu là rời rạc vì nó có thể chỉ là đầu hoặc đuôi trong khi chiều cao của người là liên tục vì nó có thể là 170, 170,1, 170,11, v.v.
Thí dụ
Với 10 lần thử nghiệm tung đồng xu tạo ra 10 điểm dữ liệu:
from numpy import random
x = random.binomial(n=10, p=0.5, size=10)
print(x)
Hình dung về phân phối nhị thức
Thí dụ
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
sns.distplot(random.binomial(n=10, p=0.5, size=1000), hist=True, kde=False)
plt.show()
Kết quả
Sự khác biệt giữa phân phối chuẩn và phân phối nhị thức
Sự khác biệt chính là phân phối chuẩn là liên tục trong khi nhị thức là rời rạc, nhưng nếu có đủ các điểm dữ liệu thì nó sẽ khá giống với phân phối chuẩn với loc và tỷ lệ nhất định.
Thí dụ
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
sns.distplot(random.normal(loc=50, scale=5, size=1000), hist=False,
label='normal')
sns.distplot(random.binomial(n=100, p=0.5, size=1000), hist=False,
label='binomial')
plt.show()