Số liệu thống kê

Thống kê là về cách thu thập, phân tích, diễn giải và trình bày dữ liệu:

  • Phổ biến nhất là gì?
  • Điều gì được mong đợi nhất?
  • Bình thường nhất là gì?

Thống kê suy luận

Thống kê tham chiếu là phương pháp để định lượng các thuộc tính của một tập hợp từ một Mẫu nhỏ :

Bạn lấy dữ liệu từ một mẫu và đưa ra dự đoán về toàn bộ dân số.

Ví dụ, bạn có thể đứng trong một cửa hàng và hỏi một mẫu gồm 100 người xem họ có thích sô cô la không.

Từ nghiên cứu của bạn, sử dụng thống kê suy luận, bạn có thể dự đoán rằng 91% tất cả những người mua sắm thích sô cô la.


Sự thật đáng kinh ngạc về sô cô la

Chín trong số mười người thích sô cô la.

50% dân số Hoa Kỳ không thể sống thiếu sô cô la mỗi ngày.


Thống kê mô tả

Thống kê mô tả là phương pháp tóm tắt các quan sát thành thông tin mà chúng ta có thể hiểu được.

Vì chúng tôi đăng ký mọi trẻ sơ sinh mới sinh, nên chúng tôi có thể nói rằng 51 trong số 100 trẻ là con trai.

Từ những con số mà chúng tôi thu thập được, chúng tôi có thể dự đoán 51% khả năng một đứa trẻ mới sinh là con trai.

Thật là bí ẩn khi tỷ lệ này không phải là 50%, như sinh học cơ bản dự đoán. Chúng ta chỉ có thể nói rằng ít nhất chúng ta đã có tỷ số giới tính nghiêng này kể từ thế kỷ 17.


Giá trị trung bình

Giá trị trung bình là Trung bình của tất cả các giá trị.

Bảng này chứa giá nhà so với kích thước:

Giá7số 8số 89991011141415
Kích cỡ5060708090100 110120130140150

Giá trung bình là (7 + 8 + 8 + 9 + 9 + 9 + 10 + 11 + 14 + 14 + 15) / 11 = 10.363636.

Làm thế nào để : Cộng tất cả các số, sau đó chia cho số lượng số.

Trung bìnhTổng chia cho Bá tước .

Giá trị trung bình (trong JavaScript):

var mean = (7+8+8+9+9+9+10+11+14+14+15)/11;

Hoặc nếu bạn sử dụng thư viện toán học như math.js :

var mean = math.mean([7,8,8,9,9,9,10,11,14,14,15]);


Phương sai

Trong thống kê, Phương sai là giá trị trung bình của các chênh lệch bình phương so với giá trị trung bình.

Nói cách khác, nó mô tả một tập hợp các số được trải ra bao xa so với giá trị trung bình của chúng.

Phương sai (trong JavaScript):

// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+14+15)/11;

// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;

// Calculate the Variance
var variance = ss / 11;

Hoặc nếu bạn sử dụng thư viện toán học như math.js :

var variance = math.variance([7,8,8,9,9,9,10,11,14,14,15],"uncorrected");


Độ lệch chuẩn

Độ lệch chuẩn là thước đo mức độ dàn trải của các con số.

Ký hiệu là σ (chữ cái Hy Lạp sigma).

Công thức là phương sai (căn bậc hai của phương sai).

Độ lệch Chuẩn là (trong JavaScript):

// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+15)/11;

// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;

// Calculate the Variance
var variance = ss / 11;

// Calculate the Standard Deviation
var std = Math.sqrt(variance);

Hoặc nếu bạn sử dụng thư viện toán học như math.js :

var std = math.std([7,8,8,9,9,9,9,10,11,14,15],"uncorrected");


Phân phối bình thường

Đường cong phân phối chuẩn là một đường cong hình chuông.

Mỗi dải của đường cong có độ rộng 1 Độ lệch Chuẩn :

Phân phối chuẩn thông thường