Khoa học dữ liệu - Giới thiệu về thống kê


Công bố số liệu thống kê

Thống kê là khoa học phân tích dữ liệu.

Khi chúng ta đã tạo ra một mô hình để dự đoán, chúng ta phải đánh giá độ tin cậy của dự đoán.

Rốt cuộc, một dự đoán có giá trị gì, nếu chúng ta không thể dựa vào nó?


Thống kê mô tả

Đầu tiên chúng tôi sẽ đề cập đến một số thống kê mô tả cơ bản.

Thống kê mô tả tóm tắt các tính năng quan trọng của tập dữ liệu như:

  • Đếm
  • Tổng
  • Độ lệch chuẩn
  • Phân vị
  • Trung bình cộng
  • Vân vân..

Đó là một điểm khởi đầu tốt để làm quen với dữ liệu.

Chúng ta có thể sử dụng describe()hàm trong Python để tóm tắt dữ liệu:

Thí dụ

print (full_health_data.describe())

Đầu ra:

Mô tả thống kê

Bạn có thấy điều gì thú vị ở đây không?