Khoa học dữ liệu - Bảng cơ sở dữ liệu


Bảng cơ sở dữ liệu

Bảng cơ sở dữ liệu là một bảng có dữ liệu có cấu trúc.

Bảng sau đây hiển thị một bảng cơ sở dữ liệu với dữ liệu sức khỏe được trích xuất từ ​​một chiếc đồng hồ thể thao:

Khoảng thời gian Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 số 8 7
45 95 130 270 số 8 7
45 100 140 280 0 7
60 105 140 290 7 số 8
60 110 145 300 7 số 8
60 115 145 310 số 8 số 8
75 120 150 320 0 số 8
75 125 150 330 số 8 số 8

Tập dữ liệu này chứa thông tin về một buổi tập điển hình như thời lượng, nhịp đập trung bình, mức tiêu hao calo, v.v.


Cấu trúc bảng cơ sở dữ liệu

Một bảng cơ sở dữ liệu bao gồm (các) cột và (các) hàng:

Cột 1 Cột 2 Cột 3 Cột 4 Cột 5 Cột 6
Khoảng thời gian Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
Hàng 1 30 80 120 240 10 7
Hàng 2 30 85 120 250 10 7
Hàng 3 45 90 130 260 số 8 7
Hàng 4 45 95 130 270 số 8 7
Hàng 5 45 100 140 280 0 7
Hàng 6 60 105 140 290 7 số 8
Hàng 7 60 110 145 300 7 số 8
Hàng 8 60 115 145 310 số 8 số 8
Hàng 9 75 120 150 320 0 số 8
Hàng 10 75 125 150 330 số 8 số 8

Một hàng là một đại diện theo chiều ngang của dữ liệu.

Một cột là một đại diện theo chiều dọc của dữ liệu.


Biến

Một biến được định nghĩa là một cái gì đó có thể đo lường hoặc đếm được.

Ví dụ có thể là ký tự, số hoặc thời gian.

Trong ví dụ dưới đây, chúng ta có thể thấy rằng mỗi cột đại diện cho một biến.

Khoảng thời gian Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 số 8 7
45 95 130 270 số 8 7
45 100 140 280 0 7
60 105 140 290 7 số 8
60 110 145 300 7 số 8
60 115 145 310 số 8 số 8
75 120 150 320 0 số 8
75 125 150 330 số 8 số 8

Có 6 cột, nghĩa là có 6 biến (Duration, Average_Pulse, Max_Pulse, Calorie_Burnage, Hours_Work, Hours_Sleep).

Có 11 hàng, nghĩa là mỗi biến có 10 quan sát.

Nhưng nếu có 11 hàng, tại sao chỉ có 10 quan sát?

Đó là vì hàng đầu tiên là nhãn, nghĩa là nó là tên của biến.