Khoa học dữ liệu - Bảng cơ sở dữ liệu
Bảng cơ sở dữ liệu
Bảng cơ sở dữ liệu là một bảng có dữ liệu có cấu trúc.
Bảng sau đây hiển thị một bảng cơ sở dữ liệu với dữ liệu sức khỏe được trích xuất từ một chiếc đồng hồ thể thao:
Khoảng thời gian | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | số 8 | 7 |
45 | 95 | 130 | 270 | số 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | số 8 |
60 | 110 | 145 | 300 | 7 | số 8 |
60 | 115 | 145 | 310 | số 8 | số 8 |
75 | 120 | 150 | 320 | 0 | số 8 |
75 | 125 | 150 | 330 | số 8 | số 8 |
Tập dữ liệu này chứa thông tin về một buổi tập điển hình như thời lượng, nhịp đập trung bình, mức tiêu hao calo, v.v.
Cấu trúc bảng cơ sở dữ liệu
Một bảng cơ sở dữ liệu bao gồm (các) cột và (các) hàng:
Cột 1 | Cột 2 | Cột 3 | Cột 4 | Cột 5 | Cột 6 | |
Khoảng thời gian | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep | |
---|---|---|---|---|---|---|
Hàng 1 | 30 | 80 | 120 | 240 | 10 | 7 |
Hàng 2 | 30 | 85 | 120 | 250 | 10 | 7 |
Hàng 3 | 45 | 90 | 130 | 260 | số 8 | 7 |
Hàng 4 | 45 | 95 | 130 | 270 | số 8 | 7 |
Hàng 5 | 45 | 100 | 140 | 280 | 0 | 7 |
Hàng 6 | 60 | 105 | 140 | 290 | 7 | số 8 |
Hàng 7 | 60 | 110 | 145 | 300 | 7 | số 8 |
Hàng 8 | 60 | 115 | 145 | 310 | số 8 | số 8 |
Hàng 9 | 75 | 120 | 150 | 320 | 0 | số 8 |
Hàng 10 | 75 | 125 | 150 | 330 | số 8 | số 8 |
Một hàng là một đại diện theo chiều ngang của dữ liệu.
Một cột là một đại diện theo chiều dọc của dữ liệu.
Biến
Một biến được định nghĩa là một cái gì đó có thể đo lường hoặc đếm được.
Ví dụ có thể là ký tự, số hoặc thời gian.
Trong ví dụ dưới đây, chúng ta có thể thấy rằng mỗi cột đại diện cho một biến.
Khoảng thời gian | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | số 8 | 7 |
45 | 95 | 130 | 270 | số 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | số 8 |
60 | 110 | 145 | 300 | 7 | số 8 |
60 | 115 | 145 | 310 | số 8 | số 8 |
75 | 120 | 150 | 320 | 0 | số 8 |
75 | 125 | 150 | 330 | số 8 | số 8 |
Có 6 cột, nghĩa là có 6 biến (Duration, Average_Pulse, Max_Pulse, Calorie_Burnage, Hours_Work, Hours_Sleep).
Có 11 hàng, nghĩa là mỗi biến có 10 quan sát.
Nhưng nếu có 11 hàng, tại sao chỉ có 10 quan sát?
Đó là vì hàng đầu tiên là nhãn, nghĩa là nó là tên của biến.