Khoa học dữ liệu - Lập biểu đồ các hàm tuyến tính
Tập dữ liệu đồng hồ thể thao
Hãy xem tập dữ liệu sức khỏe của chúng tôi:
Khoảng thời gian | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | số 8 | 7 |
45 | 95 | 130 | 270 | số 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | số 8 |
60 | 110 | 145 | 300 | 7 | số 8 |
60 | 115 | 145 | 310 | số 8 | số 8 |
75 | 120 | 150 | 320 | 0 | số 8 |
75 | 125 | 150 | 330 | số 8 | số 8 |
Vẽ đồ thị dữ liệu hiện có bằng Python
Bây giờ, trước tiên chúng ta có thể vẽ biểu đồ các giá trị của Average_Pulse so với Calorie_Burnage bằng cách sử dụng thư viện matplotlib.
Hàm plot()
được sử dụng để tạo biểu đồ phân chia hình lục giác 2D gồm các điểm x, y:
Thí dụ
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse',
y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
Giải thích ví dụ
- Nhập mô-đun pyplot của thư viện matplotlib
- Vẽ đồ thị dữ liệu từ Average_Pulse so với Calorie_Burnage
kind='line'
cho chúng tôi biết loại âm mưu mà chúng tôi muốn. Ở đây, chúng ta muốn có một đường thẳng- plt.ylim () và plt.xlim () cho chúng ta biết giá trị mà chúng ta muốn trục bắt đầu. Ở đây, chúng tôi muốn trục bắt đầu từ 0
- plt.show () cho chúng ta thấy kết quả đầu ra
Đoạn mã trên sẽ tạo ra kết quả sau:
Kết quả đồ thị
Như chúng ta có thể thấy, có một mối quan hệ giữa Average_Pulse và Calorie_Burnage. Calorie_Burnage tăng tương ứng với Average_Pulse. Có nghĩa là chúng ta có thể sử dụng Average_Pulse để dự đoán Calorie_Burnage.
Tại sao đường không được vẽ hoàn toàn xuống trục y?
Lý do là chúng tôi không có quan sát trong đó Average_Pulse hoặc Calorie_Burnage bằng 0. 80 là quan sát đầu tiên của Average_Pulse và 240 là quan sát đầu tiên của Calorie_Burnage.
Nhìn vào dòng. Điều gì xảy ra với sự tiêu hao calo nếu nhịp đập trung bình tăng từ 80 lên 90?
Chúng ta có thể sử dụng đường chéo để tìm hàm toán học để dự đoán mức tiêu hao calo.
Hóa ra:
- Nếu nhịp đập trung bình là 80, mức tiêu thụ calo là 240
- Nếu nhịp đập trung bình là 90, mức tiêu thụ calo là 260
- Nếu nhịp đập trung bình là 100, mức tiêu hao calo là 280
Có một khuôn mẫu. Nếu nhịp đập trung bình tăng lên 10 thì lượng calo tiêu thụ tăng lên 20.