Chức năng Khoa học Dữ liệu
Chương này trình bày ba hàm thường được sử dụng khi làm việc với Khoa học dữ liệu: max (), min () và mean ().
Tập dữ liệu đồng hồ thể thao
Khoảng thời gian | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | số 8 | 7 |
45 | 95 | 130 | 270 | số 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | số 8 |
60 | 110 | 145 | 300 | 7 | số 8 |
60 | 115 | 145 | 310 | số 8 | số 8 |
75 | 120 | 150 | 320 | 0 | số 8 |
75 | 125 | 150 | 330 | số 8 | số 8 |
Tập dữ liệu trên bao gồm 6 biến, mỗi biến có 10 quan sát:
- Thời lượng - Buổi đào tạo kéo dài bao lâu tính bằng phút?
- Average_Pulse - Xung trung bình của phiên đào tạo là bao nhiêu? Điều này được đo bằng nhịp mỗi phút
- Max_Pulse - Xung tối đa của buổi đào tạo là bao nhiêu?
- Calorie_Burnage - Lượng calo bị đốt cháy trong buổi tập là bao nhiêu?
- Hours_Work - Chúng tôi đã làm việc tại công việc của mình bao nhiêu giờ trước buổi đào tạo?
- Hours_Sleep - Chúng ta đã ngủ bao nhiêu vào đêm trước buổi tập?
Chúng tôi sử dụng dấu gạch dưới (_) để phân tách các chuỗi vì Python không thể đọc khoảng trắng dưới dạng dấu phân cách.
Hàm max ()
Hàm Python max()
được sử dụng để tìm giá trị cao nhất trong một mảng.
Thí dụ
Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_max)
Hàm min ()
Hàm Python min()
được sử dụng để tìm giá trị thấp nhất trong một mảng.
Thí dụ
Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_min)
Hàm mean ()
Hàm NumPy mean()
được sử dụng để tìm giá trị trung bình của một mảng.
Thí dụ
import numpy as np
Calorie_burnage =
[240, 250, 260, 270, 280, 290, 300, 310, 320, 330]
Average_calorie_burnage =
np.mean(Calorie_burnage)
print(Average_calorie_burnage)
Chúng tôi viết np. phía trước hàm mean để cho Python biết rằng chúng ta muốn kích hoạt hàm mean từ thư viện Numpy .