Chức năng Khoa học Dữ liệu


Chương này trình bày ba hàm thường được sử dụng khi làm việc với Khoa học dữ liệu: max (), min () và mean ().


Tập dữ liệu đồng hồ thể thao

Khoảng thời gian Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 số 8 7
45 95 130 270 số 8 7
45 100 140 280 0 7
60 105 140 290 7 số 8
60 110 145 300 7 số 8
60 115 145 310 số 8 số 8
75 120 150 320 0 số 8
75 125 150 330 số 8 số 8

Tập dữ liệu trên bao gồm 6 biến, mỗi biến có 10 quan sát:

  • Thời lượng - Buổi đào tạo kéo dài bao lâu tính bằng phút?
  • Average_Pulse - Xung trung bình của phiên đào tạo là bao nhiêu? Điều này được đo bằng nhịp mỗi phút
  • Max_Pulse - Xung tối đa của buổi đào tạo là bao nhiêu?
  • Calorie_Burnage - Lượng calo bị đốt cháy trong buổi tập là bao nhiêu?
  • Hours_Work - Chúng tôi đã làm việc tại công việc của mình bao nhiêu giờ trước buổi đào tạo?
  • Hours_Sleep - Chúng ta đã ngủ bao nhiêu vào đêm trước buổi tập?

Chúng tôi sử dụng dấu gạch dưới (_) để phân tách các chuỗi vì Python không thể đọc khoảng trắng dưới dạng dấu phân cách.



Hàm max ()

Hàm Python max()được sử dụng để tìm giá trị cao nhất trong một mảng.

Thí dụ

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

Hàm min ()

Hàm Python min()được sử dụng để tìm giá trị thấp nhất trong một mảng.

Thí dụ

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

Hàm mean ()

Hàm NumPy mean()được sử dụng để tìm giá trị trung bình của một mảng.

Thí dụ

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

Chúng tôi viết np. phía trước hàm mean để cho Python biết rằng chúng ta muốn kích hoạt hàm mean từ thư viện Numpy .