Học máy - Chế độ trung bình trung bình
Trung bình, Trung vị và Chế độ
Chúng ta có thể học được gì khi nhìn vào một nhóm số?
Trong Học máy (và trong toán học) thường có ba giá trị mà chúng ta quan tâm:
- Mean - Giá trị trung bình
- Trung vị - Giá trị điểm giữa
- Chế độ - Giá trị chung nhất
Ví dụ: Chúng tôi đã đăng ký tốc độ của 13 ô tô:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
Giá trị tốc độ trung bình, trung bình hoặc phổ biến nhất là gì?
Nghĩa là
Giá trị trung bình là giá trị trung bình.
Để tính giá trị trung bình, hãy tìm tổng của tất cả các giá trị và chia tổng cho số giá trị:
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 =
89.77
Mô-đun NumPy có một phương pháp cho việc này. Tìm hiểu về mô-đun NumPy trong Hướng dẫn NumPy của chúng tôi .
Thí dụ
Sử dụng phương pháp NumPy mean()
để tìm tốc độ trung bình:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)
Trung bình
Giá trị trung bình là giá trị ở giữa, sau khi bạn đã sắp xếp tất cả các giá trị:
77, 78, 85, 86, 86, 86,
87
, 87, 88, 94, 99, 103, 111
Điều quan trọng là các con số phải được sắp xếp trước khi bạn có thể tìm thấy giá trị trung bình.
Mô-đun NumPy có một phương thức cho việc này:
Thí dụ
Sử dụng phương thức NumPy median()
để tìm giá trị giữa:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
Nếu có hai số ở giữa thì chia tổng hai số đó.
77, 78, 85, 86, 86,
86, 87
,
87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5
Thí dụ
Sử dụng mô-đun NumPy:
import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
Chế độ
Giá trị Chế độ là giá trị xuất hiện nhiều lần nhất:
99,
86
, 87, 88, 111,
86
, 103, 87, 94, 78, 77, 85,
86
= 86
Mô-đun SciPy có một phương pháp cho việc này. Tìm hiểu về mô-đun SciPy trong Hướng dẫn SciPy của chúng tôi .
Thí dụ
Sử dụng phương pháp SciPy mode()
để tìm số xuất hiện nhiều nhất:
from scipy import stats
speed =
[99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)
Tóm tắt chương
Trung bình, Trung vị và Chế độ là các kỹ thuật thường được sử dụng trong Học máy, vì vậy điều quan trọng là phải hiểu khái niệm đằng sau chúng.