Hướng dẫn Python

TRANG CHỦ Python Giới thiệu Python Python Bắt đầu Cú pháp Python Nhận xét Python Biến Python Các kiểu dữ liệu Python Số Python Đúc Python Chuỗi Python Python Booleans Toán tử Python Danh sách Python Python Tuples Bộ Python Từ điển Python Python Nếu ... Khác Python While Loops Python cho các vòng lặp Các hàm Python Python Lambda Mảng Python Các lớp / đối tượng Python Kế thừa Python Trình lặp lại Python Phạm vi Python Mô-đun Python Ngày trong Python Toán Python JSON Python Python RegEx Python PIP Python Thử ... Ngoại trừ Đầu vào của người dùng Python Định dạng chuỗi Python

Xử lý tập tin

Xử lý tệp Python Tệp đọc Python Viết / tạo tệp trong Python Xóa tệp trong Python

Mô-đun Python

Hướng dẫn NumPy Panda Walkthrough Hướng dẫn Scipy

Python Matplotlib

Giới thiệu Matplotlib Matplotlib Bắt đầu Matplotlib Pyplot Matplotlib Plotting Điểm đánh dấu Matplotlib Dòng Matplotlib Nhãn Matplotlib Matplotlib Grid Matplotlib Subplots Matplotlib Scatter Matplotlib Bars Biểu đồ Matplotlib Biểu đồ bánh Matplotlib

Học máy

Bắt đầu Chế độ trung bình trung bình Độ lệch chuẩn Phân vị Phân phối dữ liệu Phân phối dữ liệu bình thường Lô phân tán Hồi quy tuyến tính Hồi quy đa thức Nhiều hồi quy Tỉ lệ Huấn luyện / Kiểm tra Cây quyết định

Python MySQL

MySQL Bắt đầu MySQL Tạo cơ sở dữ liệu MySQL Tạo bảng Chèn MySQL Lựa chọn MySQL MySQL ở đâu MySQL Đặt hàng bởi MySQL Delete Bảng thả MySQL Cập nhật MySQL Giới hạn MySQL Tham gia MySQL

Python MongoDB

MongoDB Bắt đầu MongoDB Tạo cơ sở dữ liệu MongoDB Tạo Bộ sưu tập Chèn MongoDB MongoDB Tìm Truy vấn MongoDB MongoDB sắp xếp MongoDB Xóa MongoDB Drop Collection Cập nhật MongoDB Giới hạn MongoDB

Tham khảo Python

Tổng quan về Python Các hàm tích hợp trong Python Phương thức chuỗi Python Phương thức danh sách Python Phương thức từ điển Python Phương thức Tuple trong Python Phương thức tập hợp Python Phương thức tệp Python Từ khóa Python Ngoại lệ Python Bảng chú giải thuật ngữ Python

Tham chiếu mô-đun

Mô-đun ngẫu nhiên Mô-đun yêu cầu Mô-đun thống kê Mô-đun Toán học Mô-đun cMath

Python Làm thế nào để

Xóa danh sách trùng lặp Đảo ngược một chuỗi Thêm hai số

Ví dụ Python

Ví dụ Python Trình biên dịch Python Bài tập Python Python Quiz Chứng chỉ Python

Học máy - Phân phối dữ liệu


Phân phối dữ liệu

Trước đó trong hướng dẫn này, chúng tôi đã làm việc với một lượng rất nhỏ dữ liệu trong các ví dụ của chúng tôi, chỉ để hiểu các khái niệm khác nhau.

Trong thế giới thực, các tập dữ liệu lớn hơn nhiều, nhưng có thể khó thu thập dữ liệu trong thế giới thực, ít nhất là ở giai đoạn đầu của một dự án.

Làm cách nào để chúng ta có được Tập dữ liệu lớn?

Để tạo tập dữ liệu lớn để thử nghiệm, chúng tôi sử dụng mô-đun Python NumPy, đi kèm với một số phương pháp để tạo tập dữ liệu ngẫu nhiên, ở bất kỳ kích thước nào.

Thí dụ

Tạo một mảng chứa 250 phao ngẫu nhiên từ 0 đến 5:

import numpy

x = numpy.random.uniform(0.0, 5.0, 250)

print(x)

Biểu đồ

Để trực quan hóa tập dữ liệu, chúng tôi có thể vẽ biểu đồ với dữ liệu chúng tôi đã thu thập.

Chúng tôi sẽ sử dụng mô-đun Python Matplotlib để vẽ biểu đồ.

Tìm hiểu về mô-đun Matplotlib trong Hướng dẫn Matplotlib của chúng tôi .

Thí dụ

Vẽ biểu đồ:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 250)

plt.hist(x, 5)
plt.show()

Kết quả:

Biểu đồ được giải thích

Chúng tôi sử dụng mảng từ ví dụ trên để vẽ một biểu đồ có 5 thanh.

Thanh đầu tiên biểu thị số lượng giá trị trong mảng từ 0 đến 1.

Thanh thứ hai đại diện cho bao nhiêu giá trị từ 1 đến 2.

Vân vân.

Cho chúng tôi kết quả này:

  • 52 giá trị nằm trong khoảng từ 0 đến 1
  • 48 giá trị nằm trong khoảng từ 1 đến 2
  • 49 giá trị nằm trong khoảng từ 2 đến 3
  • 51 giá trị nằm trong khoảng từ 3 đến 4
  • 50 giá trị nằm trong khoảng từ 4 đến 5

Lưu ý: Các giá trị của mảng là số ngẫu nhiên và sẽ không hiển thị cùng một kết quả trên máy tính của bạn.

Phân phối dữ liệu lớn

Một mảng chứa 250 giá trị không được coi là quá lớn, nhưng bây giờ bạn đã biết cách tạo một tập hợp giá trị ngẫu nhiên và bằng cách thay đổi các tham số, bạn có thể tạo tập dữ liệu lớn như bạn muốn.

Thí dụ

Tạo một mảng với 100000 số ngẫu nhiên và hiển thị chúng bằng biểu đồ có 100 thanh:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 100000)

plt.hist(x, 100)
plt.show()