Hướng dẫn Python

TRANG CHỦ Python Giới thiệu Python Python Bắt đầu Cú pháp Python Nhận xét Python Biến Python Các kiểu dữ liệu Python Số Python Đúc Python Chuỗi Python Python Booleans Toán tử Python Danh sách Python Python Tuples Bộ Python Từ điển Python Python Nếu ... Khác Python While Loops Python cho các vòng lặp Các hàm Python Python Lambda Mảng Python Các lớp / đối tượng Python Kế thừa Python Trình lặp lại Python Phạm vi Python Mô-đun Python Ngày trong Python Toán Python JSON Python Python RegEx Python PIP Python Thử ... Ngoại trừ Đầu vào của người dùng Python Định dạng chuỗi Python

Xử lý tập tin

Xử lý tệp Python Tệp đọc Python Viết / tạo tệp trong Python Xóa tệp trong Python

Mô-đun Python

Hướng dẫn NumPy Panda Walkthrough Hướng dẫn Scipy

Python Matplotlib

Giới thiệu Matplotlib Matplotlib Bắt đầu Matplotlib Pyplot Matplotlib Plotting Điểm đánh dấu Matplotlib Dòng Matplotlib Nhãn Matplotlib Matplotlib Grid Matplotlib Subplots Matplotlib Scatter Matplotlib Bars Biểu đồ Matplotlib Biểu đồ bánh Matplotlib

Học máy

Bắt đầu Chế độ trung bình trung bình Độ lệch chuẩn Phân vị Phân phối dữ liệu Phân phối dữ liệu bình thường Lô phân tán Hồi quy tuyến tính Hồi quy đa thức Nhiều hồi quy Tỉ lệ Huấn luyện / Kiểm tra Cây quyết định

Python MySQL

MySQL Bắt đầu MySQL Tạo cơ sở dữ liệu MySQL Tạo bảng Chèn MySQL Lựa chọn MySQL MySQL ở đâu MySQL Đặt hàng bởi MySQL Delete Bảng thả MySQL Cập nhật MySQL Giới hạn MySQL Tham gia MySQL

Python MongoDB

MongoDB Bắt đầu MongoDB Tạo cơ sở dữ liệu MongoDB Tạo Bộ sưu tập Chèn MongoDB MongoDB Tìm Truy vấn MongoDB MongoDB sắp xếp MongoDB Xóa MongoDB Drop Collection Cập nhật MongoDB Giới hạn MongoDB

Tham khảo Python

Tổng quan về Python Các hàm tích hợp trong Python Phương thức chuỗi Python Phương thức danh sách Python Phương thức từ điển Python Phương thức Tuple trong Python Phương thức tập hợp Python Phương thức tệp Python Từ khóa Python Ngoại lệ Python Bảng chú giải thuật ngữ Python

Tham chiếu mô-đun

Mô-đun ngẫu nhiên Mô-đun yêu cầu Mô-đun thống kê Mô-đun Toán học Mô-đun cMath

Python Làm thế nào để

Xóa danh sách trùng lặp Đảo ngược một chuỗi Thêm hai số

Ví dụ Python

Ví dụ Python Trình biên dịch Python Bài tập Python Python Quiz Chứng chỉ Python

Học máy

Học máy là làm cho máy tính học từ việc nghiên cứu dữ liệu và thống kê.

Học máy (Machine Learning) là một bước đi theo hướng của trí tuệ nhân tạo (AI).

Học máy là một chương trình phân tích dữ liệu và học cách dự đoán kết quả.

Bắt đầu từ đâu?

Trong hướng dẫn này, chúng ta sẽ quay lại toán học và nghiên cứu thống kê, cũng như cách tính toán các con số quan trọng dựa trên các tập dữ liệu.

Chúng tôi cũng sẽ học cách sử dụng các mô-đun Python khác nhau để có được câu trả lời mà chúng tôi cần.

Và chúng ta sẽ học cách tạo ra các hàm có thể dự đoán kết quả dựa trên những gì chúng ta đã học.


Tập dữ liệu

Trong tâm trí của máy tính, tập dữ liệu là bất kỳ tập hợp dữ liệu nào. Nó có thể là bất cứ thứ gì từ một mảng đến một cơ sở dữ liệu hoàn chỉnh.

Ví dụ về một mảng:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Ví dụ về cơ sở dữ liệu:

Tên xeMàu sắcGià điTốc độ, vận tốcAutoPass
xe BMWmàu đỏ599Y
Volvomàu đen786Y
VWxámsố 887n
VWtrắng788Y
Fordtrắng2111Y
VWtrắng1786Y
Teslamàu đỏ2103Y
xe BMWmàu đen987Y
Volvoxám494n
Fordtrắng1178n
Toyotaxám1277n
VWtrắng985n
Toyotamàu xanh lam686Y

Bằng cách nhìn vào mảng, chúng ta có thể đoán rằng giá trị trung bình có thể là khoảng 80 hoặc 90 và chúng ta cũng có thể xác định giá trị cao nhất và giá trị thấp nhất, nhưng chúng ta có thể làm gì khác?

Và bằng cách xem xét cơ sở dữ liệu, chúng ta có thể thấy rằng màu phổ biến nhất là màu trắng và chiếc xe lâu đời nhất là 17 năm, nhưng điều gì sẽ xảy ra nếu chúng ta có thể dự đoán nếu một chiếc xe có AutoPass, chỉ bằng cách nhìn vào các giá trị khác?

Đó là công dụng của Học máy! Phân tích dữ liệu và dự đoán kết quả!

Trong Học máy, người ta thường làm việc với các tập dữ liệu rất lớn. Trong hướng dẫn này, chúng tôi sẽ cố gắng làm cho việc hiểu các khái niệm khác nhau của máy học dễ dàng nhất có thể và chúng tôi sẽ làm việc với các tập dữ liệu nhỏ dễ hiểu.


Loại dữ liệu

Để phân tích dữ liệu, điều quan trọng là phải biết loại dữ liệu chúng ta đang xử lý.

Chúng tôi có thể chia các loại dữ liệu thành ba loại chính:

  • Số
  • Phân loại
  • Bình thường

Dữ liệu số là các số và có thể được chia thành hai loại số:

  • Dữ liệu rời rạc
    - các số được giới hạn ở số nguyên. Ví dụ: Số ô tô chạy qua.
  • Dữ liệu liên tục
    - các số có giá trị vô hạn. Ví dụ: Giá của một mặt hàng hoặc kích thước của một mặt hàng

Dữ liệu phân loại là các giá trị không thể đo lường được với nhau. Ví dụ: giá trị màu hoặc bất kỳ giá trị có / không.

Dữ liệu thứ tự giống như dữ liệu phân loại, nhưng có thể được đo lường với nhau. Ví dụ: điểm trường nơi A tốt hơn B, v.v.

Bằng cách biết kiểu dữ liệu của nguồn dữ liệu, bạn sẽ có thể biết kỹ thuật nào nên sử dụng khi phân tích chúng.

Bạn sẽ tìm hiểu thêm về thống kê và phân tích dữ liệu trong các chương tiếp theo.