Gấu trúc - Âm mưu



Âm mưu

Pandas sử dụng plot()phương pháp này để tạo sơ đồ.

Chúng ta có thể sử dụng Pyplot, một mô-đun con của thư viện Matplotlib để hình dung sơ đồ trên màn hình.

Đọc thêm về Matplotlib trong Hướng dẫn Matplotlib của chúng tôi .

Thí dụ

Nhập pyplot từ Matplotlib và trực quan hóa DataFrame của chúng tôi:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot()

plt.show()

Các ví dụ trong trang này sử dụng tệp CSV có tên: 'data.csv'.

Tải xuống data.csv hoặc Mở data.csv


Lô phân tán

Chỉ định rằng bạn muốn một biểu đồ phân tán với kindđối số:

kind = 'scatter'

Biểu đồ phân tán cần trục x và trục y.

Trong ví dụ dưới đây, chúng tôi sẽ sử dụng "Duration" cho trục x và "Calo" cho trục y.

Bao gồm các đối số x và y như sau:

x = 'Duration', y = 'Calories'

Thí dụ

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')

plt.show()

Kết quả

Hãy nhớ rằng: Trong ví dụ trước, chúng ta đã biết rằng mối tương quan giữa "Thời lượng" và "Lượng calo" là 0.922721, và chúng ta kết luận rằng thời lượng cao hơn có nghĩa là lượng calo bị đốt cháy nhiều hơn.

Bằng cách nhìn vào biểu đồ phân tán, tôi sẽ đồng ý.

Hãy tạo một biểu đồ phân tán khác, trong đó có mối quan hệ không tốt giữa các cột, như "Thời lượng" và "Maxpulse", với mối tương quan 0.009403:

Thí dụ

Biểu đồ phân tán không có mối quan hệ giữa các cột:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')

plt.show()

Kết quả


w3schools CERTIFIED . 2021

Được chứng nhận!

Hoàn thành các mô-đun Pandas, làm bài tập, làm bài kiểm tra và bạn sẽ được chứng nhận w3schools!

$ 10 ĐĂNG KÝ

Biểu đồ

Sử dụng kindđối số để chỉ định rằng bạn muốn một biểu đồ:

kind = 'hist'

Biểu đồ chỉ cần một cột.

Biểu đồ cho chúng ta biết tần suất của mỗi khoảng thời gian, ví dụ: có bao nhiêu bài tập kéo dài từ 50 đến 60 phút?

Trong ví dụ dưới đây, chúng tôi sẽ sử dụng cột "Thời lượng" để tạo biểu đồ:

Thí dụ

df["Duration"].plot(kind = 'hist')

Kết quả

Lưu ý: Biểu đồ cho chúng ta biết rằng có hơn 100 bài tập kéo dài từ 50 đến 60 phút.


Kiểm tra bản thân với các bài tập

Bài tập:

Chèn cú pháp đúng để trực quan hóa dữ liệu trong DataFrame dưới dạng biểu đồ (vẽ biểu đồ).

df.()