Khoa học dữ liệu - Bảng hồi quy
Bảng hồi quy
Đầu ra từ hồi quy tuyến tính có thể được tóm tắt trong một bảng hồi quy.
Nội dung của bảng bao gồm:
- Thông tin về mô hình
- Hệ số của hàm hồi quy tuyến tính
- Thống kê hồi quy
- Thống kê các hệ số từ hàm hồi quy tuyến tính
- Thông tin khác mà chúng tôi sẽ không đề cập trong mô-đun này
Bảng hồi quy với Average_Pulse dưới dạng biến giải thích
Bây giờ bạn có thể bắt đầu hành trình phân tích đầu ra nâng cao!
Tạo bảng hồi quy tuyến tính bằng Python
Đây là cách tạo một bảng hồi quy tuyến tính trong Python:
Thí dụ
import pandas as pd
import statsmodels.formula.api as smf
full_health_data = pd.read_csv("data.csv", header=0, sep=",")
model = smf.ols('Calorie_Burnage ~ Average_Pulse', data =
full_health_data)
results = model.fit()
print(results.summary())
Giải thích ví dụ:
- Nhập thư viện statsmodels.formula.api dưới dạng smf. Statsmodels là một thư viện thống kê bằng Python.
- Sử dụng bộ full_health_data.
- Tạo một mô hình dựa trên Hình vuông nhỏ nhất Thông thường với smf.ols (). Chú ý rằng biến giải thích phải được viết trước trong ngoặc đơn. Sử dụng tập dữ liệu full_health_data.
- Bằng cách gọi .fit (), bạn nhận được các kết quả thay đổi. Điều này chứa rất nhiều thông tin về mô hình hồi quy.
- Gọi Summary () để nhận bảng với kết quả của hồi quy tuyến tính.