Khoa học dữ liệu - Hàm tuyến tính


Với tư cách là một nhà khoa học dữ liệu, các hàm toán học cần biết vì chúng tôi muốn đưa ra các dự đoán và giải thích chúng.


Hàm tuyến tính

Trong toán học, một hàm được sử dụng để liên hệ một biến này với một biến khác.

Giả sử chúng ta xem xét mối quan hệ giữa mức tiêu hao calo và nhịp đập trung bình. Có thể cho rằng, nói chung, mức tiêu hao calo sẽ thay đổi khi nhịp đập trung bình thay đổi - chúng ta nói rằng mức tiêu thụ calo phụ thuộc vào nhịp đập trung bình.

Hơn nữa, có thể hợp lý khi cho rằng khi nhịp đập trung bình tăng lên thì lượng calo tiêu thụ cũng vậy. Lượng calo và xung trung bình là hai biến số đang được xem xét.

Bởi vì mức tiêu thụ calo phụ thuộc vào nhịp đập trung bình, chúng tôi nói rằng mức tiêu thụ calo là biến phụ thuộc và xung trung bình là biến độc lập.

Mối quan hệ giữa một biến phụ thuộc và một biến độc lập thường có thể được biểu thị bằng toán học bằng cách sử dụng một công thức (hàm).

Một hàm tuyến tính có một biến độc lập (x) và một biến phụ thuộc (y) và có dạng sau:

y = f(x) = ax + b

Hàm này dùng để tính giá trị cho biến phụ thuộc khi chúng ta chọn giá trị cho biến độc lập.

Giải trình:

  • f (x) = đầu ra (biến phụ thuộc)
  • x = đầu vào (biến độc lập)
  • a = độ dốc = là hệ số của biến độc lập. Nó cho biết tỷ lệ thay đổi của biến phụ thuộc
  • b = intercept = là giá trị của biến phụ thuộc khi x = 0. Nó cũng là điểm mà đường chéo cắt trục tung.


Hàm tuyến tính với một biến giải thích

Một hàm có một biến giải thích có nghĩa là chúng ta sử dụng một biến để dự đoán.

Giả sử chúng tôi muốn dự đoán lượng calo tiêu thụ bằng cách sử dụng xung trung bình. Chúng tôi có công thức sau:  

f(x) = 2x + 80

Ở đây, các số và biến có nghĩa là:

  • f (x) = Kết quả đầu ra. Con số này là nơi chúng tôi nhận được giá trị dự đoán của Calorie_Burnage
  • x = Đầu vào, là Average_Pulse
  • 2 = Slope = Chỉ định lượng Calorie_Burnage tăng lên nếu Average_Pulse tăng lên một. Nó cho chúng ta biết đường chéo "dốc" như thế nào
  • 80 = Intercept = Một giá trị cố định. Nó là giá trị của biến phụ thuộc khi x = 0

Vẽ một hàm tuyến tính

Thuật ngữ tuyến tính có nghĩa là một "đường thẳng". Vì vậy, nếu bạn biểu diễn một hàm tuyến tính bằng đồ thị, đường thẳng sẽ luôn là một đường thẳng. Đường có thể dốc lên, dốc xuống và trong một số trường hợp có thể nằm ngang hoặc dọc.

Đây là một biểu diễn đồ họa của hàm toán học ở trên:

Hàm tuyến tính

Giải thích Đồ thị:

  • Trục hoành thường được gọi là trục x. Ở đây, nó đại diện cho Average_Pulse.
  • Trục tung thường được gọi là trục y. Ở đây, nó đại diện cho Calorie_Burnage.
  • Calorie_Burnage là một hàm của Average_Pulse, vì Calorie_Burnage được giả định là phụ thuộc vào Average_Pulse.
  • Nói cách khác, chúng tôi sử dụng Average_Pulse để dự đoán Calorie_Burnage.
  • Đường màu xanh lam (đường chéo) thể hiện cấu trúc của hàm toán học dự đoán mức tiêu hao calo.