点击上方关注,All in AI中国
在今天的版本中,作者将带领大家一块去了解线性回归。本博客的目的是通过使用python实现快速概述线性回归的基本原理,让我们一块深入其中。
什么是线性回归?
线性回归是一种监督学习算法,用于预测问题。
这是一种通过在独立变量和因变量之间找到最佳拟合线来预测目标变量的方法,最佳拟合是所有点的最小误差线。
什么是最小二乘法?
最佳拟合度的计算方法是确保形状与每个点的实际观测值之间的所有距离之和尽可能小。
步骤1:计算x值和y值的平均值。
步骤2:计算线的斜率。即
步骤3:计算直线的y轴截距。即
例如,考虑以下数据:
绘制点数:
现在通过计算平均值:
x̄ = 5.86
ȳ = 6
计算线的斜率:
计算y轴截距:
c= 6 -(-0.83 * 5.86)
c= 10.86
该方程式为:
y = mx c
y = -0.83x 10.86
因此,我们从上面的例子中找到了最合适的线,在这条线的帮助下,我们可以预测这些值。
线性回归的优缺点:
优点:
易于实施
用于预测数值
缺点:
当独立变量和因变量之间的关系是非线性时,不能使用。
现在让我们使用python的动手示例练习线性回归:
数据集的功能:
父亲 - 父亲的身高以英寸为单位。
儿子 - 以英寸为单位的儿子的高度。
鉴于父亲的身高,我们需要预测儿子的身高。
运营:李佳惠