数据科学- 绘制线性函数

运动手表数据集

看看我们的健康数据集:

Duration Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

在 Python 中绘制现有数据

现在,我们可以首先使用 matplotlib 库绘制 Average_Pulse 与 Calorie_Burnage 的值。

plot() 函数用于制作点 x,y 的二维六边形分箱图:

实例

import matplotlib.pyplot as plt

health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)

plt.show()

实例解析

  • 导入matplotlib库的pyplot模块
  • 绘制来自 Average_Pulse 与 Calorie_Burnage 的数据
  • kind='line' 告诉我们我们想要哪种类型的绘图。 在这里,我们想要一条直线
  • plt.ylim() 和 plt.xlim() 告诉我们希望轴从什么值开始。 在这里,我们希望轴从零开始
  • plt.show() 向我们展示了输出

上面的代码会产生如下结果:

Linear function

图形输出

正如我们所见,Average_Pulse 和 Calorie_Burnage 之间存在关系。 Calorie_Burnage 与 Average_Pulse 成比例增加。 这意味着我们可以使用 Average_Pulse 来预测 Calorie_Burnage。



为什么这条线没有完全画到 y 轴上?

原因是我们没有观察到 Average_Pulse 或 Calorie_Burnage 等于 0。 80 是 Average_Pulse 的第一次观察,240 是 Calorie_Burnage 的第一次观察。

Linear function

看线。 如果平均脉搏从 80 增加到 90,卡路里消耗会怎样?

Linear function

我们可以使用对角线找到预测卡路里消耗的数学函数。

事实证明:

  • 如果平均脉搏为 80,则卡路里消耗为 240
  • 如果平均脉搏为 90,则卡路里消耗为 260
  • 如果平均脉搏为 100,则卡路里消耗为 280

有一个模式。 如果平均脉搏增加 10,卡路里消耗增加 20。