数据科学函数

本章展示了使用数据科学时的三个常用函数:max()、min() 和 mean()。


运动手表数据集

Duration Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

上面的数据集由 6 个变量组成,每个变量有 10 个观察值:

  • Duration - 培训课程持续了多长时间(以分钟计)?
  • Average_Pulse - 训练课的平均脉搏是多少? 这是以每分钟的心跳次数来衡量的
  • Max_Pulse - 训练课的最大脉搏是多少?
  • Calorie_Burnage - 训练期间消耗了多少卡路里?
  • Hours_Work - 在培训课程之前我们工作了多少小时?
  • Hours_Sleep - 训练前一晚我们睡了多久?

我们使用下划线 (_) 来分隔字符串,因为 Python 无法读取空格作为分隔符。



max() 函数

Python max() 函数用于查找数组中的最大值。

实例

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)
亲自试一试 »

min() 函数

Python min() 函数用于查找数组中的最小值。

实例

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)
亲自试一试 »

mean() 函数

NumPy mean() 函数用于求数组的平均值。

实例

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)
亲自试一试 »

我们在 mean 前面写 np. 是为了让 Python 知道我们要激活 Numpy 库中的 mean 函数。