数据科学- 统计百分位数

25%、50% 和 75% - 百分位数

百分位数在统计中用于为您提供一个数字,该数字描述了给定百分比值低于的值。

Percentiles

让我们尝试通过一些示例来解释它,使用 Average_Pulse。

  • Average_Pulse 的 25% 百分位表示所有训练课程中有 25% 的平均脉搏为每分钟 100 次或更低。 如果我们反过来说,这意味着 75% 的训练课程的平均脉搏为每分钟 100 次或更高
  • Average_Pulse 的 75% 百分位表示所有训练课程中有 75% 的平均脉搏为 111 或更低。 如果我们反过来说,这意味着 25% 的训练课程的平均脉搏为每分钟 111 次或更高

任务:找出 Max_Pulse 的 10% 百分比

以下示例显示了如何在 Python 中执行此操作:

实例

import numpy as np

Max_Pulse= full_health_data["Max_Pulse"]
percentile10 = np.percentile(Max_Pulse, 10)
print(percentile10)
  • Max_Pulse = full_health_data["Max_Pulse"] - 从完整的健康数据集中隔离变量 Max_Pulse。
  • np.percentile() 用于定义我们想要 Max_Pulse 的 10% 百分位数。

Max_Pulse 的 10% 百分位数是 120。这意味着所有训练课程中有 10% 的 Max_Pulse 为 120 或更低。