在计算每小时中位数平均值时,有多个站点的城市的离群值将被过滤掉:极端值将被扣除。 数据分析师对整个数据集进行了一些 "标记",这有助于我们识别不寻常的数据模式或潜在的离散值。 然后,对奇异值及其所属站点进行目测检查,并与多个相关指标进行比较,如附近地区的 PM2.5(如有)、特殊天气条件、去年同期的 PM2.5 值等。
通过这一数据分析过程确定为错误的任何数值都被剔除。
在计算每小时中位数平均值时,有多个站点的城市的离群值将被过滤掉:极端值将被扣除。 数据分析师对整个数据集进行了一些 "标记",这有助于我们识别不寻常的数据模式或潜在的离散值。 然后,对奇异值及其所属站点进行目测检查,并与多个相关指标进行比较,如附近地区的 PM2.5(如有)、特殊天气条件、去年同期的 PM2.5 值等。
通过这一数据分析过程确定为错误的任何数值都被剔除。