複数の観測所がある都市では、1時間ごとの中央値平均を計算する際に、極端な値は割り引かれる。 データ・アナリストはデータセット全体に「タグ付け」を施し、異常なデータ・パターンや潜在的に逸脱した値を特定するのに役立てた。 その後、奇数値とその観測所が属する観測所を目視でチェックし、近隣地域のPM2.5、特別な気象条件、昨年同時期のPM2.5値など、複数の関連指標と比較する。
このデータ分析プロセスで誤りと判断された値はすべて割り引かれた。
複数の観測所がある都市では、1時間ごとの中央値平均を計算する際に、極端な値は割り引かれる。 データ・アナリストはデータセット全体に「タグ付け」を施し、異常なデータ・パターンや潜在的に逸脱した値を特定するのに役立てた。 その後、奇数値とその観測所が属する観測所を目視でチェックし、近隣地域のPM2.5、特別な気象条件、昨年同時期のPM2.5値など、複数の関連指標と比較する。
このデータ分析プロセスで誤りと判断された値はすべて割り引かれた。