시간당 중앙값을 계산할 때 여러 역이 있는 도시의 외곽 값은 필터링되며, 극단적인 값은 할인됩니다. 데이터 분석가는 전체 데이터 집합에 '태그'를 적용하여 비정상적인 데이터 패턴이나 잠재적으로 이상 값을 식별하는 데 도움을 주었습니다. 그런 다음 홀수 값과 해당 값이 속한 관측소를 육안으로 확인하고 가능한 경우 인근 지역의 PM2.5, 특수 기상 조건, 작년 같은 기간의 PM2.5 값 등 여러 관련 측정값과 비교합니다.
이 데이터 분석 프로세스를 통해 오류로 판명된 값은 모두 할인되었습니다.