Los valores periféricos de una ciudad con varias estaciones se filtran cuando se calcula la media horaria: los valores extremos se descartan. El analista de datos aplicó cierto "etiquetado" a todo el conjunto de datos, lo que nos ayuda a identificar patrones de datos inusuales o valores potencialmente periféricos. A continuación, los valores impares y las estaciones a las que pertenecen se comprueban visualmente y se comparan con múltiples medidas relacionadas, como las PM2,5 de las zonas cercanas cuando están disponibles, las condiciones meteorológicas especiales, el valor de PM2,5 del mismo periodo del año anterior, etc.
Se descartaron todos los valores considerados erróneos mediante este proceso de análisis de datos.