I valori fuori scala in una città che ha più stazioni vengono filtrati quando viene calcolata la media oraria: i valori estremi saranno scontati. L'analista dei dati ha applicato alcuni "tag" all'intero set di dati che ci aiutano a identificare modelli di dati insoliti o valori potenzialmente fuori norma. Quindi i valori dispari e le stazioni a cui appartengono vengono controllati visivamente e confrontati con diverse misure correlate, come il PM2,5 delle aree vicine, se disponibili, condizioni meteorologiche particolari, il valore del PM2,5 dello stesso periodo dell'anno precedente, ecc.
Tutti i valori ritenuti errati attraverso questo processo di analisi dei dati sono stati eliminati.