जिस शहर में कई स्टेशन हैं, वहां के बाहरी मूल्यों को प्रति घंटा औसत औसत की गणना करते समय फ़िल्टर किया जाता है: चरम मूल्यों को छूट दी जाएगी। डेटा विश्लेषक ने पूरे डेटासेट पर कुछ "टैगिंग" लागू की जो हमें असामान्य डेटा पैटर्न या संभावित रूप से बाहरी मूल्यों की पहचान करने में मदद करती है। फिर विषम मूल्यों और वे जिन स्टेशनों से संबंधित हैं, उनकी जांच की जाती है और कई संबंधित उपायों के साथ तुलना की जाती है, जैसे कि आसपास के क्षेत्रों का पीएम 2.5 जहां उपलब्ध है, विशेष मौसम की स्थिति, पिछले वर्ष की समान अवधि का पीएम 2.5 मूल्य आदि।
इस डेटा विश्लेषण प्रक्रिया के माध्यम से गलत पाए गए किसी भी मान को छूट दी गई।