Отдаленные значения в городе с несколькими станциями отфильтровываются при расчете среднечасового медианного значения: экстремальные значения будут отброшены. Аналитик данных применил некоторые "метки" ко всему набору данных, которые помогают нам выявить необычные паттерны данных или потенциально отклоняющиеся значения. Затем нечетные значения и станции, которым они принадлежат, визуально проверяются и сравниваются с несколькими сопутствующими показателями, такими как PM2.5 в близлежащих районах, где это возможно, особые погодные условия, значение PM2.5 за тот же период прошлого года и т.д.
Все значения, признанные ошибочными в процессе анализа данных, были отброшены.