La plateforme AirVisual a pour but de centraliser et d'agréger en un seul endroit autant d'informations que possible sur la qualité de l'air, afin de fournir l'aperçu le plus complet de la qualité de l'air à l'échelle mondiale.
Les sources de données qui sont rapportées par la plateforme AirVisual comprennent des données de capteurs, provenant de stations de surveillance gouvernementales (généralement considérées comme des "moniteurs de référence" à coût élevé), ainsi que des capteurs à faible coût tels que les stations publiques AirVisual Pro et les capteurs PurpleAir.
Toutes les données publiées par l'intermédiaire de la plateforme AirVisual sont soumises à une validation des données, et ce processus diffère entre ces deux sources de données de capteurs.
Le système de validation des données d'AirVisual est basé sur le cloud et piloté par l'apprentissage automatique, et toutes les mesures passent par ce système avant d'être publiées sur notre plateforme.
Données de capteurs gouvernementales de "référence"
Bien que les capteurs gouvernementaux coûteux soient généralement considérés comme la source la plus précise et la plus fiable de données mesurées sur la qualité de l'air, ils signalent parfois des anomalies ou des données inexactes. Cela peut s'expliquer par des périodes temporaires de maintenance ou de défauts, ou même par des sources d'émission hyperlocales temporaires à proximité du capteur.
Par conséquent, toutes les données des capteurs gouvernementaux sont soumises à un système de validation des données avant d'être publiées. Un exemple de cette validation est que le système basé sur le nuage identifie toute anomalie potentielle publiée par une station (par exemple, un pic soudain de PM2.5 de 10ug/m3 à 100ug/m3 d'une heure à l'autre), et procède à des vérifications croisées avec d'autres mesures à proximité pour vérifier si ce pic est représentatif ou s'il s'agit d'une anomalie. Le processus de validation procède également à des vérifications croisées avec des modèles historiques et d'autres paramètres tels que les conditions météorologiques. La valeur sera alors publiée ou actualisée en conséquence.
Capteurs à faible coût
Les mesures effectuées par des capteurs bon marché sont également soumises à un processus d'étalonnage et de correction des données, en plus du processus de validation décrit ci-dessus, qui permettra d'identifier et d'écarter les relevés anormaux.
Le système appliqué aux capteurs bon marché prend en compte les conditions environnantes telles que la température, l'humidité, la composition de la pollution et applique un algorithme d'étalonnage des données basé sur les conditions environnementales. Par exemple, un taux d'humidité élevé peut, dans certaines circonstances, conduire les capteurs à faible coût à surestimer les niveaux de PM2,5. De même, la composition de la pollution (pollution générée par les transports, tempêtes de sable, pollution à base de charbon, etc.) affecte grandement la mesure et la plateforme AirVisual utilise l'imagerie satellite pour déterminer la composition de la pollution à utiliser dans le mécanisme d'étalonnage. C'est pourquoi cet algorithme de correction de l'étalonnage & prend en compte les niveaux d'humidité locaux et d'autres paramètres environnementaux, en plus des modèles historiques régionaux, et ajuste les mesures de PM2.5 en conséquence.
Le niveau d'ajustement est déterminé par le système basé sur le cloud qui est construit sur l'intelligence artificielle & machine learning. En agrégeant des milliards de points de données sur la qualité de l'air au niveau mondial pendant de nombreuses années, à partir de capteurs de référence, de capteurs AirVisual, de données météorologiques et de la composition de la pollution à partir d'images satellite, ce système a appris les relations historiques complexes entre les différents paramètres de la qualité de l'air dans les différentes parties du monde.
La composition des particules pouvant varier considérablement d'une région du monde à l'autre, il est essentiel de faire la distinction entre les corrélations entre les particules et des facteurs tels que l'humidité au niveau local ou régional. Ces corrélations peuvent varier considérablement en fonction des différentes compositions locales des particules et doivent donc être prises en compte dans les algorithmes d'étalonnage et de correction locaux.