Lors de la production de cartes continentales pour surveiller par ex. la production agricole, vous avez besoin de quantités massives de données d’observation de la terre, et vous avez également besoin d’un environnement professionnel et adapté pour traiter facilement les données et récupérer les information dont vous avez besoin.
Dans ce cas, nous vous expliquons comment vous pouvez utiliser openEO pour produire des cartes continentales des types de cultures. Découvrez-en plus sur les possibilités, la configuration et les défis à relever, y compris la collecte de données de formation, la puissance de calcul, les techniques DevOps, le traitement parallèle, les principes FAIR, les catalogues de données, la reproductibilité.
Terrascope est membre de la plateforme openEO, qui facilite et rend plus abordable le traitement et l’analyse de grandes quantités de données d’observation de la Terre. En utilisant des interfaces standardisées, vous pouvez accéder et traiter des données provenant de diverses sources et exécuter le même algorithme sur différentes plates-formes cloud, indépendamment de toute technologie spécifique.
Ce flux de travail de cartographie des types de cultures développé par VITO Remote Sensing est un exemple que nous avons mis en œuvre pour démontrer cette plate-forme basée sur des normes. Il utilise différents types d’entrées de données et un modèle d’apprentissage automatique. Le flux de travail est implémenté en deux parties, appelées prétraitement et inférence.
Dans la partie de prétraitement, les données sont collectées sur une période de 8 mois à partir de diverses sources, notamment les données WorldCover, les données Sentinel-2 L2A, les données Sentinel-1 GRD et les données Copernicus 30m DEM.
Dans la deuxième partie d’inférence, le cube de données prétraité est entré dans un modèle d’apprentissage automatique. Le modèle prend en entrée l’évolution d’un pixel dans le temps et ne tient pas compte du contexte spatial, car avoir plusieurs bandes et le profil temporel étaient suffisants dans ce cas. Le modèle produit ensuite un résultat qui cartographie le type de culture pour chaque pixel du cube de données.
Pour exécuter des flux de travail sur openEO, les algorithmes doivent être traduits en flux de travail openEO indépendants de la technologie, appelés ‘graphiques de processus’. Dans ce cas, le flux de travail a été développé en Python. Bien que le code résultant ressemble à n’importe quel autre algorithme, openEO réduit la quantité de code Python en gérant toute la complexité (par exemple, la recherche de données, la lecture efficace, la gestion du chevauchement, le calcul de la rétrodiffusion, la composition) du côté du backend.
Il s'agit d'un avantage considérable en termes de reproductibilité et de science ouverte pour les data scientistes qui ont besoin de maintenir le code et les réviseurs qui ont besoin de comprendre le code pour analyser la méthodologie ou reproduire les résultats.
OpenEO a également été utilisé pour exécuter un modèle d’apprentissage automatique basé sur PyTorch. Nous avons utilisé les ‘fonctions définies par l’utilisateur’ openEO pour exécuter du code Python arbitraire qui transforme les structures de données XArray dans le cadre du flux de travail openEO. Alors que openEO contient plus de 100 fonctions prédéfinies, nous avons toujours besoin de fonctions définies par l’utilisateur pour implémenter des cas comme l’apprentissage en profondeur qui n’ont pas encore été standardisés. Autoriser le code défini par l’utilisateur augmente considérablement le nombre de cas d’utilisation pouvant être traduits en openEO et est également pratique pour les cas où une traduction complète en fonctions prédéfinies d’openEO serait coûteuse. Dans l’ensemble, cela démontre la flexibilité et d’adaptabilité d’openEO dans la prise en charge d’un large éventail de cas d’utilisation pour travailler avec des données d’observation de la Terre à grande échelle.
The openEO platform makes it possible to run the large scale processing on multiple infrastructures, including Terrascope. This gives a reasonable amount of bandwidth and ensures the continuation of the processing even if one backend experiences issues. This concept is referred to as ‘federated processing’, and is also a key element in Destination Earth, a part of the European Union digital strategy. More details on how we setup and performed the actual processing can be found in this document.
La plate-forme openEO permet d’exécuter le traitement à grande échelle sur plusieurs infrastructures, y compris Terrascope. Cela donne une quantité raisonnable de bande passante et garantit la poursuite du traitement même si un backend rencontre des problèmes.
Ce concept est appelé ‘traitement fédéré’ et constitue également un élément clé de Destination Earth, qui fait partie de la stratégie numérique de l'Union européenne. Pour tous ceux qui souhaitent obtenir plus de détails sur la façon dont nous avons configuré et effectué le traitement proprement dit, regarde ce document.
La carte continentale des types de cultures produite via openEO se compose de plus de 11.000 fichiers Geotiff optimisés pour le cloud, qui sont accompagnés de métadonnées STAC qui contiennent des liens vers des produits d’entrée pour la provenance.
Cependant, la gestion et l’inspection d’un tel volume de données est un défi, c’est pourquoi l’équipe de la plate-forme openEO explore les moyens de permettre la publication automatique d’un STAC et de mettre en place des services de visualisation pour inspecter les résultats à grande échelle.
La carte finale est disponible en tant que collection expérimentale sur la plateforme openEO et peut être visualisée dans l'éditeur openEO editor. Cette carte continentale des types de cultures a été créée à des fins de démonstration uniquement. Il convient donc de garder à l'esprit que certains problèmes doivent encore être résolus avant qu'elle ne puisse être utilisée dans les services opérationnels. L’objectif est de remplacer la carte par une version plus précise d’ici fin 2023.
openEO a produit plus de 11. 000 tuiles de 20 par 20 km.
La carte des types de cultures montre 6 catégories de cultures classées.
Plus de 91K heures de processeur ont été consacrées à la plate-forme pour la production et les tests de ce flux de travail.
La plate-forme openEO vous permet d’accéder et de traiter des données provenant de diverses sources et également d’exécuter le même algorithme sur différentes plates-formes cloud.
Les données WorldCover sont utilisées pour créer un masque binaire, ne retenant que les pixels représentant l’agriculture, afin de s’assurer que seuls les pixels pertinents sont traités ultérieurement.
Les données Sentinel-2 L2A et Sentinel-1 GRD ont également été utilisées dans la partie prétraitement.