Packages Python pour analyse de données

7. Analyse de données multidimensionnelle/spatiales

‘Geospatial Data Abstraction Library’ est une bibliothèque de traducteurs pour les formats de données géospatiales raster et vectorielles de ‘Open Source Geospatial Foundation’  (osgeo). En tant que bibliothèque, il présente un modèle de données abstraite raster unique et un modèle de données abstraites vectorielles unique à l’application d’appel pour tous les formats pris en charge. Il est également livré avec une variété d’utilitaires de ligne de commande utiles pour la traduction et le traitement des données. Il prend de nombreux formats (pilotes) : GeoTIFF, HDF4, TIL, etc. Ce paquet n’est pas pré-chargé dans l’environnement de base Anaconda, il devra être installé.

  

La bibliothèque Python Shapefile (PyShp) fournit une prise en charge de lecture et d’écriture pour le format Shapefile de Esri. Le format Shapefile est un format de données vectorielles populaire du système d’information géographique créé par Esri. Ce package n’est pas pré-chargé dans l’environnement de base Anaconda, il devra être installé.

 

NetCDF est un ensemble de bibliothèques de logiciels et auto-décrivants, des formats de données (indépendants de la machine) qui soutiennent la création, l’accès et le partage de données scientifiques. Netcdf4-python est une interface Python de la bibliothèque netCDF C. NetCDF version 4 a de nombreuses fonctionnalités, ne se trouvent pas dans les versions antérieures de la bibliothèque et est implémenté au dessus de HDF5. Ce module peut lire et écrire des fichiers dans le nouveau format netCDF 4 et netCDF 3, et peut créer des fichiers lisibles par les clients HDF5. Ce package n’est pas pré-chargé dans l’environnement de base Anaconda, il devra être installé.

 

Il s’agit d’un package Python pour la manipulation et l’analyse d’objets géométriques planaires. Il est basé sur les bibliothèques GEOS (le moteur de PostGIS) et JTS (à partir de laquelle GEOS est porté). Shapely ne se préoccupe pas des formats de données ou des systèmes de coordonnées, mais peut être facilement intégré avec les packages qui le sont. Ce package n’est pas pré-chargé dans l’environnement de base Anaconda, il devra être installé.

  

Interface Python à PROJ (bibliothèque de projections cartographiques et de transformations de coordonnées). Ce package n’est pas pré-chargé dans l’environnement de base Anaconda, il devra être installé.

 

GeoPandas est un package Python pour faciliter le travail avec les données géospatiales en python. GeoPandas étend les types de données utilisés par les pandas pour permettre des opérations spatiales sur les types géométriques. Les opérations géométriques sont effectuées par shapely. Geopandas dépend en outre de fiona pour l’accès aux fichiers et de descartes et matplotlib pour le traçage. L’objectif de GeoPandas est de faciliter le travail avec les données géospatiales en python. Il combine les capacités des pandas et shapely, fournissant des opérations géospatiales dans pandas et une interface de haut niveau à plusieurs géométries vers shapely. GeoPandas vous permet de faire facilement des opérations en python qui nécessiteraient autrement une base de données spatiale comme PostGIS. Ce package n’est pas pré-chargé dans l’environnement de base Anaconda, il devra être installé.   


Il s’agit d’un package Python qui fonctionne avec des tableaux multidimensionnels étiquetés. Xarray introduit des étiquettes sous forme de dimensions, de coordonnées et d’attributs au-dessus des tableaux bruts de type NumPy, ce qui permet une expérience de développeur plus intuitive, plus concise et moins sujette aux erreurs. Le package comprend une vaste bibliothèque croissante de fonctions agnostiques de domaine pour l’analyse avancée et la visualisation avec ces structures de données. Xarray a été inspiré par et emprunte fortement aux pandas, le package populaire d’analyse de données axé sur les données tabulaires étiquetées. Il est particulièrement adapté au travail avec les fichiers netCDF, qui ont été la source du modèle de données de xarray, et s’intègre étroitement avec dask pour le cacul numérique en parallèle. Ce package n’est pas pré-chargé dans l’environnement de base Anaconda, il devra être installé.