Séminaire de Probabilités et Statistique
lundi 22 mai 2017 à 13:45 - SupAgro - Salle 11/204 château
Christophe Giraud (Université Paris Sud)
Faire de la science avec des données participatives?
Le suivi des variations spatio-temporelles d'abondance d'espèces requiert des données très massives. Les laboratoires scientifiques n'ont pas les ressources pour collecter de telles données par des moyens standards. Simultanément, avec Internet, de grandes quantités de données sont collectées à travers des programmes de science participative ou des réseaux sociaux. Par exemple, le labo d'ornithologie de l'université Cornell a lancé avec le National Audubon Society un site web (ebird.org) où tout citoyen peut enregistrer ses propres observations. De telles données sont très massives (par exemple, le Global Biodiversity Information Facility regroupe plus de 500 millions de comptages), mais elles sont très hétérogènes et souvent récoltées sans aucun protocole. Estimer des variations d'abondance à partir de ces données est donc très difficile. Nous présenterons un moyen d'exploiter ces données dites "opportunistes" et nous discuterons du gain (théorique et pratique) à utiliser de telles données. Nous illustrerons aussi comment de telles données peuvent permettre de répondre à de nouvelles questions en Écologie.