Nous avons, dans une autre chronique, « vanté » l’intérêt de la collecte de données par des bénévoles participant à des programmes de sciences participatives pour modéliser l’expansion en cours d’espèces animales dans le cadre du réchauffement climatique. A cette occasion, nous avions présenté un exemple français, celui de la plate forme Faune-France (et ses déclinaisons régionales) avec ses soixante mille collaborateurs bénévoles qui collectent des millions de données tout particulièrement sur les oiseaux. Or, en matière de conservation de la biodiversité, un des grands enjeux actuels est de repérer les évolutions des populations des oiseaux dits communs et répandus car on sait que nombre de ces espèces accusent un fort déclin très inquiétant depuis quelques décennies. Est-ce que les données recueillies dans le cadre d’une plate-forme comme Faune-France permettent de détecter de telles tendances et avec quelle précision ? C’est la question que se sont posés des ornithologues du Danemark, pays où existe aussi une plate-forme du même type (1).

Collecte structurée

Depuis plus de trente ans et donc bien avant l’avènement de ces plates-formes en ligne, il existe des programmes de suivi des populations d’oiseaux communs (dont le programme Suivi Temporel des Oiseaux Communs STOC en France depuis 1989 (2)) sous la forme de points d’écoute où l’observateur note pendant un certain temps (5 minutes par exemple) tous les oiseaux contactés et leur nombre. A partir des données ainsi collectées, par traitement statistique, on peut en déduire des tendances d’évolution relativement fiables des populations des espèces recensées.

Au Danemark, un tel programme de suivi, qualifié de structuré par les auteurs de l’étude, existe depuis 1975 sous des modalités sensiblement différentes du programme STOC : un observateur volontaire choisit lui-même un itinéraire continu avec 10 à 20 points espacés de 300 mètres environ ; sur chaque point, il effectue une écoute de 5 minutes pendant la période de nidification (01/05-15/06). En France, les points sont tirés au hasard pour éviter le biais des préférences de l’observateur pour tel ou tel milieu ; néanmoins, au Danemark, la couverture globale du pays semble équilibrée avec 300 à 400 itinéraires ainsi échantillonnés chaque année et couvrant la majorité des milieux existant sans qu’il n’y ait une surreprésentation des milieux urbains (biais classique !). Cette méthode très structurée demande aux observateurs beaucoup de rigueur et le respect d’un protocole précis ce qui limite sa pratique à un petit nombre d’amateurs volontaires et motivés (très motivés en général). On se situe néanmoins quand même dans le cadre d’un programme de sciences participatives très exigeant puisque ce sont des observateurs bénévoles qui l’alimentent.

… versus non structurée

Depuis 2003, au Danemark, une plate-forme de collecte des observations d’oiseaux fonctionne sur le mode de Faune-France (voir la chronique) : Dansk Ornitologisk Forening (D.O.F.). Les nombreux bénévoles collaborateurs entrent leurs observations sur le mode : une espèce/une date/un lieu géolocalisé. Sur un site donné, on peut rentrer plusieurs observations réalisées en même temps. Plus de douze millions de données ont ainsi été engrangées en 28 ans car les observateurs ont inclus des données antérieures à 2003 qu’ils avaient conservé dans leurs carnets de terrain.

Ce mode de collecte est qualifié de non structuré car il repose sur un protocole très minimaliste qu’on pourrait résumer en : « je vois un oiseau qui m’interpelle et je le note ». On sait que ces données présentent des biais considérables : les observations se font au hasard, sur des durées très variables et n’apportent des informations qu’en terme de présence de l’espèce. Il y a notamment un très fort biais en faveur des milieux urbanisées où résident un maximum d’observateurs ou de certains sites emblématiques ou faciles d’accès où l’on peut observer des espèces « intéressantes » au sens de peu communes ou spectaculaires (comme sur certains plans d’eau par exemple). L’autre biais majeur concerne les espèces notées : les observateurs tendent à ne noter que certains espèces, les moins communes ou celles qui les interpellent le plus, et à délaisser les espèces très communes considérées comme « inintéressantes » parce que banales.

Devant ces deux modes diamétralement opposés de collecte d’observations d’oiseaux, la question explorée par l’étude danoise est donc la suivante : quelle est l’efficacité relative de ces deux modes (structuré versus non-structuré) pour détecter des tendances significatives dans l’évolution des effectifs des populations d’oiseaux communs ? Le second (plate-forme en ligne), en pleine expansion et très médiatisé, peut-il suffire seul à détecter de manière fiable ces variations, enjeu majeur de conservation des espèces ?

Oups !

Les chercheurs danois ont donc sélectionné 103 espèces d’oiseaux communs et répandus et, à partir de modèles statistiques adaptés à chacune des deux bases de données (tenant compte de leurs spécificités), ont dégagé les tendances d’évolution des effectifs de ces espèces sur la même période de 28 ans (1986-2013). Avec les données du suivi structuré (les itinéraires d’échantillonnage avec points d’écoute), on trouve 60 espèces avec un déclin significatif à long terme au niveau de leur abondance (espèces en déclin dans la suite), 26 en augmentation (espèces en progression) et 17 aux effectifs stables ou fluctuant mais sans tendance nette (espèces stables ou presque). L’exploitation des données collectées en ligne donne quant à elle un tout autre verdict : 20 espèces en déclin, 49 en progression et 34 stables ou presque ! Sacré décalage !

La direction de la tendance (augmentation ou diminution) ne coïncidait que pour moins de la moitié des espèces ; la majorité des espèces évaluées en déclin par le mode structuré étaient estimées stables ou en augmentation par le mode non structuré ! Si on simplifie à l’extrême les données des suivis structurés en ne conservant que la présence/absence (sans prendre en compte les nombres), le décalage persiste néanmoins ! Les suivis structurés présentent donc un avantage considérable intrinsèque en termes de fiabilité pour détecter ces tendances d’évolution des populations ; le corollaire de ce constat est qu’il faut utiliser avec la plus grande prudence les données non structurées collectées sur les plates-formes en ligne pour effectuer ce type de diagnostic. Les chercheurs ont essayé réciproquement de filtrer dans les bases non structurées les données les plus informatives pour refaire un diagnostic ; mais, le filtrage réduit tellement le nombre de données que toute exploitation devient illusoire.

Pourquoi ?

Comment expliquer un tel décalage entre ces deux modes de collecte ? Les chercheurs ont détecté trois grandes variables explicatives : la taille des populations (espèces communes/rares), la taille des espèces (gros/petit) et la préférence d’habitat. Globalement, le décalage est très fort pour les espèces abondantes (comme le merle noir, le pinson des arbres ou l’alouette des champs) et moyen pour les oiseaux petits des milieux forestiers et des zones humides de l’intérieur. Le seuil pour la taille des oiseaux semble se situer autour de 500 grammes : les oiseaux en dessous de ce poids étant mal évalués par la méthode non structurée.

La collecte classique en ligne se fait donc avec comme seule information la présence ; or, des espèces très communes peuvent décliner sur une longue période avant de disparaître complètement d’un lieu donné ; elles resteront néanmoins contactées durant toute cette période. Le fait que les « petits » oiseaux soient moins bien évalués tient sans doute à un biais des observateurs lambda plus attirés par les grandes espèces plus spectaculaires et en général plus rares ou aussi plus attractives pour les amateurs de photos (pratique qui se superpose de plus en plus avec l’explosion de la photo numérique).

Un biais insidieux a pu aussi se glisser dans le cas du Danemark via l’incorporation a posteriori de données collectées avant 2003 ; celles-ci l’ont été surtout par des observateurs motivés et chevronnés qui ont peut-être entré sélectivement les observations d’espèces qu’ils considèrent intéressantes ; après 2003, sont venus se rajouter en masse des observateurs avec une culture différente qui, notamment pour les débutants, entrent plus de données sur des oiseaux très communs qu’ils observent près de chez eux, introduisant ainsi une distorsion !

Un autre biais concerne la diffusion médiatisée des résultats obtenus via les suivis structurés : l’opinion publique s’est ainsi trouvée alerté sur le déclin massif du moineau domestique dans les paysages agricoles (voir les chroniques sur le moineau) ou du pouillot fitis comme exemple de migrateur au long cours. Ainsi, ces espèces ont du inconsciemment devenir « intéressantes » auprès de nombreux observateurs qui ne les notaient pas auparavant !

Le fort déclin des moineaux domestiques tant en ville que dans les zones agricoles a été médiatisé et a focalisé l’attention des observateurs sur cette espèce, qui, auparavant, était plutôt négligée

Pas que des défauts !

Site protégé de l’étang de Pulvérières en Auvergne (63) : un site très fréquenté et suivi par de nombreux ornithologues locaux.

Jusqu’ici, on crie un peu haro sur le baudet à propos des données non structurées. Les chercheurs soulignent cependant qu’il se pourrait que les suivis structurés ne soient pas très efficaces pour couvrir certains types de milieux ; ils ont été conçus pour évaluer avant tout les espèces communes et répandues. Ils seraient donc peu efficaces pour couvrir des espèces à forts effectifs mais localisées dans des milieux ponctuels comme les zones humides. Justement, dans cette étude, on note un décalage entre les deux modes mais plutôt en faveur des données non structurées. Ceci peut s’expliquer par le fait que ces milieux attirent les observateurs ponctuels qui les fréquentent souvent assidument surtout quand il y a des observatoires ; certains sites connaissent ainsi plus de 500 visites par an ! Dans ce cas, une multitude d’observations réparties dans le temps mais concentrées sur quelques lieux peuvent s’avérer plus porteuses d’informations fiables pour détecter des tendances d’évolution des effectifs.

Autrement dit, il ne faut pas pour autant décrier la collecte occasionnelle mais al considérer comme complémentaire et surtout bien en connaître les limites.

Des solutions

Les auteurs de l’étude concluent sur un avertissement : ne surtout pas abandonner le suivi structuré via des points d’écoute avec l’espoir que les données occasionnelles collectées via les plates-formes rempliraient le même rôle avec la même précision et la même puissance. Il faut même poursuivre l’effort de recrutement de nouveaux collaborateurs. Une certaine euphorie générée par l’engouement pour les sciences participatives et leur médiatisation tend à se propager ; elle ne doit pas conduire à « snober » les méthodes plus contraignantes et moins médiatisées au risque de perdre toute fiabilité pour repérer les tendances d’évolution des populations.

Ils préconisent donc un certain nombre d’actions pour essayer d’améliorer la valeur prédictive des données collectées sur ces plates-formes. Encourager les observateurs lambda à visiter des sites peu fréquentés pourrait améliorer la collecte ; on pourrait proposer à chaque observateur de chercher dans son environnement proche cinq sites très peu répertoriés sur la plate-forme et à les suivre régulièrement. Attirer l’attention sur le fait que les espèces communes ou très communes sont tout aussi intéressantes que les rares et qu’elles peuvent faire l’objet d’évolutions très négatives non perceptibles directement.

Enfin, la solution la plus efficace pour une amélioration relative de leur exploitation serait de « faire des listes », méthode déjà en vigueur depuis longtemps aux USA, en Allemagne ou en Suisse : sur un site donné, en un temps donné choisi par l’observateur, on note toutes les espèces contactées sans exception, et leurs effectifs. Ce type de collecte a été introduit sur la base danoise récemment et existe déjà sur les bases Faune-France : c’est le mode « formulaire ». il est encore assez peu utilisé par les observateurs : la généralisation de son usage devrait permettre de mieux exploiter ces données sans pour autant les rendre aussi performantes que des données des suivis structurés. Observateurs d’un jour, à vos formulaires donc !

BIBLIOGRAPHIE

  1. Unstructured citizen science data fail to detect long-term population declines of common birds in Denmark. J. Kamp et al. Diversity and distributions. 2016
  2. Programme STOC site : http://www.vigie-plume.fr
  3. Plate-forme danoise : http://www.dof.dk
  4. Site Faune-Auvergne pris comme exemple pour les illustrations : http://www.faune-auvergne.org/index.php