🎶 Qui donc chante ici ?


Les yeux encore lourds de sommeil, les ornithologues admirèrent les pâles rayons du soleil levant peignant d’or les rares brumes nappant encore le sol d’un chemin forestier tout humide de rosĂ©e, avant de se laisser charmer par les chants d’oiseaux, fort nombreux, fort riches et forts variĂ©s Ă  cette heure matutinale. Le chĹ“ur de l’aube s’Ă©tant tu, il Ă©tait temps de se mettre au travail…

Quand on dĂ©bute dans l’apprentissage de l’ornithologie, la première difficultĂ© consiste Ă  reconnaĂ®tre et Ă  dire le nom les oiseaux rencontrĂ©s : Grive litorne, Buse variable, Rouge-gorge familier, Fauvette pitchou… Et l’on doit apprendre, patiemment, les critères utiles Ă  cette identification : la taille de l’oiseau, son plumage, son allure, son vol, son habitat… et son chant.

Les ornithologues chevronnés, en effet, savent reconnaître les oiseaux avant que de les voir, et même, parfois, sans jamais les voir du tout. Comme ils brillent d’admiration, les yeux du débutant, quand le spécialiste annonce avoir entendu une Rousserole effarvate, une Locustelle luscinoide, ou un Gorgebleu à miroir. Ne sont-ils pas un peu sorciers , ces gens-là ?

Et le dĂ©butant s’entraĂ®ne sur le terrain, Ă  reconnaĂ®tre Ă  la vue ou Ă  l’ouĂŻe, les oiseaux de sa rĂ©gion, et il travaille Ă  la maison, sur ses livres et son ordinateur. Et puis, un jour, il fait la connaissance d’un professeur patient, talentueux, et disponible autant que de besoin, une sorte d’enchanteur, dont le nom, Ă´ merveilleuse coĂŻncidence, est Merlin ! J’ai dĂ©jĂ  parlĂ© de ce professeur Ă©patant, qui prend place dans les ordinateurs, les tablettes et les tĂ©lĂ©phones, afin d’apporter son expertise sur le terrain. Merlin, donc, aide Ă  la reconnaissance visuelle et auditive des oiseaux rencontrĂ©s. Et c’est cette reconnaissance des chants d’oiseaux que je souhaiterais aborder aujourd’hui.

Imaginez !  Vous ĂŞtes sur un chemin forestier, Ă  l’aube. Ă€ votre droite, des bois; Ă  votre gauche une clairière. Vous entendez deux oiseaux dans le bois et un oiseau dans la prairie. Merlin est ouvert sur votre tĂ©lĂ©phone, et vous cliquez sur le gros bouton « Sound ID » : chaque fois qu’un oiseau vocalise, sa photo et son nom apparaissent, et les informations se mettent Ă  jour, au fil du temps. Et ainsi vous apprenez que les chanteurs de la forĂŞt sont une Sitelle torchepot et une Fauvette Ă  tĂŞte noire, quand celui du prĂ©, lĂ -bas, sur son piquet, est un Tarier pâtre. Et vos jumelles confirment l’identification sonore. C’est magique, c’est Merlin !

Sound ID permet aux utilisateurs d’utiliser leur tĂ©lĂ©phone pour Ă©couter les oiseaux autour d’eux et voir s’afficher, en direct, l’identitĂ© de ceux qui chantent (image et nom), et ce pour 1 054 espèces d’oiseaux, avec une couverture complète des États-Unis, du Canada, de l’Europe, du PalĂ©arctique occidental, ainsi qu’une couverture des espèces les plus communes et les plus rĂ©pandues dans les rĂ©gions nĂ©otropicales et en Inde. Sound ID fonctionne en local, sans qu’il soit nĂ©cessaire de disposer d’une connexion Ă  l’internet. 

Mais comment cette identification sonore fonctionne-t-elle ? Quelle est donc cette diablerie ?

Lorsque le tĂ©lĂ©phone lance un enregistrement sonore, Merlin le convertit, au fil de l’eau en une image appelĂ©e spectrogramme. Ce spectrogramme reprĂ©sente les frĂ©quences sonores qui apparaissent dans l’enregistrement, en fonction du temps. L’image du spectrogramme est ensuite traitĂ©e par un rĂ©seau neuronal convolutif profond. Ce modèle a Ă©tĂ© entraĂ®nĂ© Ă  identifier les oiseaux sur la base de 140 heures d’enregistrements audio contenant des sons d’oiseaux, en plus de 126 heures d’enregistrements audio contenant des sons de fond non liĂ©s aux oiseaux, tels que des sifflements et des bruits de voiture. Pour chaque clip audio, un groupe d’experts en identification sonore de la bibliothèque Macaulay et de la communautĂ© eBird a trouvĂ© les moments prĂ©cis oĂą les oiseaux Ă©mettaient des sons, et a Ă©tiquetĂ© ces sons avec les espèces d’oiseaux correspondantes. Le modèle peut utiliser cette supervision dĂ©taillĂ©e des experts pour apprendre Ă  prĂ©dire correctement les espèces qui apparaissent dans ces clips audio annotĂ©s, dans le but de gĂ©nĂ©raliser cette connaissance et prĂ©dire quels oiseaux apparaissent dans des enregistrements audio jamais entendus auparavant.

Une fois la base de donnĂ©es de sons constituĂ©e,  le modèle est entraĂ®nĂ© Ă  l’aide d’un algorithme de rĂ©tro-propagation du gradient. Lorsque le modèle « entend » un extrait sonore, il fait une prĂ©diction basĂ©e sur la transformation du spectrogramme de l’extrait sonore par une sĂ©rie d’opĂ©rations mathĂ©matiques impliquant des millions de nombres (appelĂ©s poids). L’algorithme de rĂ©tro-propagation du gradient dĂ©termine comment ajuster la valeur de chaque poids pour que les prĂ©dictions du modèle correspondent Ă  celles des experts en identification sonore. Ce processus de mise Ă  jour des poids constitue la partie « apprentissage » de l’apprentissage automatique.

La construction du modèle d’identification des sons est donc un processus itĂ©ratif, impliquant un va-et-vient entre les experts en identification des sons, les membres de l’Ă©quipe d’apprentissage automatique et les personnes qui fournissent un retour d’information basĂ© sur les tests de l’application sur le terrain. Trois Ă©quipes, donc !

Après avoir Ă©valuĂ© les performances d’un modèle formĂ©, des ajustements sont apportĂ©s Ă  l’algorithme d’apprentissage, et il est demandĂ© aux experts en identification sonore d’Ă©tiqueter davantage de clips audio et essayons de localiser les erreurs humaines dans les donnĂ©es prĂ©cĂ©demment Ă©tiquetĂ©es.

Merlin n’est pas le premier Ă  utiliser des rĂ©seaux neuronaux convolutifs profonds pour identifier les oiseaux par leurs sons. En fait, Merlin s’inspire d’un certain nombre d’autres projets, notamment BirdNET et BirdVox. Il existe de nombreuses autres approches de l’identification des sons d’oiseaux au fil des ans, qui sont le rĂ©sultat de concours d’ingĂ©nierie tels que BirdClef et DCASE, parmi beaucoup d’ autres. Des techniques similaires ont Ă©tĂ© utilisĂ©es pour surveiller l’activitĂ© des chauves-souris, et pour trouver des modèles dans les chants de baleines.

Les modèles antĂ©rieurs d’identification des sons d’oiseaux ont gĂ©nĂ©ralement Ă©tĂ© formĂ©s Ă  l’aide de donnĂ©es dont le niveau de rĂ©solution temporelle Ă©tait plus grossier. Par exemple, un modèle peut entendre un enregistrement de 30 secondes d’une Sittelle torchepot, mais ne pas savoir quand la sittelle chante dans l’enregistrement. Cela peut poser problème : si d’autres espèces chantent dans le mĂŞme enregistrement, le modèle considĂ©rera Ă  tort que toutes les espèces prĂ©sentes dans l’enregistrement sont des Sittelles torchepot, ce qui entraĂ®nera des propositions erronĂ©es. L’outil d’identification sonore de Merlin est formĂ© Ă  l’aide de donnĂ©es audio intĂ©grant les moments prĂ©cis oĂą chaque oiseau vocalise. Le processus de gĂ©nĂ©ration de ces donnĂ©es demande beaucoup de travail, car il exige des experts en identification sonore qu’ils Ă©coutent attentivement chaque fichier audio. Grâce Ă  ces efforts, le modèle a la possibilitĂ© d’apprendre une reprĂ©sentation plus prĂ©cise des sons correspondant Ă  chaque espèce (et des sons ambiants). Des recherches rĂ©centes confirment que des Ă©tiquettes temporellement fines peuvent contribuer Ă  amĂ©liorer les performances de la classification audio.

Les enregistrements audio inclus dans Merlin tentent de couvrir toute la gamme de variations des Ă©missions sonores de chaque espèce, et sont sĂ©lectionnĂ©s et Ă©ditĂ©s par l’Ă©quipe de la bibliothèque Macaulay et ses partenaires. 

Enfin, il est bon de savoir que tout un chacun peut aider Merlin Sound ID Ă  enrichir sa base de donnĂ©es en enregistrant des oiseaux sur son tĂ©lĂ©phone, en les tĂ©lĂ©chargeant sur les listes de contrĂ´le eBird et en Ă©tiquetant les espèces audibles dans l’enregistrement. Les conseils de la bibliothèque Macaulay en matière d’enregistrement sur smartphone sont un excellent point de dĂ©part pour ceux qui dĂ©sireraient participer Ă  cette aventure !

Finalement, et pour résumer, on peut dire que Merlin est aux oiseaux ce que Shazam est à la musique !

SOURCES

  1. Behind the Scenes of Sound ID in Merlin. Benjamin Hoffman and Grant Van Horn 22 Jun 2021
  2. Voir une vidĂ©o de dĂ©monstration de l’application
  3. Site internet de Merlin
  4. Site internet de eBird

2 réflexions sur “🎶 Qui donc chante ici ?

  1. Pingback: Quand la nature murmure… | Mirabilia naturae

  2. Pingback: À syrinx déployées ! | Mirabilia naturae

Laisser un commentaire