đŸŽ¶ Qui donc chante ici ?


Les yeux encore lourds de sommeil, les ornithologues admirĂšrent les pĂąles rayons du soleil levant peignant d’or les rares brumes nappant encore le sol d’un chemin forestier tout humide de rosĂ©e, avant de se laisser charmer par les chants d’oiseaux, fort nombreux, fort riches et forts variĂ©s Ă  cette heure matutinale. Le chƓur de l’aube s’Ă©tant tu, il Ă©tait temps de se mettre au travail


Quand on dĂ©bute dans l’apprentissage de l’ornithologie, la premiĂšre difficultĂ© consiste Ă  reconnaĂźtre et Ă  dire le nom les oiseaux rencontrĂ©s : Grive litorne, Buse variable, Rouge-gorge familier, Fauvette pitchou… Et l’on doit apprendre, patiemment, les critĂšres utiles Ă  cette identification : la taille de l’oiseau, son plumage, son allure, son vol, son habitat
 et son chant.

Les ornithologues chevronnĂ©s, en effet, savent reconnaĂźtre les oiseaux avant que de les voir, et mĂȘme, parfois, sans jamais les voir du tout. Comme ils brillent d’admiration, les yeux du dĂ©butant, quand le spĂ©cialiste annonce avoir entendu une Rousserole effarvate, une Locustelle luscinoide, ou un Gorgebleu Ă  miroir. Ne sont-ils pas un peu sorciers , ces gens-lĂ  ?

Et le dĂ©butant s’entraĂźne sur le terrain, Ă  reconnaĂźtre Ă  la vue ou Ă  l’ouĂŻe, les oiseaux de sa rĂ©gion, et il travaille Ă  la maison, sur ses livres et son ordinateur. Et puis, un jour, il fait la connaissance d’un professeur patient, talentueux, et disponible autant que de besoin, une sorte d’enchanteur, dont le nom, ĂŽ merveilleuse coĂŻncidence, est Merlin ! J’ai dĂ©jĂ  parlĂ© de ce professeur Ă©patant, qui prend place dans les ordinateurs, les tablettes et les tĂ©lĂ©phones, afin d’apporter son expertise sur le terrain. Merlin, donc, aide Ă  la reconnaissance visuelle et auditive des oiseaux rencontrĂ©s. Et c’est cette reconnaissance des chants d’oiseaux que je souhaiterais aborder aujourd’hui.

Imaginez !  Vous ĂȘtes sur un chemin forestier, Ă  l’aube. À votre droite, des bois; Ă  votre gauche une clairiĂšre. Vous entendez deux oiseaux dans le bois et un oiseau dans la prairie. Merlin est ouvert sur votre tĂ©lĂ©phone, et vous cliquez sur le gros bouton « Sound ID » : chaque fois qu’un oiseau vocalise, sa photo et son nom apparaissent, et les informations se mettent Ă  jour, au fil du temps. Et ainsi vous apprenez que les chanteurs de la forĂȘt sont une Sitelle torchepot et une Fauvette Ă  tĂȘte noire, quand celui du prĂ©, lĂ -bas, sur son piquet, est un Tarier pĂątre. Et vos jumelles confirment l’identification sonore. C’est magique, c’est Merlin !

Sound ID permet aux utilisateurs d’utiliser leur tĂ©lĂ©phone pour Ă©couter les oiseaux autour d’eux et voir s’afficher, en direct, l’identitĂ© de ceux qui chantent (image et nom), et ce pour 1 054 espĂšces d’oiseaux, avec une couverture complĂšte des États-Unis, du Canada, de l’Europe, du PalĂ©arctique occidental, ainsi qu’une couverture des espĂšces les plus communes et les plus rĂ©pandues dans les rĂ©gions nĂ©otropicales et en Inde. Sound ID fonctionne en local, sans qu’il soit nĂ©cessaire de disposer d’une connexion Ă  l’internet. 

Mais comment cette identification sonore fonctionne-t-elle ? Quelle est donc cette diablerie ?

Lorsque le tĂ©lĂ©phone lance un enregistrement sonore, Merlin le convertit, au fil de l’eau en une image appelĂ©e spectrogramme. Ce spectrogramme reprĂ©sente les frĂ©quences sonores qui apparaissent dans l’enregistrement, en fonction du temps. L’image du spectrogramme est ensuite traitĂ©e par un rĂ©seau neuronal convolutif profond. Ce modĂšle a Ă©tĂ© entraĂźnĂ© Ă  identifier les oiseaux sur la base de 140 heures d’enregistrements audio contenant des sons d’oiseaux, en plus de 126 heures d’enregistrements audio contenant des sons de fond non liĂ©s aux oiseaux, tels que des sifflements et des bruits de voiture. Pour chaque clip audio, un groupe d’experts en identification sonore de la bibliothĂšque Macaulay et de la communautĂ© eBird a trouvĂ© les moments prĂ©cis oĂč les oiseaux Ă©mettaient des sons, et a Ă©tiquetĂ© ces sons avec les espĂšces d’oiseaux correspondantes. Le modĂšle peut utiliser cette supervision dĂ©taillĂ©e des experts pour apprendre Ă  prĂ©dire correctement les espĂšces qui apparaissent dans ces clips audio annotĂ©s, dans le but de gĂ©nĂ©raliser cette connaissance et prĂ©dire quels oiseaux apparaissent dans des enregistrements audio jamais entendus auparavant.

Une fois la base de donnĂ©es de sons constituĂ©e,  le modĂšle est entraĂźnĂ© Ă  l’aide d’un algorithme de rĂ©tro-propagation du gradient. Lorsque le modĂšle « entend » un extrait sonore, il fait une prĂ©diction basĂ©e sur la transformation du spectrogramme de l’extrait sonore par une sĂ©rie d’opĂ©rations mathĂ©matiques impliquant des millions de nombres (appelĂ©s poids). L’algorithme de rĂ©tro-propagation du gradient dĂ©termine comment ajuster la valeur de chaque poids pour que les prĂ©dictions du modĂšle correspondent Ă  celles des experts en identification sonore. Ce processus de mise Ă  jour des poids constitue la partie « apprentissage » de l’apprentissage automatique.

La construction du modĂšle d’identification des sons est donc un processus itĂ©ratif, impliquant un va-et-vient entre les experts en identification des sons, les membres de l’Ă©quipe d’apprentissage automatique et les personnes qui fournissent un retour d’information basĂ© sur les tests de l’application sur le terrain. Trois Ă©quipes, donc !

AprĂšs avoir Ă©valuĂ© les performances d’un modĂšle formĂ©, des ajustements sont apportĂ©s Ă  l’algorithme d’apprentissage, et il est demandĂ© aux experts en identification sonore d’Ă©tiqueter davantage de clips audio et essayons de localiser les erreurs humaines dans les donnĂ©es prĂ©cĂ©demment Ă©tiquetĂ©es.

Merlin n’est pas le premier Ă  utiliser des rĂ©seaux neuronaux convolutifs profonds pour identifier les oiseaux par leurs sons. En fait, Merlin s’inspire d’un certain nombre d’autres projets, notamment BirdNET et BirdVox. Il existe de nombreuses autres approches de l’identification des sons d’oiseaux au fil des ans, qui sont le rĂ©sultat de concours d’ingĂ©nierie tels que BirdClef et DCASE, parmi beaucoup d’ autres. Des techniques similaires ont Ă©tĂ© utilisĂ©es pour surveiller l’activitĂ© des chauves-souris, et pour trouver des modĂšles dans les chants de baleines.

Les modĂšles antĂ©rieurs d’identification des sons d’oiseaux ont gĂ©nĂ©ralement Ă©tĂ© formĂ©s Ă  l’aide de donnĂ©es dont le niveau de rĂ©solution temporelle Ă©tait plus grossier. Par exemple, un modĂšle peut entendre un enregistrement de 30 secondes d’une Sittelle torchepot, mais ne pas savoir quand la sittelle chante dans l’enregistrement. Cela peut poser problĂšme : si d’autres espĂšces chantent dans le mĂȘme enregistrement, le modĂšle considĂ©rera Ă  tort que toutes les espĂšces prĂ©sentes dans l’enregistrement sont des Sittelles torchepot, ce qui entraĂźnera des propositions erronĂ©es. L’outil d’identification sonore de Merlin est formĂ© Ă  l’aide de donnĂ©es audio intĂ©grant les moments prĂ©cis oĂč chaque oiseau vocalise. Le processus de gĂ©nĂ©ration de ces donnĂ©es demande beaucoup de travail, car il exige des experts en identification sonore qu’ils Ă©coutent attentivement chaque fichier audio. GrĂące Ă  ces efforts, le modĂšle a la possibilitĂ© d’apprendre une reprĂ©sentation plus prĂ©cise des sons correspondant Ă  chaque espĂšce (et des sons ambiants). Des recherches rĂ©centes confirment que des Ă©tiquettes temporellement fines peuvent contribuer Ă  amĂ©liorer les performances de la classification audio.

Les enregistrements audio inclus dans Merlin tentent de couvrir toute la gamme de variations des Ă©missions sonores de chaque espĂšce, et sont sĂ©lectionnĂ©s et Ă©ditĂ©s par l’Ă©quipe de la bibliothĂšque Macaulay et ses partenaires. 

Enfin, il est bon de savoir que tout un chacun peut aider Merlin Sound ID Ă  enrichir sa base de donnĂ©es en enregistrant des oiseaux sur son tĂ©lĂ©phone, en les tĂ©lĂ©chargeant sur les listes de contrĂŽle eBird et en Ă©tiquetant les espĂšces audibles dans l’enregistrement. Les conseils de la bibliothĂšque Macaulay en matiĂšre d’enregistrement sur smartphone sont un excellent point de dĂ©part pour ceux qui dĂ©sireraient participer Ă  cette aventure !

Finalement, et pour résumer, on peut dire que Merlin est aux oiseaux ce que Shazam est à la musique !

SOURCES

  1. Behind the Scenes of Sound ID in Merlin. Benjamin Hoffman and Grant Van Horn 22 Jun 2021
  2. Voir une vidĂ©o de dĂ©monstration de l’application
  3. Site internet de Merlin
  4. Site internet de eBird

2 réflexions sur “đŸŽ¶ Qui donc chante ici ?

  1. Pingback: Quand la nature murmure… | Mirabilia naturae

  2. Pingback: À syrinx dĂ©ployĂ©es ! | Mirabilia naturae

Laisser un commentaire