Méta-données de la musique: c’est le foutoir

Le 17 juin 2010

Certaines sociétés de répartition des droits musicaux sont assises sur un véritable trésor: on parle de 200 millions de dollars. La répartition de ces droits pourrait être facilitée par une ouverture et une standardisation des bases de données.

Le business de la musique en ligne est un panier percé. Un gruyère avec bien plus de trous que de fromage. C’est tellement le foutoir qu’une part conséquente des revenus qu’il génère n’est même pas répartie, faute de pouvoir identifier les bons ayant droit en bout de chaîne. En cause : la pauvreté des méta-données.

Le site américain Digital Music News révélait il y a peu que l’organisme de gestion collective américain SoundExchange, en charge de la perception et de la répartition des revenus du streaming non-interactif aux États-Unis (webradios et services de radio personnalisée de type Yahoo ou Pandora), était assis fin 2009 sur un trésor de guerre de 200 millions de dollars. Des royautés non répartissables, faute de pouvoir en identifier précisément les ayant droit légitimes, et qui dorment sur des comptes en banque.

Le montant de ces « irrépartissables » était de 96,7 millions de dollars fin 2006, de 192,7 millions fin 2007, et de 260 millions mi-2008, indique Digital Music News. En parallèle, le montant des royautés réparties par SoundExchange fut de 36,2 millions de dollars en 2007, de 100 millions en 2008 et de 155,5 millions en 2009. SoundExchange ne répartirait donc même pas la moitié des revenus perçus auprès des radios en ligne américaines, revenus plus de six fois supérieurs en 2007 au montant des royautés reversé à ses membres (1). Comme dirait l’autre, « Y a un blème ».

SoundExchange est revenu sur ces chiffres, après les avoir pourtant confirmés dans un premier temps. Malgré les campagnes de recrutement lancées sur le Web, invitant les artistes à s’inscrire pour réclamer leurs droits en instance, 39 millions de dollars dormiraient encore à la banque que l’organisme ne peut en effet répartir, leurs ayant droit ne figurant pas dans ses bases de données . A quoi s’ajouteraient, toujours selon les « corrections » de SoundExchange, 40 millions de dollars en souffrance en raison de méta-données incomplètes ne permettant pas d’identifier précisément des bénéficiaires pourtant inscrits dans ses bases.

En comptant les répartitions encore en instance du fait d’arbitrages que les tribunaux doivent rendre sur certains taux, et les sommes qui n’ont pas encore été reversées à SoundExchange par des sociétés de gestion étrangères, on parvient à un total de 100 millions de dollars, de royautés perçues auprès des diffuseurs sur Internet mais non réparties à fin 2009, soit 40 % des revenus de la radio en ligne qui n’atteignent pas leurs destinataires.

Des coûts de gestion exorbitants

Les standards de performance de la gestion collective sont en général bien plus élevés en Europe, pour ce qui est de la gestion des droits généraux et traditionnels, que ceux de SoundExchange dans la radio en ligne américaine. Avec des « irrépartissables » ne représentant que quelques pour cent des sommes réparties. Mais les résultats obtenus dans la gestion des droits en provenance du numérique, en revanche, ne sont pas loin d’être aussi désastreux.

Les coûts de gestion de ces droits explosent, avec des millions de lignes de reporting à traiter sur lesquelles peuvent survenir, à tout moment, des défauts d’identification liés à des méta-données de mauvaise qualité, qui vont exiger des agents chargés de la répartition de faire des recherches plus approfondies dans leur base de données d’Å“uvres et d’établir manuellement un lien entre une déclaration de diffusion ou de téléchargement et une Å“uvre déposée avec tous ses ayant droit, de l’auteur à l’arrangeur. L’opération devra être reconduite des milliers de fois, pour ne répartir que des centimes d’euros à chaque fois.

C’est un véritable plaie pour les sociétés de gestion collective, une bombe à retardement en terme d’évolution de leurs coûts de répartition, qui ne concerne heureusement pour l’instant que la part congrue de leurs perceptions, mais mobilise déjà l’essentiel de leurs investissements informatiques, pour automatiser le plus possible des traitements dont le coût est aujourd’hui supérieur aux sommes qu’ils permettent de répartir…

La mauvaise qualité des méta-données de la musique en ligne grippe le moteur. C’est elle qui est principalement en cause. Le business y perd beaucoup en efficience, et surtout en opportunités d’affaires, en hypothéquant toute l’innovation dans les services et les modèles économiques qui pourrait s’appuyer sur un accès ouvert des développeurs de services Web, via des bibliothèques d’API, à un réservoir de méta-données propres et exhaustives.

L’adoption, par une société d’auteur comme la Sacem en France, d’outils de publication open source et d’une politique d’ouverture Web 2.0, qui permettra à une multitude d’acteurs extérieurs d’interagir avec sa base de données d’Å“uvres, va dans le bon sens. Mais quelque soit la bonne volonté de la Sacem, elle ne résout pas le fond du problème, qui est de parvenir à consolider quelque part, afin d’alimenter tout le système de reporting de la musique en ligne en méta-données fiables, sa base de données d’Å“uvres avec les bases de données de phonogrammes des producteurs, comme celles de la SPPF et de la SCPP en France.

Les efforts de normalisation du consortium DDEX (sur les messages XML à échanger, avec toutes les données d’identification des enregistrements, des Å“uvres et de leurs ayant droit, entre acteurs de la chaîne de valeur) font partie de la solution, mais les labels indépendants et les artistes autoproduits en sont pour l’instant exclus, sauf à passer par un agrégateur. L’américain The Orchard est le seul, à ce jour, à avoir rejoint le consortium.

Un indispensable toilettage

DDEX va par exemple normaliser des messages comme la notification, par les maisons de disques, de nouveautés aux plateformes de musique en ligne, avec à la fois un code ISRC identifiant l’enregistrement (derrière lequel on va trouver le producteur et l’artiste-interprète à la SCPP ou la SPPF) et un code ISWC identifiant l’Å“uvre (derrière lequel on va trouver l’auteur, le compositeur et l’éditeur, voire des co-éditeurs et un ou plusieurs arrangeurs à la Sacem), avec même un identifiant du produit en lui-même (single, album, bundle, etc.).

Mais ce processus de normalisation prendra du temps. Pour l’instant, tout le reporting repose sur les méta-données livrées aux plateformes par les maisons de disques avec leurs titres, qui sont en général plutôt pauvres, non consolidées et encore fournies, parfois, dans des formats propriétaires. Quant aux bases de données dont elles sont extraites, elles ne sont pas ouvertes.

Les auteurs, compositeurs et éditeurs, en bout de chaîne, ont le plus à souffrir de cette situation. Parce qu’ils sont bien plus mal référencés, dans ces méta-données fournies par les maisons de disques, que les producteurs ou les artistes-interprètes. Au demeurant, chacun est payé séparément par les plateformes, les maisons de disques d’un côté, les sociétés d’auteurs et d’éditeurs de l’autre, et les premières n’ont aucune raison objective de prendre à leur charge le renseignement, sur Internet, de toutes les méta-données de la filière musicale.

Tout le business de la musique en ligne gagnerait pourtant à ce que les méta-données de la musique soient non seulement toilettées mais enrichies, jusqu’à permettre d’identifier, par exemple, les musiciens de session ou les choristes qui figurent sur un enregistrement. La start-up anglaise Decibel a décidé de prendre les choses à bras le corps et de constituer une base de données avec plus de 150 champs d’information par enregistrement, incluant le genre, l’ingénieur du son ou les assistants de production. Une vraie mine d’informations, qui va permettre d’alimenter des moteurs de recommandation extrêmement sophistiqués.

D’autres bases de données en ligne se constituent, comme celle de MusicBrainz (qui établit notamment des liens entre artistes ayant collaboré entre eux) ou de Music-Story (chroniques d’albums, biographies d’artistes et discographies), sans omettre celles des moteurs de recommandation (de type Echo Nest ou Music Genome), des réseaux sociaux (de type Last.fm), de certains ayant droit (la base de données des paroles de chansons françaises de la Chambre syndicale des éditeurs, par exemple), ou encore les bases de données de concerts et de playlists qui fleurissent un peu partout sur le Web.

Leur interface avec de multiples services Web se fera, progressivement, et va ajouter beaucoup de valeur à la musique en ligne. Encore faudrait-il pouvoir s’appuyer sur un fond de méta-données propre, universel et consolidé, à même de huiler tout le système. Nous en sommes encore très loin.

Note:

(1) C’est dire toute l’ironie de l’épisode Pandora l’an dernier. Confrontée à un augmentation substantielle et unilatérale des taux de royautés à reverser par SoundExchange, le service de radio personnalisée, qui représenterait à lui seul la moitié des droits générés par la radio en ligne aux États-Unis, a bien failli mettre la clé sous la porte. Pour tous les ayant droit de la musique, cela revenait à se tirer une balle dans le pied.

> Article initialement publié sur ZDnet

> Crédits  Photos CC FlickR : pfala, EricGjerde

Laisser un commentaire

Derniers articles publiés