DÍGITS I ANDRÒMINES

Endevinadors de cançons

Reconeixement de cançons amb el mòbil
i Albert Cuesta
06/02/2016
4 min

Quantes vegades us heu demanat quina és la cançó que sona en aquell moment a la ràdio o pels altaveus del bar on esteu fent el vermut? No fa tant que per resoldre el dubte havíem de confiar en la nostra memòria o en la d’alguna persona que ens acompanyava. Ara en tenim prou traient el telèfon mòbil de la butxaca i fent servir una aplicació de reconeixement de música per saber en pocs segons el títol, l’intèrpret de la peça i, si volem, fins i tot comprar-la allà mateix.

Aquesta operació es pot fer amb un cercador genèric: obriu Google al vostre telèfon Android, activeu la funció de cerca amb la veu -tocant la icona del micròfon-, i quan l’aplicació detecti que el que sona és música, canviarà la icona per la d’una nota musical que podeu prémer per intentar identificar la peça. Però els millors resultats en aquesta mena de consultes s’obtenen amb els serveis específics de reconeixement de música. N’hi ha de molt diversos: uns s’adrecen a consumidors, com el TrackID de Sony; d’altres a empreses, com Vericast de la catalana Bmat, que monitoritza 3.000 emissores de ràdio i de TV de 60 països per a societats de gestió de drets i segells discogràfics de més de 35 països. Però la categoria té dos líders destacats: Shazam i SoundHound.

Shazam és el més veterà i ja va néixer vinculat als telèfons mòbils, tot i ser anterior a la popularització dels smartphones : l’any 2002, els abonats britànics de telefonia ja podien trucar al número 2580, acostar el telèfon a l’altaveu i, al cap de mig minut, rebre un missatge amb el títol de la cançó i el nom de l’intèrpret. És el mateix servei que Amena va oferir poc després a Espanya. En canvi, l’origen de SoundHound és la web Midomi.com -encara en funcionament-, creada l’any 2005 per Keyvan Mohajer, en què podies taral·lejar un fragment musical amb el micròfon de l’ordinador i, per poc que afinessis, veure de quina cançó es tractava.

Actualment, tant Shazam com SoundHound funcionen sobretot mitjançant aplicacions per als principals sistemes operatius mòbils i rellotges connectats. Això els ha permès ampliar el seu abast: Shazam diu que té 120 milions d’usuaris mensuals únics, dels quals 100 milions hi accedeixen des del telèfon, mentre que SoundHound presumia a mitjans de l’any passat de 260 milions d’usuaris, tot i que les dades no són comparables perquè cada empresa les compta a la seva manera. Shazam també té aplicacions per a ordinador, mentre que trobem SoundHound incorporat en algunes marques de cotxes. El funcionament és el mateix en tots els casos: amb el micròfon de l’aparell captem uns quants segons de la música que volem identificar, l’aplicació consulta per internet la base de dades del servei i, pocs segons després, la pantalla ens indica quina cançó estem escoltant, qui la toca, en quin disc està inclosa i ens ofereix enllaços a vídeos de YouTube relacionats. Aquesta senzilla operació és addictiva: Shazam assegura que cada dia rep 20 milions de consultes, i que en porta acumulades 20.000 milions des que va començar a funcionar.

Segons el dispositiu i la versió, també podem llegir la lletra de la peça -en molts casos sincronitzada amb l’audició per facilitar-nos el karaoke-, afegir-la a una llista de reproducció del nostre perfil de serveis de streaming com Spotify i Apple Music, per escoltar-la amb més calma en un altre moment, i publicar la nostra troballa musical a les xarxes socials. A més, com que el telèfon mòbil sap on som, el lloc de la consulta queda enregistrat per si algun dia volem saber on vam escoltar aquella cançó. Amb aquesta informació, les aplicacions també mostren mapes que indiquen quines peces musicals estan identificant altres usuaris, sigui al costat de casa nostra o a l’altre extrem del món.

Les dues aplicacions permeten instal·lar a la pantalla inicial dels mòbils Android un botó per iniciar directament la cerca sense haver d’obrir l’aplicació; als iPhone 6s això es pot fer amb el menú d’accessos ràpids que apareix en prémer més fort la icona. Les versions completes de Shazam i SoundHound són de pagament: costen uns 5 euros, amb els quals ens estalviem veure anuncis. Aquestes descàrregues i la publicitat a les versions gratuïtes són dues de les fonts d’ingressos dels dos serveis, però el principal són les comissions per la venda de música: al costat de la informació sobre la peça musical apareixen sempre botons per comprar-la en el mateix moment, sigui en suport físic o en descàrrega digital immediata. Fa tres anys, Shazam ja generava més de 300 milions en vendes a iTunes i Amazon. Les dues empreses també lloguen l’accés a l’enorme quantitat de dades sobre interessos musicals que van acumulant: un artista pot decidir que la seva gira passarà per les ciutats on les seves cançons han estat més consultades.

El grau d’encert de les dues aplicacions a l’hora d’identificar cançons és força alt, però no sempre coincident, perquè fan servir tecnologies diferents. Shazam aplica l’anomenat audio fingerprinting, que extreu amb el mòbil alguns elements distintius, inclosos el to i el timbre, del fragment que escolta, i els compara amb els de les milions de peces que té arxivades als seus servidors. Així, si Shazam ja coneix aquell enregistrament concret, és pràcticament segur que l’identificarà. En canvi, SoundHound fa una estimació de la freqüència fonamental que caracteritza la melodia i li permet vincular diferents interpretacions d’una mateixa peça musical, fins al punt que li podem cantar, taral·lejar o xiular una cançó i obtenir uns resultats força bons. És el mateix sistema que fan servir les aplicacions que identifiquen espècies d’ocells a partir del seu cant.

Totes dues són prou competents reconeixent enregistraments de música pop, rock o jazz. Però amb la música clàssica hi ha diferències significatives: SoundHound identifica correctament el Cantique de Jean Racine de Fauré, però en una edició diferent de la que li he posat; en canvi, Shazam no sap ni què és. SoundHound encerta l’enregistrament exacte d’una fuga de Bach per a orgue que Shazam identifica com a tres peces de pop en moments diferents de la seva interpretació. Finalment, si les dues aplicacions reconeixen correctament unes peces de Chopin per a piano, molt probablement és perquè formen part de la banda sonora d’una pel·lícula d’èxit: El pianista, de Roman Polanski.

stats