Så fungerar Googles Hum to Search-funktion

Innehållsförteckning:

Så fungerar Googles Hum to Search-funktion
Så fungerar Googles Hum to Search-funktion
Anonim

Key takeaways

  • Google har lanserat ett nytt verktyg som låter användare söka efter låtar genom att nynna, sjunga eller vissla.
  • Det nya verktyget använder maskininlärning för att matcha ett nynnande spår med en databas med mer än en halv miljon låtar som uppdateras kontinuerligt.
  • Google-användare frågar vilken låt som spelas nästan 100 gånger varje månad.
Image
Image

Google har lanserat en ny funktion som heter "Hum to Search" för att lösa ett frustrerande problem: att ha en låt fast i huvudet och inte kunna komma på vad den heter.

Idén med att nynna för att hitta en låt verkar otroligt enkel, så varför lanserar Google den här funktionen först 2020? Tja, det visar sig att det faktiskt är ganska komplicerat att identifiera låtar på det här sättet, delvis för att våra nynnande versioner tenderar att skilja sig ganska mycket från originalspåret. I ett nyligen inlägg på sin AI-blogg förklarar Google hur man använde maskininlärning för att åtgärda det här problemet och i slutändan hjälpa människor att hitta en låt genom att nynna, vissla eller sjunga melodin även när deras återgivning inte är korrekt.

"Vårt fokus för Hum to Search är att hjälpa människor att identifiera och hitta musik som har fastnat i deras huvud", sa en talesperson för Google till Lifewire i ett e-postmeddelande.

Börja bara nynna

Google-användare frågar vilken låt som spelas nästan 100 miljoner gånger varje månad, sa Aparna Chennapragada, Googles vicepresident och general manager för konsumentshopping, en video som introducerar flera nya sökfunktioner. Nu finns det ett sätt att ta reda på det.

Funktionen "Hum to Search" är inbyggd i Googles mobilapp, Google Search-widget och Google Assistant. För att komma åt den via appen, tryck på mikrofonikonen och säg "Vad är den här låten?" Att välja knappen "Sök en låt" fungerar också.

För att fungera korrekt kräver funktionen att du nynnar i minst 10-15 sekunder. Android-användare kan nynna för att hitta låtar på mer än 20 språk, medan endast engelska låtar fungerar på iPhones. Verktyget kan inte alltid identifiera en låt direkt, men när det väl gör det är resultaten ganska bra.

"Mer än hälften av låtarna med en bred uppsättning variabler (ton, tonhöjd, volym, etc.) känns igen av våra algoritmer, men noggrannheten beror naturligtvis på kvaliteten på brummandet, typen av låten och mer", sa Googles talesperson till Lifewire i ett mejl. "Men när det väl är känt är ungefär fyra av fem svar korrekta."

Det här är dock inte första gången nynnande har använts i en musikidentifieringsapp. SoundHound erbjuder en liknande funktion, som noterats av CNN Business, och är även tillgänglig på Android och iOS. Enligt Googles talesperson väcker den nya funktionen inga integritetsproblem och inte heller "ändrar den hur Google hanterar ljudbaserade interaktioner", sa de till Lifewire i ett e-postmeddelande.

Machine Learning

Trots konceptets enkelhet är det tekniskt ganska svårt att nynna på en låt för att hitta studioinspelningen. Det finns flera anledningar till detta, förklarar Google Researchs Christian Frank i ett blogginlägg den 12 november. Först och främst kan en nynnande version av låten skilja sig mycket från själva inspelningen, vilket gör det svårt att matcha de två. Så medan Shazam och en mängd andra appar redan finns för att identifiera den låten du hör på en restaurang eller annan offentlig plats, kan det vara svårare att använda en nynnande melodi som grund för den sökningen.

"Med texter, bakgrundssång och instrument kan ljudet på en musikal- eller studioinspelning vara helt annorlunda än en nynnande låt", skriver Frank."Av misstag eller design, när någon nynnar på sin tolkning av en låt, kan tonhöjden, tonarten, tempot eller rytmen ofta variera något eller till och med avsevärt."

Image
Image

Eftersom de nynnande versionerna av låtar kan skilja sig så mycket från originalen, noterar Frank att många tidigare metoder har krävt att en persons nynnande matchas med en version av låten som bara har en melodi, eller ett spår som inkluderar nynnande. Detta har gjort verkliga användningsfall utmanande, eftersom databaserna med dessa låtar kan begränsas och måste uppdateras manuellt.

Google förklarar att för funktionen Hum to Search använder den maskininlärningsmodeller för att förvandla ljud till en "sifferbaserad sekvens" som representerar melodin i låten - vad den säger kan ses som ett "fingeravtryck"."

Mer användarvänlig

Användningen av maskininlärning i Googles Hum to Search-funktion gör i slutändan verktyget mycket enklare att använda i den verkliga världen. Eftersom Hum to Search matchar sökarens nynnande låt med den faktiska låten, kan verktyget arbeta med de nya låtarna när de släpps istället för en databas som ständigt behöver uppdateras med nynnande versioner av varje spår. Dessutom behöver du inte perfekt tonhöjd för att använda den.

"Det nuvarande systemet når en hög nivå av noggrannhet på en låtdatabas som innehåller över en halv miljon låtar som vi kontinuerligt uppdaterar", sa Google i sitt Hum to Search-meddelande. "Denna sångkorpus har fortfarande utrymme att växa för att inkludera fler av världens många melodier."

Rekommenderad: