Google używa uczenia maszynowego, by powiedzieć nam, co nucimy!

Pewnie niejednokrotnie mierzyliście się z taką sytuacją, że w Waszej głowie utkwiła piosenka, która leci mniej więcej tak: “da daaaa da da daaaa na naa naa ooohh yeah”. Dużo to nie mówi, prawda? Od teraz nie musicie spędzać godzin nad szukaniem utworu po wybranych frazach w wyszukiwarce. Wystarczy, że go zanucicie!

I wcale nie musicie być urodzonymi śpiewakami. Jak zapewnia Google, ich nowa funkcjonalność pozwala Wam fałszować i śpiewać poza tonacją, a i tak opracowana przez nich technologia, powinna dać sobie radę. W dodatku bez podawania konkretnego tekstu czy nazwiska wykonawcy!

Zanuć, by znaleźć

Od niedawna, aby znaleźć utwór na podstawie samej melodii, możemy użyć opcji Hum to search. Wystarczy tylko otworzyć Asystenta Google na naszym Androidzie lub iOS, wcisnąć ikonkę mikrofonu, powiedzieć: “Co to za piosenka” lub kliknąć “wyszukaj piosenkę”. Po tym wystarczy samodzielnie zaśpiewać, zanucić lub nawet wygwizdać przez 10-15 minut poszukiwany utwór. Jak to wygląda w praktyce, można zobaczyć na poniższym filmie promocyjnym:

Funkcja, póki co działa w 20 krajach, ale Google wraz z upływem czasu zacznie rozszerzać swoją ofertę na inne państwa. 

Jak machine learning słyszy nasze nucenie?

Google uchyla rąbek tajemnicy i tłumaczy, jak to działa. Porównuje melodię każdej piosenki do odcisku palca – swojego rodzaju niepowtarzalnego identyfikatora tożsamości. 

W swoim narzędzie zbudowali szereg modeli systemów, które uczą się, jak dopasować wszelkiego rodzaju dogłosu do odpowiedniego “odcisku palca”, czyli w tym przypadku – linii melodycznej każdego utworu. Kiedy Hum to search odbiera wytwarzane przez użytkownika dźwięki, modele uczenie maszynowego przekształcają go w sekwencję liczbową, reprezentującą melodię utworu. Są one zaprojektowane w taki sposób, żeby potrafiły odszyfrować różnego rodzaju dźwięki, od śpiewu, przez gwiżdżenie po nucenie. Algorytmy potrafią także oddzielać takie szczegóły jak instrumenty, barwa czy ton głosu, w ostatecznym wyniku zostawiając tylko sekwencję numeryczną.

Sposób działania nowej funkcji w sposób najbardziej obrazowy, można podpatrzeć na poniższej symulacji:

 


Zdjęcie główne artykułu pochodzi z blog.google.

Zapraszamy do dyskusji

Patronujemy

 
 
More Stories
Startupowa prasówka: 19-23.03.2018