• EN
  • SV
  • Musiikin suoratoisto ja algoritmit
    Osa 2: Algoritmin anatomia

    Algoritmit ohjaavat yhä enemmän sitä, mitä musiikkia kuuntelemme suoratoistopalveluissa. Tässä artikkelissa Gramexin johtaja Tuomas Talonpoika tarkastelee, miten algoritmit toimivat, millaista dataa ne hyödyntävät ja miksi niiden ymmärtäminen on tärkeää jokaiselle musiikin ammattilaiselle.

    Arrow down
    Teksti: Tuomas Talonpoika

    Erittäin merkittäviä algoritmien toiminnallisuuksia ovat niin sanotut linkitys- ja verkostoitumistoiminnot. Käytännössä tällä tarkoitetaan sitä, että linkitetään toisiinsa eri loppukäyttäjiä eri tavoin yhdistäviä tekijöitä. Keskitymme seuraavaksi kahteen suoratoistopalveluissa yleisimmin käytettävään linkitystekijään ja mittaristoon eli sisältöön ja loppukäyttäjän käyttäytymiseen.

    1. Sisällön samanlaisuus: peruskuvio – saat ehdotuksia muun muassa Hip hop artisteista, koska olet kuunnellut myös aikaisemmin jotain Hip hoppia. Biisien metadatassa olevat erilaiset tiedot ja tunnisteet ovat tärkeitä tässä toiminnallisuudessa.
    2. Loppukäyttäjien käyttäytyminen: Hyvä esimerkki käyttäytymisestä on aikaisemmin kuunneltujen ja katseltujen ”artistien samanlaisuus”: Saat vannoutuneena Elton John– fanina suosituksia esimerkiksi myös Dua Lipasta, koska useimmat muutkin käyttäjät, jotka kuuntelevat usein Elton Johnia, kuuntelevat usein myös Dua Lipaa. Suoratoistomaailmassa puhutaan samanlaisesta käyttäytymisestä.  Palvelut siis seuraavat koko ajan aktiivisesti eri artistien ja bändien välisiä yhteyksiä muiden loppukäyttäjien piirissä.

    Useimmat suoratoistopalvelut käyttävät sekä sisällön että käyttäytymisen yhdistelmää. Teknisesti tämä on kohtuullisen helppo toteuttaa. Tosin tähän yhdistelyyn liittyy käytännössä jokaisen palvelun niin sanottu ”secret recipe”. Eli se miten ja kuinka paljon eri yhdistelmiä tehdään ja millaisilla painotuksilla, pidetään palvelukohtaisena liikesalaisuutena.

    Useimmat suoratoistopalvelut käyttävät sekä sisällön että käyttäytymisen yhdistelmää.

    Sisällön samanlaisuus on yleensä se kaikkein tärkein, kun julkaistaan uutta musiikkia, eikä uuden materiaalin suosiosta voida tehdä siinä vaiheessa vielä juurikaan mitään johtopäätöksiä käyttäjien lopullisen kiinnostuksen suhteen. Tämä tilanne yhdistyy usein myös siihen, että palvelusta ei löydy sisältöön liittyen vielä mitään käyttö- tai käyttäjäanalytiikkaa. Tällöin puhutaan niin sanotusta ”kylmästartin ongelmasta”.

    Näissä tilanteissa erityisesti perusmetadatan merkitys korostuu, esimerkiksi genre, erilaiset alagenret ja esityskielet ovat tärkeitä tekijöitä, koska niiden kautta biisi eräällä tavalla toimii sytykkeenä läpi koko palvelun ja sen eri käyttäjien. Tässä on myös se kääntöpuoli, että jos video ”syttyy” huonosti, niin sen suositukset voivat jäädä huonoksi.

    Kipinä täytyy siis saada jotenkin aikaan. Näissä tilanteissa suoratoistopalvelut lisäävät yleensä itse vielä erilaista omaa ”suositusmetadataa” biisiin oikeudenomistajien tai DSP-aggregaattien itse ”täyttämän metadatan lisäksi. Tähän palveluilla on yleensä omien sopimusehtojen mukaisesti täysi oikeus.  Yleensä tämä lisäys tapahtuu palvelun oman käyttäjäanalyysin ja profilointien perusteella. Usein esimerkiksi pelkästään biisin sanoilla, esityskielellä tai genre-tiedoilla voi olla hyvinkin suuri merkitys siinä, miten tämä niin sanottu kylmästarttaus lähtee liikkeelle.

    Haastavampi rasti onkin sitten käyttäytyminen ja sen kytkeminen suosituksiin. Näissä tilanteissa palvelun analytiikan ja algoritmien täytyy kyetä löytämään jotain kiinnostavaa palvelussa aikaisemmin tapahtuneista asioista. Näissä tilanteissa algoritmit käyvät läpi laajaa käyttödataa selvittääkseen sen, mikä on laajin teoreettinen pohja niistä loppukäyttäjistä, jotka pitävät tietyn tyyppisistä biiseistä tai videoista.   Yksinkertainen kuvio on se, että palvelu ryhtyy tarjoamaan käyttäjälle kunkin käyttäjän omaan persoonaprofiiliin liittyviä suositus- ja soittolistoja perustuen pitkälti käyttäjän omaan käyttäjähistoriaan lähinnä biisien tai artistien kautta. Käytännössä järjestelmät menevät myös paljon pidemmälle – tällöin palvelujen algoritmit pyrkivät yhdistelemään palveluissa olevien muiden käyttäjien profiileja eri tavoin toisiinsa.

    Eli miten yksittäinen musiikin oikeudenomistaja kykenee hyödyntämään tämän? Tällöin tullaan kysymykseen, että löytyykö eri artistin väliltä jotain sellaista, joka yhdistää käyttäjiä. Eli kuten edellä kerrottiin, onko niin, että Elton Johnin fanit kuuntelevat myös Dua Lipaa? Samaa analytiikkaa voidaan suorittaa myös eri biisien genre-luokitusten ristianalytiikalla.  Ja mitä enemmän mitä erilaisempia yhteneväisyyksiä palvelun sisällöstä koskien niin biisejä kuin käyttäjiä löytyy, niin sen paremmat mahdollisuudet biisillä on päästä eri suosituslistoille algoritmien avulla.

    Onko niin, että Elton Johnin fanit kuuntelevat myös Dua Lipaa?

    Soitto- ja suosituslistat

    Eli mikä yksinkertaisimmin toimii musiikin oikeudenomistajan näkökulmasta? – pitää päästä sellaisille soitto- ja suosituslistoille mukaan, joita kuuntelevat sellaiset käyttäjät, jotka nauttivat ja pitävät sinun musiikistasi ja tyylistä. Tähän liittyy myös se ”koukku”, että nämä muut käyttäjät todennäköisesti kuuntelevat muita samanlaisia artisteja ja näin algoritmit oppivat pikkuhiljaa ymmärtämään, että mihin ”porukkaan” sinä omalla musiikillasi kuulut. Tämä vastaavasti edesauttaa sinua pääsemään mukaan sellaisille suosituksille ja soittolistoille, jotka liittyvät aina vain tiiviimmin sinun tyyliisi.

    Yleisesti tarkastellen tämä kuuntelijamarkkinoiden verkoston rakentuminen palvelun käyttämien algoritmien avulla etenee askeleittain pääpiirteittäin seuraavasti:

    ▪ varsinaiset fanit

    ▪ muut käyttäjät samalla markkinalla

    ▪ muut käyttäjät samankaltaisilla markkinoilla

    ▪ muut käyttäjät täysin erilaisilla markkinoilla

    Eri suosituslistoihin sisältyy myös erilaisia vaaroja, joista ei nyt sen tarkemmin, mutta todettakoon yhtenä esimerkkinä, että mikäli biisi pääsee mukaan uuden musiikin suosituksiin ja soittolistoihin, se voi sinänsä olla hieno ja mukava asia, mutta algoritmien maailmassa tilanne on se, että erilaisilla uutuuslistoilla on yleensä mukana hyvinkin erilaisia tyylejä ja genrejä edustavia biisejä. Näillä ei ole välttämättä mitään yhteistä sinun musiikkisi kanssa.  Tätä tilannetta kutsutaan suoratoistopalvelumaailmassa termillä ”liian aikaiseksi altistumiseksi”.

    Käytännössä tällä tarkoitetaan sitä, että uusi biisi ei pääse koskaan sisällön tai käyttäytymisen avulla niiden käyttäjien luokse ja suosituksiin, jotka todennäköisesti olisivat muutoin tyylisi perusteella parasta ja potentiaalista kuuntelijakuntaa. On nimittäin todennäköistä, että algoritmit suosittelevat sinun biisiä ensisijaisesti sellaisille käyttäjille, jotka kuuntelevat esimerkiksi samalla uutuuslistalla olevaa täysin toisenlaista musiikkia. Tässähän ei sinänsä pitäisi olla mitään pahaa, mutta algoritmien maailmassa se todennäköisesti johtaa siihen, että sinua suositellaan myös täysin toisenlaisten genre-luokkien kuuntelijoille. Tähän sisältyy riski, että sinua ei todennäköisesti haluta tuossa porukassa kuunnella eli sinut hylätään nopeasti ja usein. Algoritmien maailmassa tämä taas laskee sinun suosiotasi, ja samalla tämä laskee yleisesti myös sinun muun sisällön niin sanottua ”long-term potentiaalia”.  Kannattaa siis muistaa, että palvelut ja niissä olevat algoritmit muistavat erittäin hyvin kaiken, mitä palvelussa tapahtuu – niin hyvässä kuin pahassa.

    Algoritmien maailmassa tämä taas laskee sinun suosiotasi, ja samalla tämä laskee yleisesti myös sinun muun sisällön niin sanottua long-term-potentiaalia.

    Lopuksi

    Joku voi luonnollisesti hämmästellä, että suosituksillako musiikin suoratoistopalvelut tänä päivänä oikein pyörivät. Tässä kohtaa on huomioitava, että musiikin eri suoratoistopalveluilla on tänä päivänä globaalisti yhteensä ehkä noin 700 –  800 miljoonaa maksavaa tilaajaa. Tämän lisäksi on myös huomattavasti enemmän niin sanottuja ilmaiskäyttäjiä. Maksavien tilaajien osuuden on arvioitu olevan tällä hetkellä noin 1/3 kaikista musiikkipalvelujen käyttäjistä eri tietolähteistä riippuen.

    Näissä skaaloissa mukaan pääseminen jollekin suosituslistalle edes 1 %:n osuudella, muodostaa melkoisen potentiaalisen sytykepinnan sille, että joku näistä noin 20 miljoonasta suosituksen vastaanottajasta päättääkin kuunnella tai katsella sinun biisiäsi. Ja tämä saa aikaan vastaavasti taas uutta sytykettä edellä kerrotuilla eri tavoilla muiden käyttäjien ja vastaavasti heihin verkostoituvien käyttäjien kautta.  

    Jo vuonna 2020 arvioitiin julkisesti, että esimerkiksi noin 70 % YouTubessa katseltavista ja kuunneltavista musiikkivideoista perustuu täysin algoritmien luomiin sisältösuosituksiin eikä käyttäjien niin sanottuihin suorahakuihin.  Tällä hetkellä suositusten osuus YouTubessa on jo paljon suurempi. Lukujen arvellaan olevan jonkin verran matalampia muissa samankaltaisia pelkissä musiikin suoratoistopalveluissa, mutta korkeita joka tapauksessa.  

    Tällä hetkellä suositusten osuus YouTubessa on jo paljon suurempi.

    Lisäksi musiikin suoratoistopalvelut sisältävät nykyisin entistä enemmän itse palvelun käyttäjälle suunnattuja ja tarkoitettuja erilaisia tekoälysovellutuksia muun muassa erilaisten soittolistojen luomiseen. Näissä toiminnoissa algoritmit esittävät merkittävää roolia ja uusimmat tekoälypohjaiset toiminnot toimivat ja luovat erilaisia soittolistoja myös puhtailla tekstikehotteilla. Luonnollisesti palvelut analysoivat jatkossa näitäkin kehotuksia aivan samalla tavalla kuin mitä tahansa muutakin palvelun käyttö- ja käyttäjähistoriaa.

    Musiikin oikeudenomistajien näkökulmasta kaikki nämä suositusten, algoritmien ja tekoälytoiminnallisuuksien nouseminen niin sanotusti avainasemaan on erittäin olennainen ja huomioon otettava asia, jos sisällön lisensointia esimerkiksi YouTubeen suunnitellaan osana musiikin ja äänitteiden korvaus- ja tulovirtaa.   

    Lisäksi eri palvelut sisältävät myös entistä enemmän erilaisia ristiinkytkentöjä kuten esimerkiksi iTunesin ja Apple Musicin kohdalla on tilanne. Eli, jos jotain biisiä ostetaan runsaasti iTunesta, se voi näkyä myös Apple Musicin kasvavissa suosituksissa.   

    Yhtenä isona muutoksena todettakoon myös täysin uutena ”pelurina” toimijakentälle mukaan tulleet erilaiset, niin sanotut ”DSP-palvelujen promoagentit” – mitään virallista suomalaista ammattinimikettä heille ei vielä liene varsinaisesti olemassa. Kyseinen ammattiryhmä muodostaa kuitenkin jo melko suuren ryhmän erityisesti Pohjois-Amerikan musiikkimarkkinoilla. Samoin uuden maailman jakelijoiden eli taitavien aggregaattipalvelujen merkitys on korostunut entisestään – kaupallista peliä pystyvät pelaamaan entistä paremmin ne, jotka tuntevat ja osaavat tämän ”uuden maailman” säännöt ja kuviot edes pääpiirteissään. Kohtuullisen kauas on siis tultu siitä perinteisestä äänitemyynnin ansaintamallista, jossa musiikkifani ostaa suosikkiartistin tai bändin fyysisen äänitteen musiikkikaupasta.

    Lue myös osa 1 tästä!


    Lisää samasta aiheesta
    Artistit Data Muusikot Tuottajat
    Jaa artikkeli