• EN
  • SV
  • Musiikin suoratoisto ja algoritmit
    Osa 1: Mitä ja miksi?

    Algoritmit ohjaavat yhä enemmän sitä, mitä musiikkia kuuntelemme suoratoistopalveluissa. Tässä artikkelissa Gramexin johtaja Tuomas Talonpoika tarkastelee, miten algoritmit toimivat, millaista dataa ne hyödyntävät ja miksi niiden ymmärtäminen on tärkeää jokaiselle musiikin ammattilaiselle.

    Arrow down
    Teksti: Tuomas Talonpoika

    Tänä päivänä puhutaan entistä enemmän algoritmeista, kun puhutaan musiikin ja musiikkivideoiden suoratoistopalveluista. Käytetään termejä kuten ”video-metrics”, ”klikkaukset”, ”keskimääräiset katseluajat”, ”kommentit”, ”jaot” yms. Harvemmin puhutaan siitä, mitä algoritmit palveluissa oikein ovat, ja miksi ne ovat nousseet nykyiseen, joidenkin arvioiden mukaan jopa liiankin määräävään asemaansa. Suoratoistopalvelut ja niiden algoritmitoiminnot ovat olleet joissakin maissa myös kilpailuviranomaisten tutkimusten kohteena erityisesti niiden ”salaperäisyyteen” ja ”läpinäkymättömyyteen” liittyen.

    Käyn seuraavaksi läpi, mitä yleisimmät algoritmien ohjaamat toiminnot musiikkialan suoratoistopalveluissa ovat, miten ne toimivat sekä mitä niistä tulisi tietää ja ymmärtää. En käy tarkemmin läpi algoritmien teknisiä ominaisuuksia tai niiden ”teknistä tai kaupallista trimmaamista” vaan ainoastaan yleisiä toimintamalleja. Algoritmien ”kaupallinen trimmaaminen” tai julkaisujen suunnittelu algoritmit huomioiden on jo täysin uuden ammattijoukon asiaa.

    Artikkelissa ei myöskään paneuduta suoratoistopalveluiden muuhun kuratointiin, jossa lähinnä henkilöt tekevät valintoja biisien päätymisestä uutuus- tai suosituslistalle. Suoratoistopalvelujen algoritmien suorittamaa toimintaa kutsutaan usein myös algo-kuratoinniksi. Palvelusta riippuen algoritmikuratoinnin ja muun kuratoinnin painoarvo voi vaihdella huomattavastikin.

    Algoritmien hahmottaminen auttaa ymmärtämään paremmin sitä muutosta, mikä äänitteiden kaupallisessa jakelussa ja äänitemyynnin bisneslogiikoissa on viime vuosikymmenien aikana tapahtunut. Suoratoistopalvelut muodostavat tänä päivänä noin 65 – 70 % koko äänitealan yleisestä tulovirrasta.  Jutun jälkeen laajenee toivottavasti ymmärrys siitä, miksi erityisesti äänitemusiikin metadata ja sen erilaiset liitännäistiedot ovat tärkeitä. Artikkelissa ei perehdytä palveluissa nykyisin käytössä oleviin erilaisiin tilitysmalleihin, jotka vaikuttavat myös omalta osaltaan musiikin oikeudenomistajiin monin eri tavoin.

    Suoratoistopalvelut muodostavat tänä päivänä noin 65 – 70 % koko äänitealan yleisestä tulovirrasta.

    Algoritmit – mitä ne oikein ovat?

    Mitä algoritmit yleisesti ottaen ovat? – lyhyt ja tekninen määritelmä: algoritmi on yksityiskohtainen, ohjelmistoon koodattu kuvaus tai ohje, jota seuraamalla tehtävä, prosessi tai ongelmanratkaisu suoritetaan. Algoritmit eivät siis ole välineitä tai laiteita vaan koodin muotoon laitettuja sääntö- ja prosessikuvauksia sekä erilaisia komentoketjuja.

    Käytännössä puhutaan oppivista algoritmeista ja koneoppimisesta. Algoritmien ydinominaisuus suoratoistopalveluissa onkin nimenomaan se, että ne ovat itseoppivia eli algoritmien käyttämät säännöt muuttuvat ja kehittyvät koko ajan niiden prosessoiman datan perusteella. Lisäksi algoritmit on usein laadittu omaksumaan myös laajempia ulkopuolisia trendejä. Eli, jos uusi genre tai tyyli tulee suosituksi, niin algoritmit ryhtyvät tarjoamaan siihen liittyvää sisältöä automaattisesti niille käyttäjille, jotka eri perusteilla lasketaan matemaattisesti uudeksi potentiaaliseksi kohderyhmäksi.

    Algoritmit voidaan määritellä lyhyesti myös niin, että kyse on tarkasti määritellystä sääntöjoukosta, jonka mukaan palvelussa valikoidaan, mitä räätälöityä sisältöä palvelun käyttäjälle erilaisissa tilanteissa suositellaan ja tarjotaan. Ja koska prosessit ovat teknisiä, niin ne ovat nopeita, ja tekoälytoimintojen mukaan tulo on tehnyt prosesseista vieläkin nopeampia. Itseoppivuus perustuu pääosin siihen dataan, mitä yksittäinen loppukäyttäjä kuuntelee tai katselee, tai vastaavasti siihen, mitä yksittäinen palvelun käyttäjä ei nimenomaisesti halua kuunnella tai katsella.

    Algoritmien ydinominaisuus suoratoistopalveluissa onkin nimenomaan se, että ne ovat itseoppivia.

    Muutama perusjuttu

    Palveluissa käytettävät algoritmitoiminnot voidaan luokitella monin eri tavoin. Yksi kansainvälisesti käytetty perusluokitus on seuraavanlainen:

    Data, jota algoritmit hyödyntävät on perusluokitukseltaan toisaalta hyvinkin yksinkertainen eli:

    Mikä on algoritmeille tärkeää?

    Paras vaikutus saadaan, kun biisin metadata on täydellistä siinä vaiheessa, kun biisi menee jakeluun suoratoistopalveluun toimitettavaksi. Tähän liittyy aloitusvaiheessa erityisesti biisin erilaiset luokitukset, genret, tyylit ja esityskielet yms.

    Toiseksi on tärkeää saada muodostettua biisin ja metadatan avulla verkosto, eli kenelle biisiä on palvelussa parasta ja kannattavinta tarjota. Mikään biisi- tai videosuositus yksittäiselle käyttäjille ei ole sattumaa, vaikka yksittäiselle palvelun käyttäjälle jokin uusi ja hassu biisi- tai videosuositus saattaa sellaiselta joskus näyttää.  

    Mikään biisi- tai videosuositus yksittäiselle käyttäjille ei ole sattumaa.

    Käyttäjän suorittamat suorahaut tuovat saataville juuri sitä mitä halutaan, mutta palvelut muistavat myös nämä ja yhdistävät ne lopulta erilaisiin toiminnallisuuksiin, joita algoritmit suorittavat. Näin jokainen palvelussa suoritettu haku yhdistyy lopulta suosituksiksi tai vaikuttaa ainakin välillisesti suosituksiin tai niiden puuttumiseen joko juuri tuolle yksittäiselle käyttäjälle tai kaverille.

    Olennainen osa nykyisin onkin, että erittäin suuri osa kuuntelusta ja katselusta perustuu palveluissa käytettävien algoritmien rakentamiin suosituksiin, ei siis siihen, että palvelun käyttäjät tekisivät omiin mieltymyksiin perustuvia tarkkoja biisihakuja. Tämä on vastaavasti asia, joka nykyisin yhä enemmän huomioidaan äänitemusiikin ammattimaisessa markkinoinnissa ja jakelussa. Julkinen tieto on myös se, että algoritmit toimivat palveluissa eri tavoin riippuen siitä, onko kyseessä ilmainen palvelu mainoksineen vai maksullinen tilauspalvelumuoto.  

    Case YouTube

    Yleisesti ollaan sitä mieltä, että kehittyneimmät musiikkipalveluiden algoritmit löytyvät tänä päivänä YouTubesta. Syy on selkeä. YouTube ryhtyi kehittämään aktiivisesti omaa algoritmi-systeemiään tai paremminkin sen esivaiheita jo lähes 15 vuotta sitten.  Vastaavasti Netflix ryhtyi käyttämään ensimmäisiä algoritmeiksi luokiteltavia toimintoja jo vuonna 2007.

    Vuonna 2012 YouTube otti videoiden katseluun käytetyn katseluajan tärkeäksi mittariksi. Tätä ennen tärkeintä oli ollut pelkästään videoiden käynnistysmäärät. Vuonna 2015 YouTube otti käyttöön varsinaiset algoritmit, pitkälti niin kuin ne tänä päivänä määritellään. Tällöin mukaan tulivat myös palvelun käyttäjien tarkempi personointi ja profilointi. Tänä päivänä käytännössä jokainen suoratoistopalvelu käyttää toiminnassaan algoritmeja, kukin omalla valitsemallaan tavalla. Loppukäyttäjälle nämä toiminnot näkyvät enemmän tai vähemmän erilaisina automaattisina ja entistä kehittyneempinä suosituksina ja hakutuloksina.

    Tänä päivänä käytännössä jokainen suoratoistopalvelu käyttää toiminnassaan algoritmeja, kukin omalla valitsemallaan tavalla.

    Nykyisin myös muiden musiikkipalveluiden kuten esimerkiksi TikTokin tai Spotifyn algoritmitoiminnot ovat ”isojen kuvioiden” osalta hyvin lähellä toisiaan ja syvällisemmät eroavaisuudet voivat olla hyvinkin pieniä. Palveluiden vertailtavuus on kuitenkin muuttumassa vaikeammaksi, koska algoritmien toiminnallisuudet eri palveluissa pidetään entistä tarkemmin liike- ja yrityssalaisuuksien piirissä, joten läpinäkyvyyttä ja yleistä vertailtavuutta on erittäin vaikea saada. Jatkossa asiaan tuo lisää vaikeuskerrointa se, että palveluiden algoritmien toiminnallisuus perustuu yhä enemmän tekoälytoimintoihin.  

    YouTube pääpiirteittäin

    Seuraavaksi lyhyesti, miten YouTuben algoritmit yleisesti toimivat. YouTube onkin poikkeus monen palvelun joukossa, koska se on kohtuulliset läpinäkyvä algoritmi-politiikassaan. Lisäksi sitä on tutkittu erittäin paljon. Tosin myös Deezer ja Spotify ovat ryhtyneet avaamaan algoritmien toimintaa tarkemmin. Johtuuko tämä sitten kilpailuviranomaisten aktiivisuuden lisääntymisestä vai yleisestä ja laajemmasta läpinäkyvyyden vaatimuksesta, vaikea sanoa. Palvelut perustelevat läpinäkymättömyyttänsä paitsi liikesalaisuuksilla, niin myös sillä, että mikäli oikeudenomistajat ja musiikintekijät tuntisivat palvelujen algoritmien toimintamallit tarkemmin, johtaisi se siihen, että musiikin tuotannossa otettaisiin huomioon nimenomaan se, miten musiikki saataisiin palvelun suosituslistoille.

    YouTubessa algoritmit luovat aluksi käyttäjälle kandidaatteja palvelun sisällöstä. Näin muodostuva sisältö myös listataan paremmuusjärjestykseen eri arvoja, painotuksia ja muuttujia hyväksikäyttäen. Eli käytännössä ensin haetaan miljoonista eri sisältökohteista joitakin satoja kandidaatteja, ja sitten listataan näistä sadoista noin lopullinen tusina. Käytännössä tämä prosessivaihe toimii niin, että ensin selvitetään eri tekijöistä pääteltävissä olevat kyseisen loppukäyttäjän mieltymykset.

    YouTuben algoritmeille on ominaista aktiivisuus.

    Seuraavassa vaiheessa erilainen päättely ja ennustus jää vähemmälle, ja siirrytään enemmän faktojen maailmaan eli muun muassa haku-, kuuntelu- ja katseluhistoria ja käyttäjän mahdolliset tykkäykset auttavat luomaan lopullisen ranking-listan suositteluun valikoituvasta sisällöstä. Tässä kohtaa YouTube on jo laskenut matemaattisesti erilaisia todennäköisyyksiä, ja on jo melko varma, että ”loppulistalle” päätyvät videot ovat saatavissa olevan datan perusteella loppukäyttäjälle mieluisia ja loogisia.

    Tämän jälkeen tulee YouTubessa vielä mukaan niin sanotusti ”YouTuben erikoinen” eli ”oma sekoitus” –   sen avulla YouTube rohkaisee loppukäyttäjää katsomaan myös hiukan eri juttuja – mukana tulee siis hiukan vähemmän suosittuja biisejä tai videoita. Näillä pyritään etsimään niin sanotusti ”sytykkeitä” monille uusille muille suosituksille. Näistä sytykkeistä myöhemmin  lisää.

    YouTuben algoritmeille on ominaista aktiivisuus. Algoritmit voidaan virittää tutkaamaan ja hakemaan koko ajan aktiivisesti eri suuntia. Kiteytetysti tämä toimii niin, että jos jossain tulee matemaattisesti laskettuna niin sanotusti seinä vastaan, niin tällöin otetaan uusi suunta. Eli, jos joku tyylisuunta ei toimi riittävästi jollekin käyttäjälle, niin palvelu ryhtyy aktiivisesti ja automaattisesti etsimään ja hakemaan toisenlaista sisältöä ja tarjoamaan uusia ehdotuksia.

    Lue myös:

    GramexPress
    Musiikin metadata: Mitä ja miksi?
    GramexPress
    Musiikin metadata – Metatiedot ja yhden biisin tarina
    Jaa artikkeli