Sähkönkulutuksen ennustamiseen on yhtä monta menetelmää kuin on asiantuntijoita. Perinteisesti asiantuntija antaa ennustusmallille erilaisia sääntöjä, miten sähkönkulutus riippuu lämpötilasta, vuorokauden ajasta, vuoden ajasta, viikonpäivistä, lomapäivistä jne. Perinteisellä menetelmällä asiantuntija on hyvin kartalla ja on itse ennusteensa herra. Toisaalta on melko haasteellista kuvata kaikki erilaiset sähkönkulutukseen vaikuttavat tekijät yksiselitteisillä säännöillä, varsinkin jos ilmiöt riippuvat toisistaan ja ovat monimutkaisia, niin kuin tosielämä yleensäkin on. Alla on kuvassa 1 Suomen sähkönkulutus vuonna 2018.
Kuvassa 2 on kuvattu, miten Suomen sähkönkulutus korreloi yhden Suomen paikkakunnan lämpötilan kanssa. Punainen viiva näyttää, miten lämpötilan avulla voidaan ennustaa Suomen sähkönkulutusta, joka on keskiarvoisesti melko hyvin oikeassa. Lämpötilalla ja sähkönkulutuksella on selkeä korrelaatio (0.68 tarkalleen), mutta suurin osa pisteistä on kuitenkin melko kaukana viivasta. Hyvän kulutusennustamisen tekemiseen tarvittaisiin useita tällaisia sääntöjä liittyen muihin selittäviin tekijöihin.
Mikä erottaa tekoälyn perinteisestä sähkönkulutusanalyysistä? Voiko tekoäly voittaa asiantuntijan?
Tekoälyssä taas koneelle annetaan kasa dataa ja annetaan koneen kertoa asiantuntijalle, miten sähkönkulutus riippuu annetusta datasta. Asiantuntija ei kerro erilaisia sääntöjä, vaan tekoäly tutkii dataa, opettaa itselleen säännöt ja ennustaa sen pohjalta. Koneoppiminen pystyy kuvaamaan monimutkaisiakin syy-seuraussuhteita, mutta välillä tekoäly voi taas mennä rutkasti metsään ja tulosten selittäminen on usein myös haasteellista.
Tämän testin tarkoituksena oli kokeilla jotain uutta: voidaanko naapurimaiden sähkönkulutuksen aikasarjojen avulla opettaa tekoälyä ennustamaan Suomen sähkönkulutusta. Yleinen trendi on todennäköisesti melko samanlainen kuin Suomessa. Jos Suomessa on talven pakkashuippu ja paljon sähkönkulutusta, niin silloin todennäköisesti naapurimaissakin Ruotsissa ja Virossakin on. Jos taas Ruotsissa ja Virossa on kesällä lämmintä ja alhainen kulutus, niin Suomessakin varmaankin on. Kun Ruotsissa herätään arkiaamuna töihin ja laitetaan valot päälle, niin Suomessakin herätään. Kun Ruotsissa on juhlapyhä, niin usein Suomessakin on? Voitaisiinko siis pelkästään naapurimaiden sähkönkulutuksen avulla ennustaa Suomen sähkönkulutusta. Tässä on monta ”muttaa” ja ”ehkää”, mutta kokeillaan!
Joku saattaa miettiä, miten tiedämme naapurimaiden sähkön kulutuksen etukäteen: olet oikeassa, emme tiedäkään. Tämä testi on yksi esimerkki monista, mitä koneoppimisen avulla voidaan tehdä. Yksinkertaisuuden vuoksi kyseisessä esimerkissä tarkkaan ottaen ennustetaan historiallista kulutusta eikä tulevaisuutta. Kuitenkin, tekoälyn näkökulmasta, sillä ei ole merkitystä. Ainut ero tapausten välillä on se, mitä lähtödataa tekoälylle annetaan, jonka avulla tekoäly opettaa itselleen ennustamismallin.
Tukivektorikone koneoppimismenetelmä testiin
Tekoälymenetelmiäkin on monta erilaista. Tässä testissä käytettiin tukivektorikone –koneoppimismenetelmää (Support vector machines), josta käytän lyhyesti nimitystä tekoäly. Menetelmä on avoimesti saatavilla pythonin sklearn-paketissa (SVR). Menetelmästä tekee hyvän tähän tarkoitukseen sen, että se tunnistaa myös erilaiset keskinäisriippuvuussuhteet kaikkien eri aikasarjojen välillä. Esimerkiksi kun Ruotsissa on korkea kulutus ja Virossa alhainen, niin minkäköhän lainen suhde sillä on Suomen kulutukseen.
Tekoälylle syötettiin Viron ja Ruotsin sähkönkulutussarjat vuodelta 2018 ja annettiin sen ennustaa niiden avulla sähkönkulutusta Suomessa. Kuvassa 3 näkyy harmaalla Suomen toteutunut kulutus ja värillisellä tekoälyn ennustama sähkönkulutus Suomessa. Y-akselilla on Suomen kulutus ja x-akselilla on Pohjois-Ruotsissa olevan sähkömarkkina-alueen SE1 sekä Viron (EE) kulutus selittävinä tekijöinä. Kuten huomataan, tekoäly pystyi ennustamaan Suomen sähkönkulutusta naapurimaiden kulutusten avulla yllättävänkin hyvin, vaikka täydellinen ennuste ei kuitenkaan ole. Erityisesti oikealla olevassa kuvasta nähdään, että alhaisen ja korkean sähkönkulutuksen ennustaminen ei oikein toiminut hyvin.
Ennustamisen tarkkuus voidaan laskea pienimmän neliösumman menetelmällä, mikä oli tällä tavalla 0,896. Täydellinen ennustustarkkuus olisi 1.0 ja mitä pienempi arvo sen huonompi ennustus. Nyrkkisääntönä voisi pitää, että alle 0.5 ennustustarkkuudet ovat melkeinpä tikan heittoa ja siitä ylöspäin mennään valistuneesta arvauksesta kohti täydellistä ennustetta. Verrokkina perinteisillä menetelmillä olemme päässeet parhaimmillaan 0,93 tarkkuuteen, mikä voidaan jo luokitella hyväksi ennusteeksi. Vielä jää siis tekoäly kakkoseksi.
Koneoppimismenetelmille on tärkeää, että dataa annetaan vähän liikaa kuin liian vähän. Annetaan siis lisää dataa.
Toisessa vaiheessa tekoälylle annettiin yhteensä kahdeksan lähellä olevan sähkömarkkina-alueen kulutusaikasarjat. Tähän kuului kaikkien Ruotsin sähkömarkkina-alueiden kulutussarjat, Viro, Liettua, Latvia sekä yksi sarja Norjasta.
Ennustuksen tarkkuus nousi kahdeksan hinta-alueen aikasarjoilla arvoon 0,96. Tarkkuus on selkeästi parempi kuin perinteisen menetelmän 0,93 ja erityisesti aikasarjoille 0,96 tarkkuus on jo todella hyvä. Antamalla useampia kulutussarjoja eri alueilta auttaa selkeästi tekoälyä oppimaan paremmin kuin kahden aikasarjan avulla.
Kun katsotaan kuvan 4 ennusteiden ja toteutuneiden pisteiden eroja, niin suurin osa pistemassasta näyttävät asettuvan melko hyvin paikalleen. Tähänkin ennustuksen tarkkuuteen voisi olla jo tyytyväinen, mutta kokeillaan vielä, miten hyvä tekoälystä voi tulla tällä menetelmällä.
Asiantuntija on jo voitettu, voiko tekoäly vielä voittaa itsensä?
Tähän mennessä tekoälyä on opetettu vain naapurimaiden sähkönkulutusten avulla. Seuraavassa vaiheessa tekoälylle annettiin lisäksi 12 eri Suomen paikkakunnan lämpötilasarjat samalta vuodelta. Ennustuksen tarkkuus kasvoi vielä paremmaksi: 0,975 (kuva 5). Näin korkea ennustuksen tarkkuus kuulostaa minulle melkein Pohjois-Koreamaiselta tilastoinnilta.
Viimeisenä testinä tekoälylle annettiin 24 Euroopan sähkömarkkina-alueen sähkönkulutussarjat sekä 12 Suomen paikkakunnan lämpötilasarjat. Tähän kuului Norjan, Tanskan ja eri Keski-Euroopan maiden kulutussarjoja, mitkä ei suoraltaan kuulosta hirveän merkittäviltä tekijöiltä Suomen sähkönkulutuksen ennustamisessa. Ennustuksen tarkkuus nousi kuitenkin vielä paremmaksi arvoon 0.987.
Markkinamallitiimin testin tuloksena tekoäly voitti asiantuntijan Suomen sähkönkulutuksen ennustustarkkuudessa 0,99 vs 0,93. Yllättävää testissä oli se, että tekoälyn tekemä ennustustarkkuus parani aina vain, kun sille annettiin enemmän ja enemmän dataa, vaikka asiantuntijan näkökulmasta se ei välttämättä ollut enää edes kovin relevanttia. Tämä kuvastaa ehkä sitä, miten moniulotteinen ongelma sähkönkulutuksen ennustaminen on ja miten vaikeaa on tunnistaa kaikki siihen vaikuttavat tekijät. Ehkä tulevaisuudessa ei tarvitsekaan tunnistaa, jos tekoäly tekee sen meidän puolesta.
Missäköhän muissa tapauksissa tekoäly voisi ennustaa paremmin kuin asiantuntija?
Jarkko Tulensalo, Asiantuntija, sähkömarkkinat
Strateginen verkkosuunnittelu, Fingrid Oyj
3 Responses
Erittäin mielenkiintoinen työ. Hienoa, että näitä tutkitaan ja ennenkaikkea kokeillaan.
Hienoa, kun tällainen selvitys julkaistiin. Tehkää nyt edellä käytetyllä opetusdatalla ennuste Suomen sähkön kulutuksesta loppuvuodeksi 2019, julkaiskaa täällä ja päivittäkää toteutumalla. Näin saatte jonkun uteliaan kohderyhmän käymään näillä sivuilla säännöllisesti.
So you are using data from 2018 (different markets and temperature data) to predict the Finnish market price for 2018? Are you in the training phase giving the model the Finnish market price as the label for the model?