Kevättulvat, ja erityisesti kesätulvat ovat kaikille tulvaennustemalleille haastavia – myös tekoälymalleille. © Kai Widell
Suomessa tutkitaan mahdollisuutta käyttää koneoppimismenetelmää tulvien ennustamisessa. Koneoppimismenetelmää on koulutettu suurella datajoukolla seitsemällä koealueella. Kohdevesitöinä ovat olleet Aurajoki, Karjaanjoki ja Kuivajoki Pohjois-Pohjanmaalla. Tulokset ovat lupaavia.
Nykyiset tulvaennustemallit toimivat hyvin, mutta parempiin tuloksiin päästäisiin käyttämällä erilaisia malleja, kuten koneoppimismenetelmiä. Koneoppimismenetelmillä mallintaminen on nopeampaa ja helpompaa. Mallintaminen ei ole enää sidottu henkilöön, aikaan tai paikkaan.
Uutta koneoppimismenetelmää on koulutettu suurella datajoukolla seitsemällä koealueella Aurajoen, Karjaanjoen ja Kuivajoen vesistöissä. Koealueiden valuma-alueiden koko vaihtelee 500:n ja 2000:n neliökilometrin välillä. Myös koealueiden maankäytön jakautuminen ja lumisuus vaihtelevat. Tutkimuksessa käytettiin useita malleja. Mallien lähtötietoina olivat vedenkorkeus- ja säähavainnot.
Koneelle opetetut mallit perustuvat tuttuihin polynomifunktioihin. Mallien väliset erot ovat keskimäärin vähäisiä. Suuria eroja aiheutuu lähinnä käytetystä mallinnusmenetelmästä, lähtötietojen ja alueiden valinnasta, mallien parametrisoinnista sekä muistista.
Tutkimuksessa koneoppimismenetelmä antoi tarkkoja tuloksia. Yhden vuorokauden ennusteissa korrelaatiokertoimet olivat yli 0,9.
Tekoäly yleensä hyötyy pitkäkestoisesta muistista
Kevättulvat, ja erityisesti kesätulvat, ovat tekoälymallille haastavia – kuten kaikille malleille.
Kevättulvia ennustettaessa mallin olisi hyvä muistaa millainen oli edeltävä talvi. Muisti onkin tärkeä osa mallinnusta. Yleensä parempiin tuloksiin päästään, kun tallennetaan muistiin aiemmat seitsemän päivää eikä vain yhtä päivää. Kesätulvien kohdalla pitkäkestoisesta muistista voi tosin olla haittaakin, sillä kesällä rankkasateet syntyvät tunneissa. Vaatiikin vielä lisätutkimuksia, että voitaisiin arvioida, miten vanhoja tietoja mallin kannattaa milloinkin muistaa.
Tekoälymenetelmän mallit oppivat toisiltaan. Se tekee ennustamisesta tehokkaampaa. Oppimista on ollut myös hauska seurata.
Tulosten mukaan tekoälymalli oppii myös muista vesistöistä varsinkin, jos vesistöt ovat samankaltaisia. Vielä ei ole kuitenkaan selvää, miten tämä vaikuttaa mallin tarkkuuteen. Tulokset ovat lupaavia ja ne julkaistaan vuoden lopulla artikkelina tieteellisessä sarjassa ja Vesitalous-lehdessä sekä Hydro-RDI-Network webinaarissa.
Lähtötietojen valinta vaikuttaa ennusteteen luotettavuuteen. Kuvassa Kuivajoen vesistöalueelle laadittu MLP-neuroverkko, jossa eri värit kuvaavat lähtöarvojen vaikutusta tulvaennusteen luotettavuuteen. Pysty-akselilla mallin luotettavuus (R²) ja vaaka-akselilla on ennusteen pituus (vrk).
Kirjoittaja
Erikoistutkija
Jari Silander, Suomen ympäristökeskus SYKE, etunimi.sukunimi@syke.fi
Linkkejä