next up previous contents
Next: Datan skaalaus Up: Datan esikäsittely Previous: Datan esikäsittely

Puuttuvat ja poikkeavat arvot

Kartan opetusjoukon vektoreissa saa olla puuttuvia komponentteja [35]. Tämä on etu moniin muihin neuroverkkoalgoritmeihin nähden. Niissä puuttuvat komponentit täytyy korvata jollakin estimaatilla, tai puuttuminen ilmaistaan erillisellä komponentilla. Estimaatti saattaa kuitenkin vääristää dataa tilastollisesti, ja datan dimension kasvaminen aiheuttaa omat ongelmansa. Puuttuminen saattaa tietysti joskus olla hyödyllinen informaatio sinänsä. Karttaa käytettäessä puuttuvista komponenteista selvitään helposti jättämällä ne huomiotta etäisyyden ja päivitysaskeleen laskennassa.

Poikkeavat arvot datassa voivat johtua esimerkiksi mittausvirheistä, poikkeavista olosuhteista tai sattumasta. Ne vääristävät datan antamaa kuvaa tutkittavasta ilmiöstä, johon poikkeavat arvot eivät suoranaisesti liity. On yleisesti vaikea määritellä, mitkä arvot ovat poikkeavia ja mitkä normaaleja. Itseorganisoituva kartta on käytännössä todettu kohtalaisen vankaksi poikkeavien arvojen suhteen [18, sivu 24]. Jos kartassa on riittävästi yksiköitä, vain osa mallintaa poikkeavia arvoja, jotka voidaan tunnistaa kartalta esimerkiksi tutkimalla Sammonin kuvausta (ks. luku 2.2.7).



Johan Himberg
12/11/1997