[Takaisin]

TEKNILLINEN KORKEAKOULU
DIPLOMITYÖN TIIVISTELMÄ

TekijäJuha Vesanto
Otsikko: Data Mining Techniques Based on the Self-Organizing Map
(Tiedon louhinta itseorganisoivan kartan avulla)
Päivämäärä: 26. toukokuuta 1997
Sivumäärä: 63
Osasto: Teknillisen fysiikan ja matematiikan osasto
Professuuri: Tik-61, Informaatiotekniikka
Valvoja: Professor Olli Simula
Ohjaaja: Tekniikan lisensiaatti Petri Vasara

Avainsanat: neuroverkko, itseorganisoiva kartta, tiedon louhinta, tieämyksen etsintä, paperi- ja selluteollisuus

Tietämyksen etsintä tietokannoista on uusi tekoälyn ja tietohallinnan tutkimuksen piiristä esiin noussut tieteenala. Alan päämääränä on kehittää menetelmiä uuden tietouden löytämiseksi ihmisen hahmotuskyvylle ylivoimaisen suurista tai monimutkaisista tietokannoista. Tiedon louhinta viittaa tietämyksen etsinnän ensimmäiseen, alustavaan vaiheeseen.

Itseorganisoituva kartta eli SOM on yksi eniten käytetyistä neuroverkkomalleista. SOM kvantisoi sille annetun tietoaineiston muodostaman tietoavaruuden ja samanaikaisesti muodostaa topologian säilyttävän kuvauksen tietoavaruudesta kaksiulotteiselle säännölliselle hilalle. Eräs itseorganisoivan kartan suurimmista eduista on se, että sitä on helppo visualisoida. Erilaisia tekniikoita käyttäen voidaan luoda havainnollinen kuva koko tietoavaruudesta tai verrata erilaisia tietoalkioita tai -joukkoja toisiinsa. Itseorganisoivaa karttaa voidaan käyttää myös tietoaineiston ryhmittämiseen, luokitteluun ja mallitukseen. Juuri monipuolisuus tekee itseorganisoivasta kartasta erityisen lupaavan menetelmän tiedon louhintaa ja tietämyksen etsintää ajatellen.

Osana työtä ohjelmoitiin itseorganisoivaan karttaan pohjautuva tiedonlouhintatyökalu. Tätä työkalua sekä työssä esitettyjä menetelmiä käyttäen analysoitiin maailman paperi- ja selluteollisuutta. Tulokset olivat rohkaisevia. Teknologiaa koskevan tietoaineiston analyysi tuotti tulokseksi jaon 20 eri tyyppiseen paperi- ja sellutehdastyyppiin. Pohjoismaisen teollisuuden analyysissä yhdistettiin teknologinen, taloudellinen ja ympäristöä koskeva tieto käyttäen hierarkkista itseorganisoivaa karttaa.

Tämä työ on tehty Informaatiotekniikan laboratoriossa Teknillisessä korkeakoulussa osana ``Oppivat ja älykkäät järjestelmät''-teknologiaohjelmaan kuuluvaa Entire-yritysprojektia. Projektin ovat rahoittaneet Jaakko Pöyry Consulting ja Teknologian kehittämiskeskus TEKES.


Juha Vesanto
Tue May 27 12:40:37 EET DST 1997