T-61.281 Luonnollisen kielen tilastollinen käsittely (3 ov, L), Kevätlukukausi 2002


Kevätlukukausi 2003

Luennoija TkT Krista Lagus, assistentti DI Vesa Siivola
Luennot: ke 10-12 salissa T2 (Tietotekniikan talo) alkaen 16.1.2002
Laskarit: ti 8-10 U264 (TKK:n päärakennus) alkaen 22.1.
Kotisivu: http://www.cis.hut.fi/Opinnot/T-61.281/


Ajankohtaista

Seuraava tentti pidetään tiistaina 3.9.2002 klo 13-16 salissa T1 (Tietotekniikka-talon 2.kerros). Muista ilmoittautua!

CSC-lupahakemukset on käsitelty. Lupaa hakeneet teekkarit voivat hakea Vesa Siivolalta (huone C312, T-talo) käyttäjätunnuksen, salasanan ja pinon paperia, jossa annetaan ohjeita CSC:n koneiden käytöstä. HY:läiset saavat omansa Hanna Westerlundilta.

Harjoitustyöaiheen "sananmerkitysten disambiguointi" voi nyt tehdä myös aidolla suomenkielisellä disambiguointiaineistolla (ks. harjoitustyöohje).

Tavoitteet, sisältö ja suorittaminen

Kurssi antaa yleiskuvan tilastollisten ja oppivien menetelmien soveltamisesta luonnollisen kielen analyysiin, esimerkiksi tekstikokoelmien analysointiin, järjestämiseen ja tiedonhakuun, luonnollisen kielen tunnistukseen ja kielimallinnukseen, syntaktiseen ja semanttiseen analyysiin, lauseenjäsennykseen ja tilastolliseen konekääntämiseen. Kurssiin sisältyy harjoitustyö.

Suorittaminen: Tentti ja harjoitustyö.

Kirja

Kurssi perustuu pääosin kirjaan Christopher D. Manning and Hinrich Schütze: Foundations of statistical natural language processing, MIT Press, 1999.

Esitieto- ja taustamateriaalia

Johdantoa kieliteknologiaan

Resursseja verkossa



http://www.cis.hut.fi/Opinnot/T-61.281/kurssi02/index02.shtml
krista.lagus@hut.fi
Tuesday, 14-Jan-2003 15:32:45 EET