T-61.2010 Datasta tietoon (4 op)

Kurssiesite

Laajuus 4   op
Opintojakson asema
Opintojakson taso
Opetusperiodi II
Työmäärä toteutustavoittain

24+24 (4+4)

Luennot 2 x 2h / vko (10 kertaa): asioiden yleisesittely, motivointi.

Paperilaskarit 1 x 2h / vko (5 kertaa): matemaattinen johtaminen, laskeminen.

Tietokonelaskarit 1 x 2h / vko (5 kertaa): laskeminen tietokoneella, soveltaminen.

Omaa työtä: luennoilla valmistautuminen ja kertaus (10 x 2h?); pistelaskarit ja omatoiminen lukeminen ja laskeminen (21h?); tenttiin valmistautuminen ja kertaaminen (12h?).

Osaamistavoitteet Kurssin jälkeen osaat selittää, kuinka luonnollinen data kuten kuvat, puhe, mittaussarjat esitetään digitaalisesti tietokannassa. Osaat soveltaa tilastomatemaattisia ja algoritmisia perusmenetelmiä (yksinkertaisimmassa muodossaan) tällaisen datan käsittelyyn. Kurssin lopussa osaat keskustella asiaankuuluvalla terminologialla, miten "datasta tietoon" käytännössä toteutuu.
Sisältö Johdatus menetelmiin, joilla suurista data-aineistoista löydetään kiinnostavaa tietoa. Digitaalisten signaalien, puheen ja kuvien käsittely, estimoinnin ja hahmontunnistuksen perusteet, neuroverkkojen peruskäsitteet, hahmoetsintä datasta, Web-etsintämenetelmät.
Toteutus, työmuodot ja arvosteluperusteet Tentti (100 %) ja pakollinen harjoitustyö (hyväksytty/hylätty). Harjoitustyön voi korvata aktiivisella osallistumisella tietokoneharjoituksiin.
Kirjallisuus
Oppimateriaali

Kurssilla ei ole omaa kirjaa. Kaikki materiaali on jaossa Nopassa:

  • Luentokalvot. Täysin sama tieto jaossa kolmena eri versiona: (A) saatavana yhtenä "kirjasena" (134 sivua, PDF), (B) luvuittain 1-9 luentokalvoina, (C) luvuittain 1-9 koosteina 4 kalvoa per A4
  • Paperilaskarien tehtävät ja vastaukset (5 kierrosta). Saatavana yksittäin sekä yhtenä "kirjasena" (PDF, 47 sivua), jossa mukana myös esitietotehtäviä, tietokoneharjoitusten esittely, Matlab-komentojen luettelo sekä pieni kaavakokoelma
  • Tietokoneharjoitusten pohjamateriaali zip-tiedostoina. Harjoitukset pitkälti demomaiset; muutamien komentojen täyttämistä valmiiseen koodiin
Korvaavuudet
CEFR-taso
Esitiedot Matematiikan ja tilastotieteen peruskurssit, joista erityisesti perusteet matriisilaskusta, ominaisarvojen laskemisesta, derivoinnista ja gaussisesta tiheysfunktiosta. Ohjelmoinnin perusteet sekä Tietorakenteet ja algoritmit.
Arvosteluasteikko
Ilmoittautuminen
Opetuskieli FI. Suomi pääosin. Pyydettäessä suoritettavissa englanniksi.
Kurssin henkilökunta ja yhteystiedot

Luennoitsijat:

Professori Erkki Oja, erkki.oja ( aalto.fi

Dosentti Kai Puolamäki, kai.puolamaki ( aalto.fi

Kurssiassistentit:

TkK Maria Osmala ("paperiharjoitukset")

DI Janne Toivola ("paperiharjoitukset")

TkK Elina Karp ("tietokoneharjoitukset")

TkK Eric Malmi ("tietokoneharjoitukset")

DI Jukka Parviainen (koordinaattori)

Kurssin sähköpostiosoite on t612010()ics.tkk.fi 

Vastaanottoajat

Professori Erkki Oja, to xx-xx huone B328, T-talon 3. kerros.

Yliopisto-opettaja Jukka Parviainen, to 11-12 huone B329, T-talon 3. kerros. 

Lisätietoja Pyydettäessä suoritettavissa englanniksi.

Lisäyksiä kurssiesitteeseen 

Lähes kaikki tieto on digitaalisesti saatavilla lähitulevaisuudessa. Tieto on multimediamuotoista: tekstiä, kuvia, puhetta ja ääntä tai muunlaista mittaustietoja. Tietokoneen olisi pystyttävä itsenäisesti tulkitsemaan tietoa voidaakseen tehdä sitä ymmärrettäväksi ihmiselle.

Tullakseen ymmärrettävään muotoon dataa täytyy muuntaa ja tiivistää algoritmisilla menetelmillä. Algoritmit perustuvat joukkoon peruslähtökohtia, joiden alkeet kurssilla selitetään.

Joitain perusmenetelmiä opitaan soveltamaan algoritmisesti suppeisiin mutta todellisuutta simuloiviin tilanteisiin.

Esitiedoista 

Käytännössä on matematiikasta hyvä muistaa matriisioperaatiot, integrointi, derivointi ja todennäköisyyslaskennasta tiheysfunktio ja parametrien estimointi. Tällä kurssilla opiskelijoiden raportoima ongelma on ajallinen päällekäisyys todennäköisyyskurssin kanssa. Pyrimme helpottamaan tätä esitietomateriaalilla, jota voi käydä itsenäisesti läpi tai harjoituksissa. Materiaali on saatavilla Nopasta (PDF, 47 sivua).

Laskareista 

Laskarit tukevat luennoilla käsiteltäviä asioita. Tehtävät ja ratkaisut jaetaan kurssin alkupuoliskolla. "Paperilaskaritilaisuudet" ovat pääosin demotyyppisiä ja osin omaa laskentaa. Epäselvistä kohdista kannattaa kysyä assistentilta. Maanantaisin ja perjantaisin on samat harjoitukset.

Tietokoneharjoituksia järjestetään noin 4 vaihtoehtoista harjoitusta. Harjoituksissa kerätään läsnäololista. Aktiivisella osallistumisella voi korvata pienen harjoitustyön.

Paperitehtäviin liittyen jaetaan yhteensä 5 bonuspistetehtävää. Niistä voi saada maksimissaan 5 bonuspistettä. Lisäksi kurssipalautteen antamisesta saa yhden bonuspisteen. Näiden summa jaetaan kahdella ja lisätään tenttipisteisiin. Bonuspisteet ovat voimassa vain joulu- ja tammikuun tenteissä!

Päivitetty 27.10.2011 klo 16.08