Informaatiotekniikan laboratorio

Tik-61.182 Informaatiotekniikan erikoiskurssi (4 ov) (L)

Prof. Erkki Oja

Kurssin aiheena on keväällä 1998

Bayes-verkot ja bayesilainen päättely.

Nykyinen ``Soft Computing'' tai ``Computational Intelligence'' -tutkimusala jaetaan neljään perusalaan, joita ovat neuroverkot, sumeat järjestelmät, evoluutiolaskenta ja Bayes-verkot. Tämä jako näkyy esimerkiksi viimeaikaisten konferenssien rakenteessa ja kotimaisissakin tutkimusohjelmissa. Bayes-verkoilla on joitakin merkittäviä sovelluksia (mm. Microsoft) ja alan suosio on kasvussa, osittain siksi että vihdoinkin voidaan käytännössä laskea ratkaisuja suurillekin päättelyongelmille.

Informaatiotekniikan laboratorion jatko-opintokursseissa on aikaisemmin käsitelty muita Computational Intelligence-aloja, ja nyt on tarkoitus perehtyä Bayes-verkkojen ja bayesilaisen päättelyn teoriaan ja käytäntöön.

Kurssi perustuu useisiin kirjoihin, joista käsitellään aikataulun puitteissa sopivia osia. Alalta on joitakin klassisia oppikirjoja, joista kaksi tärkeintä ovat:

Pearl, J.: Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference, MKSM, 1988,

Neapolitan, R.E.: Probabilistic Reasoning in Expert Systems, JW, 1990.

Uudempia kirjoja ovat: Castillo, E., Gutiérrez, J. and Hadi, A.: Expert Systems and Probabilistic Network Models, Springer-Verlag, 1997,

Jensen, F.: An Introduction to Bayesian Networks, UCL Press, 1996.

Lisäksi Informaatiotekniikan laboratoriossa on kopioitavissa noin 100 sivun (kaksipuoleisina kopioina noin 25 sivua) johdanto Bayes-verkkoihin: Petri Myllymäki ja Henry Tirri, Bayes-verkkojen mahdollisuudet.

Kurssin suorittaminen edellyttää

  1. aktiivista mukanaoloa,
  2. seminaariesitelmän tai esitelmien pitoa joistakin kirjojen kohdista,
  3. harjoitustehtävien ratkaisemista (DL 31.5.1998) (kurssin läpäisemiseksi 2/3 tehtävistä, eli 10 kpl, tulee olla suurinpiirtein oikein) ja
  4. pienen ohjelmointityyppisen harjoitustyön suorittamista (DL 31.5.1998).
Kurssin suorittamiseen arvosanalla "kiittäen hyväksytty" vaaditaan tehtävien kiitettävää ratkaisua (14 oikein 15:sta) ja kiitettävää harjoitustyön suoritusta.

Kurssi pidetään lukujärjestyksen mukaisesti torstaisin klo 14 - 16 Informaatiotekniikan laboratorion seminaarihuoneessa. Ensimmäinen tilaisuus, jossa kurssille on ilmoittauduttava, on 22. 1. Ensimmäiset esitelmät alkavat 29.1.

Erkki Oja


Käytännön järjestelyistä

Assistentti: Kurssin assistenttina toimii Juha Vesanto.

 email: juuso@mail.cis.hut.fi
 puh:   451 3283
 huone: F415 (infolabra, fyssan lafkan neljäs kerros)

Kurssin aikataulu:
Pvm Puhuja Aihe
22.1. Erkki Oja Johdanto
29.1. Henry Tirri (HY) Mitä Bayes-verkot ovat
5.2. J. Särelä 1.1 - 2.2
" H. Haanpää 2.3 - 2.4.
12.2. EI SEMINAARIA
19.2. M. Peura 2.5 - 2.6, Hugin?
" M. Ilvonen 3.1 - 3.2.2.
26.2. R. Vigario 3.2.3. - 3.3.
" J. Sinkkonen 3.4. - 3.6.
5.3. P. Hoyer 4.1. - 4.4.
" E. Piirilä 4.5. - 4.7.
12.3. M. Puittinen 5.1. - 5.2.
19.3. M. Varsta 5.3. - 5.4.
" A. Vehtari 5.5. - 5.6.
26.3. J. Ylöstalo 6.1. - 6.2.
" J. Vesanto 6.3. - 6.5.
2.4. H. Lappalainen Bayesian networks with continuous variables (?)
" Denicolai Marco Turbo coding and Bayesian networks

Harjoitustehtävät

Kurssin harjoitustehtävät (alla) ovat Jensenin kirjasta. Ratkaisut tehtäviin on palautettava viimeistään 31.5.1998, joko kurssin luennoitsijalle tai assistentille.

   Pvm      Tehtävät
   ------------------------------
   5.2.     2.2, 2.6, 2.8
   26.2.    3.4, 3.7, 3.8, 3.17
   5.3.     4.2, 4.6, 4.13
   19.3.    5.4, 5.8, 5.12
   26.3.    6.1, 6.4

Practical assignement

Consider the following example of scene interpretation. The image shows a breakfast table for one person, and the task is to determine whether it is a continental or a British breakfast table. British breakfast is usually composed of tea, bacon and eggs, and toast with marmelade (red), while continental breakfast consists of coffee, boiled eggs and rolls with jam (orange). Boiled eggs require a spoon, bacon is eaten with knife and fork.

Possible objects:
Plate big or small big and small plates are confused with probability 0.1
Cup tea or coffee tea cups are taken for coffee cups with prob. 0.3 and coffee cups for tea cups with prob. 0.2
Pot tea or coffee tea and coffee pots are confused with probability 0.4
Jar red or orange contents colour of the contents is determined correctly in 95% of all cases
Cutlery knife, fork and spoon knives are taken for spoons with prob. 0.05
knives are taken for forks with prob. 0.1
spoons are taken for forks with prob. 0.25
forks are taken for spoons with prob. 0.2
forks are taken for knifes with prob. 0.1

There are at most 3 items of cutlery on the table and the image segmentation system gives different interpretation to each of them.

NOTE: you can interpret "usually" for example as 99 cases out of 100.

NOTE: information given is not entirely complete; insert reasonable values (a priori probabilities etc.) when necessary.

  1. Construct a model for interpretation of the scene and implement it in HUGIN. In the report, give the model structure, the probability tables and your decisions regarding gaps in the model description.
  2. Insert evidence: a big plate, a coffee cup, a coffee pot, a jar with orange contents, a knife and a fork. What is the interpretation?
  3. Leave out the cutlery from the model. Let evidence be: a coffee cup, a coffee pot, red contents in the jar and a small plate. Perform a conflict analysis and a sensitivity analysis. Which of the evidence is most severily in conflict with the others? Which are the most important pieces of evidence?
  4. Modify the system such that a British hotel can use it to check their breakfast tables and automatically send a waiter to correct the setting on the table if there appears to be something wrong. Try different kinds of evidence sets and see what is the corresponding action. Utility table is given below:
    	 	Send waiter	Don't send
    	Setting OK	-5	0
    	Setting wrong	+5	-10
    

The assignement is meant to be made with HUGIN program, available from http://www.hugin.dk/demo.html. The idea is to learn to build models and utilize them using the HUGIN program, so you are encouraged to play around with the model and the program. The emphasis is on reasonable results rather than exactly correct ones, so you can make simplifying assumptions if things start to look really desperate.

The report and any questions should be directed to the course assistant Juha Vesanto. The deadline of the report is May 31st 1998.

Linkkejä



Tästä sivusta vastaa erkki.oja@hut.fi.
Sivua on viimeksi päivitetty 16.1.1998.
URL: http://www.cis.hut.fi/cis/edu/Tik-61.182/