T-61.281 Luonnollisten kielten tilastollinen käsittely
Harjoitus 2, ti 4.2.2003, 16:15-18:00 - Entropia, hämmentyneisyys,
kontekstivapaa kieli, Versio 1.1
W | P(W) |
'kissa' | |
'tuuli' | |
'kiipeilijä' | |
'naukaisi' | |
'tuivertaa' | |
'katosi' |
'naukaisi' | 'tuivertaa' | 'katosi' | ||
'kissa' | 0 | |||
'tuuli' | ||||
'kiipeilijä' | 0 | |||
Malli 1 | Malli 2 |
P(sana='kissa')=0.1 | P(sana=subjekti)=0.33 |
P(sana='koira')=0.1 | P(sana=verbi)=0.33 |
P(sana='valas')=0.1 | P(sana=kohde)=0.33 |
P(sana='kala')=0.1 | |
P(sana='istui')=0.1 | |
P(sana='menee')=0.1 | |
P(sana='on')=0.1 | |
P(sana='puuhun')=0.1 | |
P(sana='kuuhun')=0.1 | |
P(sana='suuhun')=0.1 |
Malli 3 | |
P(sana='kissa' | sana=ensimmäinen) | =0.25 |
P(sana='koira' | sana=ensimmäinen) | =0.25 |
P(sana='valas' | sana=ensimmäinen) | =0.25 |
P(sana='kala' | sana=ensimmäinen) | =0.25 |
P(sana='istui' | edellinen_sana {'kissa','koira','valas','kala'}) | =0.33 |
P(sana='menee' | edellinen_sana {'kissa','koira','valas','kala'}) | =0.33 |
P(sana='on' | edellinen_sana {'kissa','koira','valas','kala'}) | =0.33 |
P(sana='puuhun' | edellinen_sana {'istui','menee','on'}) | =0.33 |
P(sana='kuuhun' | edellinen_sana {'istui','menee','on'}) | =0.33 |
P(sana='suuhun' | edellinen_sana {'istui','menee','on'}) | =0.33 |
Hämmentyneisyys voidaan määritellä testijoukon sanojen todennäköisyyksien geometrisen keskiarvon käänteislukuna: