T-61.281 Luonnollisen kielen tilastollinen käsittely
Harjoitus 8, ti 18.3.2003, 16:15-18:00 Tilastolliset yhteydettömät kieliopit, Versio 1.0

1.
Laske kuvassa 1 olevien jäsennyspuiden todennäköisyydet käyttäen taulukossa 1 olevia sääntöjä.

Kuva: Jäsennykset
\begin{figure}\begin{center}
\leavevmode
\hfill
\epsfig{file=puu1.eps,width=0...
...l
\epsfig{file=puu2.eps,width=0.43\textwidth} \hfill
\end{center} \end{figure}


Taulukko: Tilastollinen yhteydetön kielioppi
$\textstyle \parbox{.4\linewidth}{
\begin{tabular}{lclc}
S &$\rightarrow$\ &NP...
...$\rightarrow$&NP SI & 0.1\\
NP &$\rightarrow$&NP PP & 0.15\\
\end{tabular}}$ $\textstyle \parbox{.4\linewidth}{
\begin{tabular}{lclc}
NP&$\rightarrow$\ &hä...
...REL&$\rightarrow$&joka & 0.5\\
REL&$\rightarrow$&ja & 0.5 \\
\end{tabular}}$


2.
Laske lauseen ``Hän tunsi tuulen kalpeilla kasvoillaan'' todennäköisyys, kun mallina on taulukon 1 säännöt. Todennäköisyyden ratkaiseminen sujunee helpoimmin sisäpuoli-algoritmilla (inside algorithm). Voit samalla myös helposti pitää kirjaa siitä, mikä on todennäköisin jäsennyspuu tälle lauseelle.

3.
Tarkastellaan kielioppia, missä on kaksi sääntöä:
$ P(S\rightarrow w)=1-p$
$ P(S\rightarrow S~S)=p$

$ S$ on aloitussymboli ja $ w$ on terminaalisymboli. On mahdollista, että joillain $ p$:n arvoilla kielimalli ei ole oikea todennäköisyysfunktio, koska osa todennäköisyydestä häviää äärettömien puiden generointiin. Millä $ p$:n arvoilla annettu kielioppi antaa oikean todennäköisyysjakauman eli $ P(w)+P(w~w)+P(w~w~w)+\dots = 1$.



vsiivola@cis.hut.fi