Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- \documentclass{article}
- \usepackage[utf8]{inputenc}
- \title{TTTV Homework Week 7}
- \author{Qi Draaisma en Lodewijk Loerakker}
- \date{May 2019}
- \begin{document}
- \maketitle
- \section*{Vraag 1}
- a)
- \begin{center}
- \begin{tabular}{ | c | c | c | c | c | c | c | c | }
- \hline
- Sentence & Amsterdam & Dam & Dutch & Damhotel & Centraal & Jam & US \\
- \hline \hline
- Doc 1 & 0 & 1 & 1 & 0 & 0 & 0 & 0 \\
- \hline
- Doc 2 & 2 & 2 & 0 & 1 & 1 & 0 & 0 \\
- \hline
- Doc 3 & 1 & 1 & 0 & 0 & 0 & 1 & 1 \\
- \hline
- Query & 1 & 1 & 0 & 0 & 0 & 0 & 0 \\
- \hline
- \end{tabular}
- \end{center}
- \begin{center}
- \begin{tabular}{ | c | c | c | }
- \hline
- Sentence & Melkweg & Netherlands \\
- \hline \hline
- Doc 1 & 0 & 0 \\
- \hline
- Doc 2 & 0 & 0 \\
- \hline
- Doc 3 & 1 & 1 \\
- \hline
- Query & 0 & 1 \\
- \hline
- \end{tabular}
- \end{center}
- b) \\
- Dot products: \\
- Doc 1 $\cdot$ Query = 1 \\
- Doc 2 $\cdot$ Query = 4 \\
- Doc 3 $\cdot$ Query = 3 \\
- \\
- Cosine similarity: \\
- cos(Doc 1, Query) = $ \frac{1}{\sqrt{2}}\times \frac{1}{\sqrt{3}} = 0.4082 $ \\
- cos(Doc 2, Query) = $ 2\times \frac{2}{\sqrt{10}}\times \frac{1}{\sqrt{3}} = 0.7303 $ \\
- cos(Doc 2, Query) = $ 3\times \frac{1}{\sqrt{7}}\times \frac{1}{\sqrt{3}} = 0.6547 $ \\
- De antwoorden zijn niet heel erg anders in aard. Document twee is het meest overeenkomend bij beide technieken en document één het minst overeenkomend bij beide technieken. Dit hoeft niet meteen te betekenen dan document twee ook het relevantste document is.
- \section*{Vraag 2}
- a) \\
- Doc 1 is een true positive, Doc 2 en Doc 3 zijn false positives. Aannemend dat er 5 documenten zijn over de dam, zijn er 4 false negatives en 8 true negatives. \\
- b) \\
- De precision is de aantal true positives gedeeld door het aantal positives. Dit is bij deze query $\frac{1}{3}$. \\
- De Recall is het aantal gevonden positives gedeeld door het aantal positives. Dit is bij deze query $\frac{1}{5}$. \\
- De F score van deze query is $ \frac{2*(\frac{1}{3}\times \frac{1}{5})}{\frac{1}{3}+\frac{1}{5}} = \frac{\frac{2}{15}}{\frac{8}{15}} = \frac{1}{4} $ \\
- c) \\
- Dam: $10\times log(\frac{3}{2}) = 1.7609$ \\
- Melkweg: $2\times log(\frac{15}{2}) = 1.7501$ \\
- \section*{Vraag 3}
- a)
- $$ P(I|<s>)\times P(want|I)\times P(chinese|want)\times P(food|chinese)=0.25\times 0.33\times 0.0065\times 0.52 = 0.00027885 $$
- b) \\
- \textit{chinese} en \textit{chinese} hebben een kans van 0 om achter elkaar komen te staan volgens de \textit{unsmoothed bigram}, hierdoor is de kans op deze zin automatisch 0. \\
- c)
- $$ P(I|<s>)\times P(want|I)\times P(chinese|want)\times P(food|chinese) $$ $$=0.21\times 0.0029\times 0.052= 0.000031668 $$
- d)
- $$ P(I|<s>)\times P(want|I)\times P(chinese|want)\times P(chinese|chinese)\times P(food|chinese) $$ $$ =0.21\times 0.0029\times 0.00062\times 0.052= 0.00000001963416 $$
- \end{document}
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement