Advertisement
Guest User

Troep.tex

a guest
May 24th, 2019
112
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 2.81 KB | None | 0 0
  1. \documentclass{article}
  2. \usepackage[utf8]{inputenc}
  3.  
  4. \title{TTTV Homework Week 7}
  5. \author{Qi Draaisma en Lodewijk Loerakker}
  6. \date{May 2019}
  7.  
  8. \begin{document}
  9.  
  10. \maketitle
  11.  
  12. \section*{Vraag 1}
  13. a)
  14. \begin{center}
  15. \begin{tabular}{ | c | c | c | c | c | c | c | c | }
  16. \hline
  17. Sentence & Amsterdam & Dam & Dutch & Damhotel & Centraal & Jam & US \\
  18. \hline \hline
  19. Doc 1 & 0 & 1 & 1 & 0 & 0 & 0 & 0 \\
  20. \hline
  21. Doc 2 & 2 & 2 & 0 & 1 & 1 & 0 & 0 \\
  22. \hline
  23. Doc 3 & 1 & 1 & 0 & 0 & 0 & 1 & 1 \\
  24. \hline
  25. Query & 1 & 1 & 0 & 0 & 0 & 0 & 0 \\
  26. \hline
  27. \end{tabular}
  28. \end{center}
  29.  
  30. \begin{center}
  31. \begin{tabular}{ | c | c | c | }
  32. \hline
  33. Sentence & Melkweg & Netherlands \\
  34. \hline \hline
  35. Doc 1 & 0 & 0 \\
  36. \hline
  37. Doc 2 & 0 & 0 \\
  38. \hline
  39. Doc 3 & 1 & 1 \\
  40. \hline
  41. Query & 0 & 1 \\
  42. \hline
  43. \end{tabular}
  44. \end{center}
  45. b) \\
  46. Dot products: \\
  47. Doc 1 $\cdot$ Query = 1 \\
  48. Doc 2 $\cdot$ Query = 4 \\
  49. Doc 3 $\cdot$ Query = 3 \\
  50. \\
  51. Cosine similarity: \\
  52. cos(Doc 1, Query) = $ \frac{1}{\sqrt{2}}\times \frac{1}{\sqrt{3}} = 0.4082 $ \\
  53. cos(Doc 2, Query) = $ 2\times \frac{2}{\sqrt{10}}\times \frac{1}{\sqrt{3}} = 0.7303 $ \\
  54. cos(Doc 2, Query) = $ 3\times \frac{1}{\sqrt{7}}\times \frac{1}{\sqrt{3}} = 0.6547 $ \\
  55. De antwoorden zijn niet heel erg anders in aard. Document twee is het meest overeenkomend bij beide technieken en document één het minst overeenkomend bij beide technieken. Dit hoeft niet meteen te betekenen dan document twee ook het relevantste document is.
  56.  
  57. \section*{Vraag 2}
  58. a) \\
  59. Doc 1 is een true positive, Doc 2 en Doc 3 zijn false positives. Aannemend dat er 5 documenten zijn over de dam, zijn er 4 false negatives en 8 true negatives. \\
  60. b) \\
  61. De precision is de aantal true positives gedeeld door het aantal positives. Dit is bij deze query $\frac{1}{3}$. \\
  62. De Recall is het aantal gevonden positives gedeeld door het aantal positives. Dit is bij deze query $\frac{1}{5}$. \\
  63. De F score van deze query is $ \frac{2*(\frac{1}{3}\times \frac{1}{5})}{\frac{1}{3}+\frac{1}{5}} = \frac{\frac{2}{15}}{\frac{8}{15}} = \frac{1}{4} $ \\
  64. c) \\
  65. Dam: $10\times log(\frac{3}{2}) = 1.7609$ \\
  66. Melkweg: $2\times log(\frac{15}{2}) = 1.7501$ \\
  67.  
  68. \section*{Vraag 3}
  69. a)
  70. $$ P(I|<s>)\times P(want|I)\times P(chinese|want)\times P(food|chinese)=0.25\times 0.33\times 0.0065\times 0.52 = 0.00027885 $$
  71. b) \\
  72. \textit{chinese} en \textit{chinese} hebben een kans van 0 om achter elkaar komen te staan volgens de \textit{unsmoothed bigram}, hierdoor is de kans op deze zin automatisch 0. \\
  73. c)
  74. $$ P(I|<s>)\times P(want|I)\times P(chinese|want)\times P(food|chinese) $$ $$=0.21\times 0.0029\times 0.052= 0.000031668 $$
  75. d)
  76. $$ P(I|<s>)\times P(want|I)\times P(chinese|want)\times P(chinese|chinese)\times P(food|chinese) $$ $$ =0.21\times 0.0029\times 0.00062\times 0.052= 0.00000001963416 $$
  77. \end{document}
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement