Guest User

Untitled

a guest
Dec 20th, 2012
586
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. Set<String> namedEntities = new HashSet<String>();
  2. namedEntities.add("quot");
  3. namedEntities.add("amp");
  4. namedEntities.add("lt");
  5. namedEntities.add("gt");
  6. namedEntities.add("apos");
  7. namedEntities.add("nbsp");
  8. namedEntities.add("iexcl");
  9. namedEntities.add("cent");
  10. namedEntities.add("pound");
  11. namedEntities.add("curren");
  12. namedEntities.add("yen");
  13. namedEntities.add("brvbar");
  14. namedEntities.add("sect");
  15. namedEntities.add("uml");
  16. namedEntities.add("copy");
  17. namedEntities.add("ordf");
  18. namedEntities.add("laquo");
  19. namedEntities.add("not");
  20. namedEntities.add("shy");
  21. namedEntities.add("reg");
  22. namedEntities.add("macr");
  23. namedEntities.add("deg");
  24. namedEntities.add("plusmn");
  25. namedEntities.add("sup2");
  26. namedEntities.add("sup3");
  27. namedEntities.add("acute");
  28. namedEntities.add("micro");
  29. namedEntities.add("para");
  30. namedEntities.add("middot");
  31. namedEntities.add("cedil");
  32. namedEntities.add("sup1");
  33. namedEntities.add("ordm");
  34. namedEntities.add("raquo");
  35. namedEntities.add("frac14");
  36. namedEntities.add("frac12");
  37. namedEntities.add("frac34");
  38. namedEntities.add("iquest");
  39. namedEntities.add("Agrave");
  40. namedEntities.add("Aacute");
  41. namedEntities.add("Acirc");
  42. namedEntities.add("Atilde");
  43. namedEntities.add("Auml");
  44. namedEntities.add("Aring");
  45. namedEntities.add("AElig");
  46. namedEntities.add("Ccedil");
  47. namedEntities.add("Egrave");
  48. namedEntities.add("Eacute");
  49. namedEntities.add("Ecirc");
  50. namedEntities.add("Euml");
  51. namedEntities.add("Igrave");
  52. namedEntities.add("Iacute");
  53. namedEntities.add("Icirc");
  54. namedEntities.add("Iuml");
  55. namedEntities.add("ETH");
  56. namedEntities.add("Ntilde");
  57. namedEntities.add("Ograve");
  58. namedEntities.add("Oacute");
  59. namedEntities.add("Ocirc");
  60. namedEntities.add("Otilde");
  61. namedEntities.add("Ouml");
  62. namedEntities.add("times");
  63. namedEntities.add("Oslash");
  64. namedEntities.add("Ugrave");
  65. namedEntities.add("Uacute");
  66. namedEntities.add("Ucirc");
  67. namedEntities.add("Uuml");
  68. namedEntities.add("Yacute");
  69. namedEntities.add("THORN");
  70. namedEntities.add("szlig");
  71. namedEntities.add("agrave");
  72. namedEntities.add("aacute");
  73. namedEntities.add("acirc");
  74. namedEntities.add("atilde");
  75. namedEntities.add("auml");
  76. namedEntities.add("aring");
  77. namedEntities.add("aelig");
  78. namedEntities.add("ccedil");
  79. namedEntities.add("egrave");
  80. namedEntities.add("eacute");
  81. namedEntities.add("ecirc");
  82. namedEntities.add("euml");
  83. namedEntities.add("igrave");
  84. namedEntities.add("iacute");
  85. namedEntities.add("icirc");
  86. namedEntities.add("iuml");
  87. namedEntities.add("eth");
  88. namedEntities.add("ntilde");
  89. namedEntities.add("ograve");
  90. namedEntities.add("oacute");
  91. namedEntities.add("ocirc");
  92. namedEntities.add("otilde");
  93. namedEntities.add("ouml");
  94. namedEntities.add("divide");
  95. namedEntities.add("oslash");
  96. namedEntities.add("ugrave");
  97. namedEntities.add("uacute");
  98. namedEntities.add("ucirc");
  99. namedEntities.add("uuml");
  100. namedEntities.add("yacute");
  101. namedEntities.add("thorn");
  102. namedEntities.add("yuml");
  103. namedEntities.add("OElig");
  104. namedEntities.add("oelig");
  105. namedEntities.add("Scaron");
  106. namedEntities.add("scaron");
  107. namedEntities.add("Yuml");
  108. namedEntities.add("fnof");
  109. namedEntities.add("circ");
  110. namedEntities.add("tilde");
  111. namedEntities.add("Alpha");
  112. namedEntities.add("Beta");
  113. namedEntities.add("Gamma");
  114. namedEntities.add("Delta");
  115. namedEntities.add("Epsilon");
  116. namedEntities.add("Zeta");
  117. namedEntities.add("Eta");
  118. namedEntities.add("Theta");
  119. namedEntities.add("Iota");
  120. namedEntities.add("Kappa");
  121. namedEntities.add("Lambda");
  122. namedEntities.add("Mu");
  123. namedEntities.add("Nu");
  124. namedEntities.add("Xi");
  125. namedEntities.add("Omicron");
  126. namedEntities.add("Pi");
  127. namedEntities.add("Rho");
  128. namedEntities.add("Sigma");
  129. namedEntities.add("Tau");
  130. namedEntities.add("Upsilon");
  131. namedEntities.add("Phi");
  132. namedEntities.add("Chi");
  133. namedEntities.add("Psi");
  134. namedEntities.add("Omega");
  135. namedEntities.add("alpha");
  136. namedEntities.add("beta");
  137. namedEntities.add("gamma");
  138. namedEntities.add("delta");
  139. namedEntities.add("epsilon");
  140. namedEntities.add("zeta");
  141. namedEntities.add("eta");
  142. namedEntities.add("theta");
  143. namedEntities.add("iota");
  144. namedEntities.add("kappa");
  145. namedEntities.add("lambda");
  146. namedEntities.add("mu");
  147. namedEntities.add("nu");
  148. namedEntities.add("xi");
  149. namedEntities.add("omicron");
  150. namedEntities.add("pi");
  151. namedEntities.add("rho");
  152. namedEntities.add("sigmaf");
  153. namedEntities.add("sigma");
  154. namedEntities.add("tau");
  155. namedEntities.add("upsilon");
  156. namedEntities.add("phi");
  157. namedEntities.add("chi");
  158. namedEntities.add("psi");
  159. namedEntities.add("omega");
  160. namedEntities.add("thetasym");
  161. namedEntities.add("upsih");
  162. namedEntities.add("piv");
  163. namedEntities.add("ensp");
  164. namedEntities.add("emsp");
  165. namedEntities.add("thinsp");
  166. namedEntities.add("zwnj");
  167. namedEntities.add("zwj");
  168. namedEntities.add("lrm");
  169. namedEntities.add("rlm");
  170. namedEntities.add("ndash");
  171. namedEntities.add("mdash");
  172. namedEntities.add("lsquo");
  173. namedEntities.add("rsquo");
  174. namedEntities.add("sbquo");
  175. namedEntities.add("ldquo");
  176. namedEntities.add("rdquo");
  177. namedEntities.add("bdquo");
  178. namedEntities.add("dagger");
  179. namedEntities.add("Dagger");
  180. namedEntities.add("bull");
  181. namedEntities.add("hellip");
  182. namedEntities.add("permil");
  183. namedEntities.add("prime");
  184. namedEntities.add("Prime");
  185. namedEntities.add("lsaquo");
  186. namedEntities.add("rsaquo");
  187. namedEntities.add("oline");
  188. namedEntities.add("frasl");
  189. namedEntities.add("euro");
  190. namedEntities.add("weierp");
  191. namedEntities.add("image");
  192. namedEntities.add("real");
  193. namedEntities.add("trade");
  194. namedEntities.add("alefsym");
  195. namedEntities.add("larr");
  196. namedEntities.add("uarr");
  197. namedEntities.add("rarr");
  198. namedEntities.add("darr");
  199. namedEntities.add("harr");
  200. namedEntities.add("crarr");
  201. namedEntities.add("lArr");
  202. namedEntities.add("uArr");
  203. namedEntities.add("rArr");
  204. namedEntities.add("dArr");
  205. namedEntities.add("hArr");
  206. namedEntities.add("forall");
  207. namedEntities.add("part");
  208. namedEntities.add("exist");
  209. namedEntities.add("empty");
  210. namedEntities.add("nabla");
  211. namedEntities.add("isin");
  212. namedEntities.add("notin");
  213. namedEntities.add("ni");
  214. namedEntities.add("prod");
  215. namedEntities.add("sum");
  216. namedEntities.add("minus");
  217. namedEntities.add("lowast");
  218. namedEntities.add("radic");
  219. namedEntities.add("prop");
  220. namedEntities.add("infin");
  221. namedEntities.add("ang");
  222. namedEntities.add("and");
  223. namedEntities.add("or");
  224. namedEntities.add("cap");
  225. namedEntities.add("cup");
  226. namedEntities.add("int");
  227. namedEntities.add("there4");
  228. namedEntities.add("sim");
  229. namedEntities.add("cong");
  230. namedEntities.add("asymp");
  231. namedEntities.add("ne");
  232. namedEntities.add("equiv");
  233. namedEntities.add("le");
  234. namedEntities.add("ge");
  235. namedEntities.add("sub");
  236. namedEntities.add("sup");
  237. namedEntities.add("nsub");
  238. namedEntities.add("sube");
  239. namedEntities.add("supe");
  240. namedEntities.add("oplus");
  241. namedEntities.add("otimes");
  242. namedEntities.add("perp");
  243. namedEntities.add("sdot");
  244. namedEntities.add("lceil");
  245. namedEntities.add("rceil");
  246. namedEntities.add("lfloor");
  247. namedEntities.add("rfloor");
  248. namedEntities.add("lang");
  249. namedEntities.add("rang");
  250. namedEntities.add("loz");
  251. namedEntities.add("spades");
  252. namedEntities.add("clubs");
  253. namedEntities.add("hearts");
  254. namedEntities.add("diams");
Advertisement
Add Comment
Please, Sign In to add comment