Advertisement
Guest User

Untitled

a guest
Nov 17th, 2019
149
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 9.78 KB | None | 0 0
  1. {
  2. "excludeRules": [
  3. "\\b(mai mốt|mai này|mai sau|mai kia|không nên|ko nên|không phải|ko phải|không cần|ko cần|chưa cần|chưa phải|ngủ|nghỉ|thời tiết|đã|hôm qua|tối qua|đêm qua|tuần trước|vừa rồi|vừa qua|mấy giờ|mấy h|chưa vậy|có\\b.*\\bkhông|có\\b.*\\bko|có\\b.*\\bk)\\b"
  4. ],
  5. "regexRules":[
  6. {
  7. "regex":[
  8. "\\b(sáng|trưa|chiều|tối|đêm)\\b"
  9. ],
  10. "regexType":"period_vn"
  11. },
  12. {
  13. "regex":[
  14. "\\b([0-9]{1,2})[g|h]([0-9]{1,2})(?: phút\\b|ph\\b|p\\b|'|’){0,1}((?: {0,1}[ap]m){0,1})(?:'|’|\\b)",
  15. "\\b([0-9]{1,2}) giờ ([0-9]{1,2})(?: phút\\b|ph\\b|p\\b|'|’){0,1}((?: {0,1}[ap]m){0,1})(?:'|’|\\b)",
  16. "\\b([0-9]{1,2}) giờ ()((?: {0,1}[ap]m){0,1})\\b",
  17. "\\b([0-9]{1,2})(?:(?:(?: )giờ)|h|g)(?: )(rưỡi)((?:(?: )[ap]m){0,1})\\b",
  18. "\\b([0-9]{1,2})(?: )(rưỡi)((?:(?: )[ap]m){0,1})\\b",
  19. "\\b([0-9]{1,2}):([0-9]{1,2})(?: phút\\b|ph\\b|p\\b|'|’){0,1}((?: {0,1}[ap]m){0,1})(?:'|’|\\b)",
  20. "\\b([0-9]{1,2})[g|h]([0-9]{0,2})((?: {0,1}[ap]m){0,1})\\b",
  21. "\\b([0-9]{1,2})[g|h]([0-9]{1,2})(?: phút\\b|ph\\b|p\\b|'|’){0,1}()(?:'|’|\\b)",
  22. "\\b([0-9]{1,2})( {0,1})([ap]m)\\b"
  23. ],
  24. "regexType":"time_vn"
  25. },
  26. {
  27. "regex":[
  28. "\\b(thứ(?: )(hai|ba|tư|năm|sáu|bảy|2|3|4|5|6|7))\\b",
  29. "\\b(t(2|3|4|5|6|7))\\b",
  30. "\\b(chủ(?: )nhật|cn)\\b"
  31. ],
  32. "regexType":"weekday_vn"
  33. },
  34. {
  35. "regex":[
  36. "\\b(hôm qua|hôm trước|hôm nọ|hôm kia|hôm nay|nay|ngày mai|mai|ngày mốt|ngày kia|đầu tuần|cuối tuần|tuần này|tuần trước|tuần sau|tuần tới)\\b"
  37. ],
  38. "regexType":"neartime_vn"
  39. },
  40. {
  41. "regex":[
  42. "\\b(weekend|this week|last week|today|yesterday)\\b"
  43. ],
  44. "regexType":"neartime_en"
  45. },
  46. {
  47. "regex":[
  48. "\\b([0-9]{1,2}) tháng ([0-9]{1,2}) năm ([0-9]{4,4})\\b",
  49. "\\b([0-9]{1,2})\/([0-9]{1,2})\/([0-9]{4,4})\\b",
  50. "\\b([0-9]{1,2})\/([0-9]{1,2}) ([0-9]{4,4})\\b",
  51. "\\b([0-9]{1,2})\/([0-9]{1,2})\\b",
  52. "\\b([0-9]{1,2}) tháng ([0-9]{1,2})\\b"
  53. ],
  54. "regexType":"day_vn"
  55. },
  56. {
  57. "regex":[
  58. "\\b([0-9]{1,2}) (january|jan|february|feb|march|mar|april|apr|may|june|july|august|aug|september|sept|october|oct|november|nov|december|dec) ([0-9]{4,4})\\b",
  59. "\\b([0-9]{1,2}) (january|jan|february|feb|march|mar|april|apr|may|june|july|august|aug|september|sept|october|oct|november|nov|december|dec)\\b"
  60. ],
  61. "regexType":"day_en"
  62. },
  63. {
  64. "regex":[
  65. "\\b([0-9]{1,2}) năm ([0-9]{4,4})\\b",
  66. "\\btháng ([0-9]{1,2})\/([0-9]{4,4})\\b",
  67. "\\b([0-9]{1,2})\/([0-9]{4,4})\\b",
  68. "\\btháng ([0-9]{1,2})\\b"
  69. ],
  70. "regexType":"month_vn"
  71. },
  72. {
  73. "regex":[
  74. "\\b(january|jan|february|feb|march|mar|april|apr|may|june|july|august|aug|september|sept|october|oct|november|nov|december|dec)( [0-9]{4,4}){0,1}\\b"
  75. ],
  76. "regexType":"month_en"
  77. },
  78. {
  79. "regex":[
  80. "\\b(năm ngoái|năm nay|[0-9]{4,4})\\b"
  81. ],
  82. "regexType":"year_vn"
  83. },
  84. {
  85. "regex":[
  86. "\\b(this year|last year)\\b"
  87. ],
  88. "regexType":"year_en"
  89. },
  90. {
  91. "regex":[
  92. "\\b(tết|tet|lunar new year)\\b"
  93. ],
  94. "regexInfo":{
  95. "start":"25\/12",
  96. "calendarType":1,
  97. "end":"07\/01"
  98. },
  99. "regexType":"custom"
  100. },
  101. {
  102. "regex":[
  103. "\\b(giỗ tổ|hung king|hung king(?:'|’)s)\\b"
  104. ],
  105. "regexInfo":{
  106. "start":"10\/03",
  107. "calendarType":1,
  108. "end":"10\/03"
  109. },
  110. "regexType":"custom"
  111. },
  112. {
  113. "regex":[
  114. "\\b(trung thu|mid autumn|moon festival)\\b"
  115. ],
  116. "regexInfo":{
  117. "start":"15\/08",
  118. "calendarType":1,
  119. "end":"15\/08"
  120. },
  121. "regexType":"custom"
  122. },
  123. {
  124. "regex":[
  125. "\\b(quốc tế phụ nữ|phụ nữ|women(?:'|’)s day|women day)\\b"
  126. ],
  127. "regexInfo":{
  128. "start":"08\/03",
  129. "calendarType":0,
  130. "end":"08\/03"
  131. },
  132. "regexType":"custom"
  133. },
  134. {
  135. "regex":[
  136. "\\b(phụ nữ việt nam|phụ nữ vn|viet nam women(?:'|’)s day|viet nam women day|vn women(?:'|’)s day|vn women day)\\b"
  137. ],
  138. "regexInfo":{
  139. "start":"20\/10",
  140. "calendarType":0,
  141. "end":"20\/10"
  142. },
  143. "regexType":"custom"
  144. },
  145. {
  146. "regex":[
  147. "\\b(lao động|labor day)\\b"
  148. ],
  149. "regexInfo":{
  150. "start":"01\/05",
  151. "calendarType":0,
  152. "end":"01\/05"
  153. },
  154. "regexType":"custom"
  155. },
  156. {
  157. "regex":[
  158. "\\b(khai giảng|khai trường)\\b"
  159. ],
  160. "regexInfo":{
  161. "start":"05\/09",
  162. "calendarType":0,
  163. "end":"05\/09"
  164. },
  165. "regexType":"custom"
  166. },
  167. {
  168. "regex":[
  169. "\\b(noel|christmas|giáng sinh)\\b"
  170. ],
  171. "regexInfo":{
  172. "start":"24\/12",
  173. "calendarType":0,
  174. "end":"25\/12"
  175. },
  176. "regexType":"custom"
  177. },
  178. {
  179. "regex":[
  180. "\\b(năm mới|new year)\\b"
  181. ],
  182. "regexInfo":{
  183. "start":"31\/12",
  184. "calendarType":0,
  185. "end":"01\/01"
  186. },
  187. "regexType":"custom"
  188. },
  189. {
  190. "regex":[
  191. "\\b(thiếu nhi|children(?:'|’)s day|children day)\\b"
  192. ],
  193. "regexInfo":{
  194. "start":"01\/06",
  195. "calendarType":0,
  196. "end":"01\/06"
  197. },
  198. "regexType":"custom"
  199. },
  200. {
  201. "regex":[
  202. "\\b(nhà giáo|teacher day)\\b"
  203. ],
  204. "regexInfo":{
  205. "start":"20\/11",
  206. "calendarType":0,
  207. "end":"20\/11"
  208. },
  209. "regexType":"custom"
  210. },
  211. {
  212. "regex":[
  213. "\\b(xuân|spring)\\b"
  214. ],
  215. "regexInfo":{
  216. "start":"01\/01",
  217. "calendarType":0,
  218. "end":"30\/04"
  219. },
  220. "regexType":"custom"
  221. },
  222. {
  223. "regex":[
  224. "\\b(hạ|hè|summer)\\b"
  225. ],
  226. "regexInfo":{
  227. "start":"01\/04",
  228. "calendarType":0,
  229. "end":"31\/08"
  230. },
  231. "regexType":"custom"
  232. },
  233. {
  234. "regex":[
  235. "\\b(thu|autumn)\\b"
  236. ],
  237. "regexInfo":{
  238. "start":"01\/08",
  239. "calendarType":0,
  240. "end":"30\/11"
  241. },
  242. "regexType":"custom"
  243. },
  244. {
  245. "regex":[
  246. "\\b(đông|winter)\\b"
  247. ],
  248. "regexInfo":{
  249. "start":"01\/11",
  250. "calendarType":0,
  251. "end":"31\/01"
  252. },
  253. "regexType":"custom"
  254. }
  255. ],
  256. "mappingRules": {
  257. "chu nhat":1,
  258. "cn":1,
  259. "thu hai":2,
  260. "t2":2,
  261. "thu 2":2,
  262. "t3":3,
  263. "thu 3":3,
  264. "thu ba":3,
  265. "t4":4,
  266. "thu 4":4,
  267. "thu tu":4,
  268. "thu nam":5,
  269. "t5":5,
  270. "thu 5":5,
  271. "thu sau":6,
  272. "t6":6,
  273. "thu 6":6,
  274. "thu bay":7,
  275. "t7":7,
  276. "thu 7":7,
  277. "nay":101,
  278. "hom nay":101,
  279. "ngay mai":102,
  280. "mai":102,
  281. "ngay mot":103,
  282. "ngay kia":103,
  283. "hom no":104,
  284. "hom truoc":104,
  285. "hom qua":104,
  286. "hom kia":104,
  287. "cuoi tuan":105,
  288. "weekend":105,
  289. "dau tuan":107,
  290. "tuan nay":108,
  291. "this week":108,
  292. "tuan truoc":109,
  293. "last week":109,
  294. "tuan sau":110,
  295. "tuan toi":110,
  296. "jan":301,
  297. "thang 1":301,
  298. "1":301,
  299. "january":301,
  300. "feb":302,
  301. "thang 2":302,
  302. "2":302,
  303. "february":302,
  304. "thang 3":303,
  305. "3":303,
  306. "mar":303,
  307. "march":303,
  308. "april":304,
  309. "apr":304,
  310. "thang 4":304,
  311. "4":304,
  312. "thang 5":305,
  313. "5":305,
  314. "may":305,
  315. "thang 6":306,
  316. "6":306,
  317. "june":306,
  318. "thang 7":307,
  319. "july":307,
  320. "7":307,
  321. "august":308,
  322. "thang 8":308,
  323. "aug":308,
  324. "8":308,
  325. "thang 9":309,
  326. "9":309,
  327. "september":309,
  328. "sept":309,
  329. "10":310,
  330. "oct":310,
  331. "october":310,
  332. "thang 10":310,
  333. "november":311,
  334. "11":311,
  335. "thang 11":311,
  336. "nov":311,
  337. "dec":312,
  338. "12":312,
  339. "thang 12":312,
  340. "december":312,
  341. "sang":400,
  342. "trua":401,
  343. "chieu":402,
  344. "toi":403,
  345. "dem":404,
  346. "nam nay":501,
  347. "this year":501,
  348. "last year":502,
  349. "nam ngoai":502
  350. },
  351. "includeRules": [
  352. "\\b(nhé|nhá|nha|nghen|nghe|nhớ|nhắc|giúp|họp|nhậu|đi|chơi|cafe|cà phê|gặp|ăn|trà sữa|uống|tham dự|tổ chức|tập trung|có mặt|chốt|phải|báo|nốt|có gì|sang|xuống|lên|gọi|làm|về|khám|nộp|kiểm|chuyển|giao|rước|lấy|giữ|đón|thi|tiêm|thăm|về|trả|gửi|liên hệ|dọn|nhận|đóng|trực|ký|thêm|xóa|sửa|mua|bán|ghé|giải|nói|học|mang cho)\\b"
  353. ]
  354. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement