SHARE
TWEET

Untitled

a guest Nov 17th, 2019 112 Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. {
  2.    "excludeRules": [
  3.       "\\b(mai mốt|mai này|mai sau|mai kia|không nên|ko nên|không phải|ko phải|không cần|ko cần|chưa cần|chưa phải|ngủ|nghỉ|thời tiết|đã|hôm qua|tối qua|đêm qua|tuần trước|vừa rồi|vừa qua|mấy giờ|mấy h|chưa vậy|có\\b.*\\bkhông|có\\b.*\\bko|có\\b.*\\bk)\\b"
  4.    ],
  5.    "regexRules":[
  6.       {
  7.          "regex":[
  8.             "\\b(sáng|trưa|chiều|tối|đêm)\\b"
  9.          ],
  10.          "regexType":"period_vn"
  11.       },
  12.       {
  13.          "regex":[
  14.             "\\b([0-9]{1,2})[g|h]([0-9]{1,2})(?: phút\\b|ph\\b|p\\b|'|’){0,1}((?: {0,1}[ap]m){0,1})(?:'|’|\\b)",
  15.             "\\b([0-9]{1,2}) giờ ([0-9]{1,2})(?: phút\\b|ph\\b|p\\b|'|’){0,1}((?: {0,1}[ap]m){0,1})(?:'|’|\\b)",
  16.             "\\b([0-9]{1,2}) giờ ()((?: {0,1}[ap]m){0,1})\\b",
  17.             "\\b([0-9]{1,2})(?:(?:(?: )giờ)|h|g)(?: )(rưỡi)((?:(?: )[ap]m){0,1})\\b",
  18.             "\\b([0-9]{1,2})(?: )(rưỡi)((?:(?: )[ap]m){0,1})\\b",
  19.             "\\b([0-9]{1,2}):([0-9]{1,2})(?: phút\\b|ph\\b|p\\b|'|’){0,1}((?: {0,1}[ap]m){0,1})(?:'|’|\\b)",
  20.             "\\b([0-9]{1,2})[g|h]([0-9]{0,2})((?: {0,1}[ap]m){0,1})\\b",
  21.             "\\b([0-9]{1,2})[g|h]([0-9]{1,2})(?: phút\\b|ph\\b|p\\b|'|’){0,1}()(?:'|’|\\b)",
  22.             "\\b([0-9]{1,2})( {0,1})([ap]m)\\b"
  23.          ],
  24.          "regexType":"time_vn"
  25.       },
  26.       {
  27.          "regex":[
  28.             "\\b(thứ(?: )(hai|ba|tư|năm|sáu|bảy|2|3|4|5|6|7))\\b",
  29.             "\\b(t(2|3|4|5|6|7))\\b",
  30.             "\\b(chủ(?: )nhật|cn)\\b"
  31.          ],
  32.          "regexType":"weekday_vn"
  33.       },
  34.       {
  35.          "regex":[
  36.             "\\b(hôm qua|hôm trước|hôm nọ|hôm kia|hôm nay|nay|ngày mai|mai|ngày mốt|ngày kia|đầu tuần|cuối tuần|tuần này|tuần trước|tuần sau|tuần tới)\\b"
  37.          ],
  38.          "regexType":"neartime_vn"
  39.       },
  40.       {
  41.          "regex":[
  42.             "\\b(weekend|this week|last week|today|yesterday)\\b"
  43.          ],
  44.          "regexType":"neartime_en"
  45.       },
  46.       {
  47.          "regex":[
  48.             "\\b([0-9]{1,2}) tháng ([0-9]{1,2}) năm ([0-9]{4,4})\\b",
  49.             "\\b([0-9]{1,2})\/([0-9]{1,2})\/([0-9]{4,4})\\b",
  50.             "\\b([0-9]{1,2})\/([0-9]{1,2}) ([0-9]{4,4})\\b",
  51.             "\\b([0-9]{1,2})\/([0-9]{1,2})\\b",
  52.             "\\b([0-9]{1,2}) tháng ([0-9]{1,2})\\b"
  53.          ],
  54.          "regexType":"day_vn"
  55.       },
  56.       {
  57.          "regex":[
  58.             "\\b([0-9]{1,2}) (january|jan|february|feb|march|mar|april|apr|may|june|july|august|aug|september|sept|october|oct|november|nov|december|dec) ([0-9]{4,4})\\b",
  59.             "\\b([0-9]{1,2}) (january|jan|february|feb|march|mar|april|apr|may|june|july|august|aug|september|sept|october|oct|november|nov|december|dec)\\b"
  60.          ],
  61.          "regexType":"day_en"
  62.       },
  63.       {
  64.          "regex":[
  65.             "\\b([0-9]{1,2}) năm ([0-9]{4,4})\\b",
  66.             "\\btháng ([0-9]{1,2})\/([0-9]{4,4})\\b",
  67.             "\\b([0-9]{1,2})\/([0-9]{4,4})\\b",
  68.             "\\btháng ([0-9]{1,2})\\b"
  69.          ],
  70.          "regexType":"month_vn"
  71.       },
  72.       {
  73.          "regex":[
  74.             "\\b(january|jan|february|feb|march|mar|april|apr|may|june|july|august|aug|september|sept|october|oct|november|nov|december|dec)( [0-9]{4,4}){0,1}\\b"
  75.          ],
  76.          "regexType":"month_en"
  77.       },
  78.       {
  79.          "regex":[
  80.             "\\b(năm ngoái|năm nay|[0-9]{4,4})\\b"
  81.          ],
  82.          "regexType":"year_vn"
  83.       },
  84.       {
  85.          "regex":[
  86.             "\\b(this year|last year)\\b"
  87.          ],
  88.          "regexType":"year_en"
  89.       },
  90.       {
  91.          "regex":[
  92.             "\\b(tết|tet|lunar new year)\\b"
  93.          ],
  94.          "regexInfo":{
  95.             "start":"25\/12",
  96.             "calendarType":1,
  97.             "end":"07\/01"
  98.          },
  99.          "regexType":"custom"
  100.       },
  101.       {
  102.          "regex":[
  103.             "\\b(giỗ tổ|hung king|hung king(?:'|’)s)\\b"
  104.          ],
  105.          "regexInfo":{
  106.             "start":"10\/03",
  107.             "calendarType":1,
  108.             "end":"10\/03"
  109.          },
  110.          "regexType":"custom"
  111.       },
  112.       {
  113.          "regex":[
  114.             "\\b(trung thu|mid autumn|moon festival)\\b"
  115.          ],
  116.          "regexInfo":{
  117.             "start":"15\/08",
  118.             "calendarType":1,
  119.             "end":"15\/08"
  120.          },
  121.          "regexType":"custom"
  122.       },
  123.       {
  124.          "regex":[
  125.             "\\b(quốc tế phụ nữ|phụ nữ|women(?:'|’)s day|women day)\\b"
  126.          ],
  127.          "regexInfo":{
  128.             "start":"08\/03",
  129.             "calendarType":0,
  130.             "end":"08\/03"
  131.          },
  132.          "regexType":"custom"
  133.       },
  134.       {
  135.          "regex":[
  136.             "\\b(phụ nữ việt nam|phụ nữ vn|viet nam women(?:'|’)s day|viet nam women day|vn women(?:'|’)s day|vn women day)\\b"
  137.          ],
  138.          "regexInfo":{
  139.             "start":"20\/10",
  140.             "calendarType":0,
  141.             "end":"20\/10"
  142.          },
  143.          "regexType":"custom"
  144.       },
  145.       {
  146.          "regex":[
  147.             "\\b(lao động|labor day)\\b"
  148.          ],
  149.          "regexInfo":{
  150.             "start":"01\/05",
  151.             "calendarType":0,
  152.             "end":"01\/05"
  153.          },
  154.          "regexType":"custom"
  155.       },
  156.       {
  157.          "regex":[
  158.             "\\b(khai giảng|khai trường)\\b"
  159.          ],
  160.          "regexInfo":{
  161.             "start":"05\/09",
  162.             "calendarType":0,
  163.             "end":"05\/09"
  164.          },
  165.          "regexType":"custom"
  166.       },
  167.       {
  168.          "regex":[
  169.             "\\b(noel|christmas|giáng sinh)\\b"
  170.          ],
  171.          "regexInfo":{
  172.             "start":"24\/12",
  173.             "calendarType":0,
  174.             "end":"25\/12"
  175.          },
  176.          "regexType":"custom"
  177.       },
  178.       {
  179.          "regex":[
  180.             "\\b(năm mới|new year)\\b"
  181.          ],
  182.          "regexInfo":{
  183.             "start":"31\/12",
  184.             "calendarType":0,
  185.             "end":"01\/01"
  186.          },
  187.          "regexType":"custom"
  188.       },
  189.       {
  190.          "regex":[
  191.             "\\b(thiếu nhi|children(?:'|’)s day|children day)\\b"
  192.          ],
  193.          "regexInfo":{
  194.             "start":"01\/06",
  195.             "calendarType":0,
  196.             "end":"01\/06"
  197.          },
  198.          "regexType":"custom"
  199.       },
  200.       {
  201.          "regex":[
  202.             "\\b(nhà giáo|teacher day)\\b"
  203.          ],
  204.          "regexInfo":{
  205.             "start":"20\/11",
  206.             "calendarType":0,
  207.             "end":"20\/11"
  208.          },
  209.          "regexType":"custom"
  210.       },
  211.       {
  212.          "regex":[
  213.             "\\b(xuân|spring)\\b"
  214.          ],
  215.          "regexInfo":{
  216.             "start":"01\/01",
  217.             "calendarType":0,
  218.             "end":"30\/04"
  219.          },
  220.          "regexType":"custom"
  221.       },
  222.       {
  223.          "regex":[
  224.             "\\b(hạ|hè|summer)\\b"
  225.          ],
  226.          "regexInfo":{
  227.             "start":"01\/04",
  228.             "calendarType":0,
  229.             "end":"31\/08"
  230.          },
  231.          "regexType":"custom"
  232.       },
  233.       {
  234.          "regex":[
  235.             "\\b(thu|autumn)\\b"
  236.          ],
  237.          "regexInfo":{
  238.             "start":"01\/08",
  239.             "calendarType":0,
  240.             "end":"30\/11"
  241.          },
  242.          "regexType":"custom"
  243.       },
  244.       {
  245.          "regex":[
  246.             "\\b(đông|winter)\\b"
  247.          ],
  248.          "regexInfo":{
  249.             "start":"01\/11",
  250.             "calendarType":0,
  251.             "end":"31\/01"
  252.          },
  253.          "regexType":"custom"
  254.       }
  255.    ],
  256.    "mappingRules": {
  257.       "chu nhat":1,
  258.       "cn":1,
  259.       "thu hai":2,
  260.       "t2":2,
  261.       "thu 2":2,
  262.       "t3":3,
  263.       "thu 3":3,
  264.       "thu ba":3,
  265.       "t4":4,
  266.       "thu 4":4,
  267.       "thu tu":4,
  268.       "thu nam":5,
  269.       "t5":5,
  270.       "thu 5":5,
  271.       "thu sau":6,
  272.       "t6":6,
  273.       "thu 6":6,
  274.       "thu bay":7,
  275.       "t7":7,
  276.       "thu 7":7,
  277.       "nay":101,
  278.       "hom nay":101,
  279.       "ngay mai":102,
  280.       "mai":102,
  281.       "ngay mot":103,
  282.       "ngay kia":103,
  283.       "hom no":104,
  284.       "hom truoc":104,
  285.       "hom qua":104,
  286.       "hom kia":104,
  287.       "cuoi tuan":105,
  288.       "weekend":105,
  289.       "dau tuan":107,
  290.       "tuan nay":108,
  291.       "this week":108,
  292.       "tuan truoc":109,
  293.       "last week":109,
  294.       "tuan sau":110,
  295.       "tuan toi":110,
  296.       "jan":301,
  297.       "thang 1":301,
  298.       "1":301,
  299.       "january":301,
  300.       "feb":302,
  301.       "thang 2":302,
  302.       "2":302,
  303.       "february":302,
  304.       "thang 3":303,
  305.       "3":303,
  306.       "mar":303,
  307.       "march":303,
  308.       "april":304,
  309.       "apr":304,
  310.       "thang 4":304,
  311.       "4":304,
  312.       "thang 5":305,
  313.       "5":305,
  314.       "may":305,
  315.       "thang 6":306,
  316.       "6":306,
  317.       "june":306,
  318.       "thang 7":307,
  319.       "july":307,
  320.       "7":307,
  321.       "august":308,
  322.       "thang 8":308,
  323.       "aug":308,
  324.       "8":308,
  325.       "thang 9":309,
  326.       "9":309,
  327.       "september":309,
  328.       "sept":309,
  329.       "10":310,
  330.       "oct":310,
  331.       "october":310,
  332.       "thang 10":310,
  333.       "november":311,
  334.       "11":311,
  335.       "thang 11":311,
  336.       "nov":311,
  337.       "dec":312,
  338.       "12":312,
  339.       "thang 12":312,
  340.       "december":312,
  341.       "sang":400,
  342.       "trua":401,
  343.       "chieu":402,
  344.       "toi":403,
  345.       "dem":404,
  346.       "nam nay":501,
  347.       "this year":501,
  348.       "last year":502,
  349.       "nam ngoai":502
  350.    },
  351.    "includeRules": [
  352.       "\\b(nhé|nhá|nha|nghen|nghe|nhớ|nhắc|giúp|họp|nhậu|đi|chơi|cafe|cà phê|gặp|ăn|trà sữa|uống|tham dự|tổ chức|tập trung|có mặt|chốt|phải|báo|nốt|có gì|sang|xuống|lên|gọi|làm|về|khám|nộp|kiểm|chuyển|giao|rước|lấy|giữ|đón|thi|tiêm|thăm|về|trả|gửi|liên hệ|dọn|nhận|đóng|trực|ký|thêm|xóa|sửa|mua|bán|ghé|giải|nói|học|mang cho)\\b"
  353.    ]
  354. }
RAW Paste Data
We use cookies for various purposes including analytics. By continuing to use Pastebin, you agree to our use of cookies as described in the Cookies Policy. OK, I Understand
Not a member of Pastebin yet?
Sign Up, it unlocks many cool features!
 
Top