Advertisement
cecca

regex_nomi

Aug 17th, 2011
62
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Bash 0.65 KB | None
  1. (                           # gruppo 1 
  2.     (?: [A-Z][A-Za-z]+ \s )*            # le capitalized che precedono quelle non volute
  3.     (?:                         # le parole non volute
  4.         Signor | SIGNOR |
  5.         Notaio | NOTAIO |
  6.         Dottor(?:essa)? | DOTTOR(?:essa)? |
  7.         Dott\.ssa | DOTT\.SSA |
  8.         Io
  9.     ) \s
  10. )*                          # il gruppo 1 è opzionale
  11. (                           # gruppo 2 : solo questo diventerà il candidato
  12.         (?:  [A-Z][a-z]+  |  [A-Z]+   )         # la prima parola capitalized
  13.         (?:                         # le altre parole capitalized,
  14.         \s (?: \w\' )?              # eventualmente precedute
  15.                 (?:  [A-Z][a-z]+  |  [A-Z]+  )      # ognuna da un " D' " ad esempio
  16.     )*                      # come "D'Artagnan"
  17. )                           # il gruppo 2 non è opzionale
Advertisement
RAW Paste Data Copied
Advertisement