Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- cyrLetters = [u"А", u"Б", u"В", u"Г", u"Д", u"Ђ", u"Е", u"Ж", u"З", u"И", u"Ј", u"К", u"Л", u"Љ", u"М",
- u"Н", u"Њ", u"О", u"П", u"Р", u"С", u"Т", u"Ћ", u"У", u"Ф", u"Х", u"Ц", u"Ч", u"Џ", u"Ш",
- u"а", u"б", u"в", u"г", u"д", u"ђ", u"е", u"ж", u"з", u"и", u"ј", u"к", u"л", u"љ", u"м",
- u"н", u"њ", u"о", u"п", u"р", u"с", u"т", u"ћ", u"у", u"ф", u"х", u"ц", u"ч", u"џ", u"ш"]
- latLetters = [u"A", u"B", u"V", u"G", u"D", u"Đ", u"E", u"Ž", u"Z", u"I", u"J", u"K", u"L", u"LJ", u"M",
- u"N", u"NJ", u"O", u"P", u"R", u"S", u"T", u"Ć", u"U", u"F", u"H", u"C", u"Č", u"DŽ", u"Š",
- u"a", u"b", u"v", u"g", u"d", u"đ", u"e", u"ž", u"z", u"i", u"j", u"k", u"l", u"lj", u"m",
- u"n", u"nj", u"o", u"p", u"r", u"s", u"t", u"ć", u"u", u"f", u"h", u"c", u"č", u"dž", u"š"]
- def fixMixedCyrLatWord(match):
- word = match.group()
- latToCyr = zip(latLetters, cyrLetters)
- cyrToLat = zip(cyrLetters, latLetters)
- originScript = 'l'
- if originScript == 'c':
- letterMap = dict(zip(cyrLetters, latLetters))
- elif originScript == 'l':
- letterMap = dict(zip(latLetters, cyrLetters))
- else:
- raise Exception("Unexpected script: " + originScript)
- newWord = ""
- for c in word:
- newWord += letterMap.get(c, c)
- return newWord
- fixes['mixedWords']= {
- 'regex': True,
- 'msg': {
- 'sr':u'Порука...',
- },
- 'replacements': [
- (u"[А-Ша-шЈјЊњЏџЂђ]+[A-Za-zĐđŽžĆćČ芚].*", fixMixedCyrLatWord),
- (u"[A-Za-zĐđŽžĆćČ芚]+[А-Ша-шЈјЊњЏџЂђ].*", fixMixedCyrLatWord),
- ],
- 'exceptions': { #Your exceptions here
- }
- }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement