Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- 3kshjfsdhf9834r
- Henry11
- 34r9jsadfsdf
- Jackson33
- 3d2d32ddffjkj
- Alex
- Henry11
- Jackson33
- Alex
- import re
- PATTERN = re.compile('[bcdfghjklmnpqrstvwxz]{4,}', flags=re.I)
- words = ['3kshjfsdhf9834r', 'Henry11', '34r9jsadfsdf', 'Jackson33', '3d2d32ddffjkj', 'Alex']
- print(words)
- new_words = [word for word in words if not PATTERN.search(word)]
- print(new_words) # ['Henry11', 'Jackson33', 'Alex']
- Для каждой строки в файле:
- Для каждой подряд идущей комбинации букв в строке:
- #(word) -> (w, wo, wor, word, o, or, ord, rd, r, rd, d)
- Чекаем являться ли эта комбинция именем(через списки имен или либой https://pypi.org/project/nameparser/ например)
Add Comment
Please, Sign In to add comment