Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- 1.За допомогою регулярного виразу написати програму, що шукає в тексті усі посилання, видаляє теги та залишає тільки назви
- #!/usr/bin/env python
- # coding: utf-8
- import codecs
- import re
- with codecs.open("tags.txt", encoding = "utf-8") as data:
- text = data.read()
- filtered = re.sub(r'<a(.*?)://(.*?)>(.*?)</a>', r'\3', text)
- newFile = open("tags_filtered.txt", "w+")
- newFile.write(filtered)
- 2.За допомогою регулярного виразу написати програму, що шукає в тексті усі заголовки (h1-h6), видаляє теги та залишає тільки назви заголовків
- #!/usr/bin/env python
- # coding: utf-8
- import codecs
- import re
- with codecs.open("headers.txt", encoding = "utf-8") as data:
- text = data.read()
- filtered = re.sub(r'<h[1-6]>(.*?)</h[1-6]>', r'\1', text)
- newFile = open("headers_filtered.txt", "w+")
- newFile.write(filtered)
- 3.За допомогою регулярного виразу написати програму, що шукає в тексті усі абзаци, видаляє теги та залишає тільки текст
- #!/usr/bin/env python
- # coding: utf-8
- import codecs
- import re
- with codecs.open("paragraphs.txt", encoding = "utf-8") as data:
- text = data.read()
- filtered = re.sub(r'<p>(.*?)<p>', r'\1', text)
- newFile = open("paragraphs_filtered.txt", "w+")
- newFile.write(filtered)
- 4.За допомогою регулярного виразу написати програму, що шукає в тексті усі картинки, видаляє їх та залишає їх підписи
- #!/usr/bin/env python
- # coding: utf-8
- import codecs
- import re
- with codecs.open("images.txt", encoding = "utf-8") as data:
- text = data.read()
- filtered = re.sub(r"<img\ssrc(.*?)://(.*?)='(.*?)'>", r'\3', text)
- newFile = open("images_filtered.txt", "w+")
- newFile.write(filtered)
- 5.За допомогою регулярного виразу написати програму, що видаляє в тексті усі коментарі <!-- Appl -->
- #!/usr/bin/env python
- # coding: utf-8
- import codecs
- import re
- with codecs.open("comments.txt", encoding = "utf-8") as data:
- text = data.read()
- filtered = re.sub(r"<\!--(.*?)-->", '', text)
- newFile = open("comments_filtered.txt", "w+")
- newFile.write(filtered)
- 6.За допомогою регулярного виразу написати програму, що шукає в тексті усі роки життя та видаляє їх
- #!/usr/bin/env python
- # coding: utf-8
- import codecs
- import re
- with codecs.open("age.txt", encoding = "utf-8") as data:
- text = data.read()
- filtered = re.sub("\(\d{4}\-\d{4}\)|\(\d{4}\s\-\s\d{4}\)", "", text)
- filtered = re.sub("\s\,",",",filtered)
- newFile = open("age_filtered.txt", "w+")
- newFile.write(filtered)
- 7.За допомогою регулярного виразу написати програму, що шукає в тексті усі дати у форматі 2016-11-23 та замінює їх на формат 23.11.16
- #!/usr/bin/env python
- # coding: utf-8
- import codecs
- import re
- with codecs.open ("age_dots.txt", encoding = "utf-8") as data:
- text = data.read()
- filtered = re.sub(r"((\d{4})\-(0[1-9]|1[0-2])\-(0[1-9]|1[0-9]|2[0-8])|(\d{4})\-(01|0[3-9]|1[0-2])\-29|(\d{4})\-(01|02[3-9]|1[0-2])\-30|(\d{4})\-(0[1,3,5,7,8]|1[0,2])\-31)", r"\4.\3.\2", text)
- newFile = open("age_dots_filtered.txt", "w+")
- newFile.write(filtered)
- 8.За допомогою регулярного виразу написати програму, що шукає в тексті усі власні назви (послідовність кількох слів, що починається з великої літери), та виводить в файл список цих назв через кому
- import re
- with open("proper_names.txt") as data:
- text = data.read()
- filtered = re.findall("[A-Z][a-z]+\s[A-Z][a-z]+", text)
- string = ""
- newFile = open("proper_names_filtered.txt", "w+")
- for x in filtered:
- string = string +x +", "
- newFile.write(string)
- 9.За допомогою регулярного виразу написати програму, що шукає в тексті усі таблиці та прибирає їх
- #!/usr/bin/env python
- # coding: utf-8
- import codecs
- import re
- with codecs.open("tables.txt", encoding = "utf-8") as data:
- text = data.read()
- filtered = re.sub("\<table\>(.*?)\<\/table\>","", text)
- filtered = re.sub("\s\s", " ", filtered)
- newFile = open("tables_filtered.txt", "w+")
- newFile.write(filtered)
- 10.За допомогою регулярного виразу написати програму, що шукає в тексті усі вирази у круглих дужках та прибирає їх
- #!/usr/bin/env python
- # coding: utf-8
- import codecs
- import re
- with codecs.open("brackets.txt", encoding = "utf-8") as data:
- text = data.read()
- filtered = re.sub(r"\(.*?\)","", text)
- output = re.sub(r"\s\!","!", filtered)
- output = re.sub(r"\s\?","?", output)
- output = re.sub(r"\s\,",",", output)
- output = re.sub(r"\s\.",".", output)
- newFile = open("brackets_filtered.txt", "w+")
- newFile.write(output)
- 11.
- #!/usr/bin/env python
- # coding: utf-8
- import codecs
- import re
- def openFile(text):
- newFile = open("1.txt", "w+")
- newFile.write(text)
- newFile.close()
- def valueCheck(variable):
- while True:
- try:
- value = int(variable)
- variable = input("Неправильні дані, введіть ще раз:")
- except ValueError:
- pass
- break
- return variable
- text = "Мене звуть. Я навчаюсь в."
- openFile(text)
- name = input("Введіть ваше ім'я:")
- valueCheck(name)
- print("Ваше ім'я - "+name)
- univ = input("Введіть установу, де ви навчаєтесь:")
- valueCheck(univ)
- print("Ваша освітня установа - "+univ)
- with codecs.open("1.txt") as file:
- data = file.read()
- filtered = re.sub("ь\.","ь "+name+".", data)
- filtered = re.sub("в\.","в "+univ+".", filtered)
- openFile(filtered)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement