Untitled

1.За допомогою регулярного виразу написати програму, що шукає в тексті усі посилання, видаляє теги та залишає тільки назви
#!/usr/bin/env python
# coding: utf-8

import codecs
import re

with codecs.open("tags.txt", encoding = "utf-8") as data:
    text = data.read()
filtered = re.sub(r'<a(.*?)://(.*?)>(.*?)</a>', r'\3', text)
newFile = open("tags_filtered.txt", "w+")
newFile.write(filtered)

2.За допомогою регулярного виразу написати програму, що шукає в тексті усі заголовки (h1-h6), видаляє теги та залишає тільки назви заголовків
#!/usr/bin/env python
# coding: utf-8

import codecs
import re

with codecs.open("headers.txt", encoding = "utf-8") as data:
    text = data.read()
filtered = re.sub(r'<h[1-6]>(.*?)</h[1-6]>', r'\1', text)
newFile = open("headers_filtered.txt", "w+")
newFile.write(filtered)

3.За допомогою регулярного виразу написати програму, що шукає в тексті усі абзаци, видаляє теги та залишає тільки текст
#!/usr/bin/env python
# coding: utf-8

import codecs
import re

with codecs.open("paragraphs.txt", encoding = "utf-8") as data:
    text = data.read()
filtered = re.sub(r'<p>(.*?)<p>', r'\1', text)
newFile = open("paragraphs_filtered.txt", "w+")
newFile.write(filtered)

4.За допомогою регулярного виразу написати програму, що шукає в тексті усі картинки, видаляє їх та залишає їх підписи
#!/usr/bin/env python
# coding: utf-8

import codecs
import re

with codecs.open("images.txt", encoding = "utf-8") as data:
    text = data.read()
filtered = re.sub(r"<img\ssrc(.*?)://(.*?)='(.*?)'>", r'\3', text)
newFile = open("images_filtered.txt", "w+")
newFile.write(filtered)

5.За допомогою регулярного виразу написати програму, що видаляє в тексті усі коментарі <!-- Appl -->
#!/usr/bin/env python
# coding: utf-8

import codecs
import re

with codecs.open("comments.txt", encoding = "utf-8") as data:
    text = data.read()
filtered = re.sub(r"<\!--(.*?)-->", '', text)
newFile = open("comments_filtered.txt", "w+")
newFile.write(filtered)

6.За допомогою регулярного виразу написати програму, що шукає в тексті усі роки життя та видаляє їх
#!/usr/bin/env python
# coding: utf-8

import codecs
import re

with codecs.open("age.txt", encoding = "utf-8") as data:
    text = data.read()

filtered = re.sub("\(\d{4}\-\d{4}\)|\(\d{4}\s\-\s\d{4}\)", "", text)
filtered = re.sub("\s\,",",",filtered)

newFile = open("age_filtered.txt", "w+")
newFile.write(filtered)

7.За допомогою регулярного виразу написати програму, що шукає в тексті усі дати у форматі 2016-11-23 та замінює їх на формат 23.11.16
#!/usr/bin/env python
# coding: utf-8

import codecs
import re

with codecs.open ("age_dots.txt", encoding = "utf-8") as data:
	text = data.read()
filtered = re.sub(r"((\d{4})\-(0[1-9]|1[0-2])\-(0[1-9]|1[0-9]|2[0-8])|(\d{4})\-(01|0[3-9]|1[0-2])\-29|(\d{4})\-(01|02[3-9]|1[0-2])\-30|(\d{4})\-(0[1,3,5,7,8]|1[0,2])\-31)", r"\4.\3.\2", text)

newFile = open("age_dots_filtered.txt", "w+")
newFile.write(filtered)

8.За допомогою регулярного виразу написати програму, що шукає в тексті усі власні назви (послідовність кількох слів, що починається з великої літери), та виводить в файл список цих назв через кому
import re

with open("proper_names.txt") as data:
    text = data.read()
filtered = re.findall("[A-Z][a-z]+\s[A-Z][a-z]+", text)
string = ""
newFile = open("proper_names_filtered.txt", "w+")
for x in filtered:
    string = string +x +", "
newFile.write(string)

9.За допомогою регулярного виразу написати програму, що шукає в тексті усі таблиці та прибирає їх
#!/usr/bin/env python
# coding: utf-8

import codecs
import re

with codecs.open("tables.txt", encoding = "utf-8") as data:
    text = data.read()
filtered = re.sub("\<table\>(.*?)\<\/table\>","", text)
filtered = re.sub("\s\s", " ", filtered)

newFile = open("tables_filtered.txt", "w+")
newFile.write(filtered)

10.За допомогою регулярного виразу написати програму, що шукає в тексті усі вирази у круглих дужках та прибирає їх
#!/usr/bin/env python
# coding: utf-8

import codecs
import re

with codecs.open("brackets.txt", encoding = "utf-8") as data:
    text = data.read()

filtered = re.sub(r"\(.*?\)","", text)
output = re.sub(r"\s\!","!", filtered)
output = re.sub(r"\s\?","?", output)
output = re.sub(r"\s\,",",", output)
output = re.sub(r"\s\.",".", output)

newFile = open("brackets_filtered.txt", "w+")
newFile.write(output)

11.
#!/usr/bin/env python
# coding: utf-8
import codecs
import re

def openFile(text):
    newFile = open("1.txt", "w+")
    newFile.write(text)
    newFile.close()

def valueCheck(variable):
    while True:
        try:
            value = int(variable)
            variable = input("Неправильні дані, введіть ще раз:")
        except ValueError:
            pass
            break
    return variable

text = "Мене звуть. Я навчаюсь в."
openFile(text)

name = input("Введіть ваше ім'я:")
valueCheck(name)
print("Ваше ім'я - "+name)
univ = input("Введіть установу, де ви навчаєтесь:")
valueCheck(univ)
print("Ваша освітня установа - "+univ)

with codecs.open("1.txt") as file:
    data = file.read()
filtered = re.sub("ь\.","ь "+name+".", data)
filtered = re.sub("в\.","в "+univ+".", filtered)

openFile(filtered)