Advertisement
Guest User

Untitled

a guest
Dec 8th, 2019
279
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 6.28 KB | None | 0 0
  1. 1.За допомогою регулярного виразу написати програму, що шукає в тексті усі посилання, видаляє теги та залишає тільки назви
  2. #!/usr/bin/env python
  3. # coding: utf-8
  4.  
  5. import codecs
  6. import re
  7.  
  8. with codecs.open("tags.txt", encoding = "utf-8") as data:
  9. text = data.read()
  10. filtered = re.sub(r'<a(.*?)://(.*?)>(.*?)</a>', r'\3', text)
  11. newFile = open("tags_filtered.txt", "w+")
  12. newFile.write(filtered)
  13.  
  14. 2.За допомогою регулярного виразу написати програму, що шукає в тексті усі заголовки (h1-h6), видаляє теги та залишає тільки назви заголовків
  15. #!/usr/bin/env python
  16. # coding: utf-8
  17.  
  18. import codecs
  19. import re
  20.  
  21. with codecs.open("headers.txt", encoding = "utf-8") as data:
  22. text = data.read()
  23. filtered = re.sub(r'<h[1-6]>(.*?)</h[1-6]>', r'\1', text)
  24. newFile = open("headers_filtered.txt", "w+")
  25. newFile.write(filtered)
  26.  
  27. 3.За допомогою регулярного виразу написати програму, що шукає в тексті усі абзаци, видаляє теги та залишає тільки текст
  28. #!/usr/bin/env python
  29. # coding: utf-8
  30.  
  31. import codecs
  32. import re
  33.  
  34. with codecs.open("paragraphs.txt", encoding = "utf-8") as data:
  35. text = data.read()
  36. filtered = re.sub(r'<p>(.*?)<p>', r'\1', text)
  37. newFile = open("paragraphs_filtered.txt", "w+")
  38. newFile.write(filtered)
  39.  
  40. 4.За допомогою регулярного виразу написати програму, що шукає в тексті усі картинки, видаляє їх та залишає їх підписи
  41. #!/usr/bin/env python
  42. # coding: utf-8
  43.  
  44. import codecs
  45. import re
  46.  
  47. with codecs.open("images.txt", encoding = "utf-8") as data:
  48. text = data.read()
  49. filtered = re.sub(r"<img\ssrc(.*?)://(.*?)='(.*?)'>", r'\3', text)
  50. newFile = open("images_filtered.txt", "w+")
  51. newFile.write(filtered)
  52.  
  53. 5.За допомогою регулярного виразу написати програму, що видаляє в тексті усі коментарі <!-- Appl -->
  54. #!/usr/bin/env python
  55. # coding: utf-8
  56.  
  57. import codecs
  58. import re
  59.  
  60. with codecs.open("comments.txt", encoding = "utf-8") as data:
  61. text = data.read()
  62. filtered = re.sub(r"<\!--(.*?)-->", '', text)
  63. newFile = open("comments_filtered.txt", "w+")
  64. newFile.write(filtered)
  65.  
  66. 6.За допомогою регулярного виразу написати програму, що шукає в тексті усі роки життя та видаляє їх
  67. #!/usr/bin/env python
  68. # coding: utf-8
  69.  
  70. import codecs
  71. import re
  72.  
  73. with codecs.open("age.txt", encoding = "utf-8") as data:
  74. text = data.read()
  75.  
  76. filtered = re.sub("\(\d{4}\-\d{4}\)|\(\d{4}\s\-\s\d{4}\)", "", text)
  77. filtered = re.sub("\s\,",",",filtered)
  78.  
  79. newFile = open("age_filtered.txt", "w+")
  80. newFile.write(filtered)
  81.  
  82. 7.За допомогою регулярного виразу написати програму, що шукає в тексті усі дати у форматі 2016-11-23 та замінює їх на формат 23.11.16
  83. #!/usr/bin/env python
  84. # coding: utf-8
  85.  
  86. import codecs
  87. import re
  88.  
  89. with codecs.open ("age_dots.txt", encoding = "utf-8") as data:
  90. text = data.read()
  91. filtered = re.sub(r"((\d{4})\-(0[1-9]|1[0-2])\-(0[1-9]|1[0-9]|2[0-8])|(\d{4})\-(01|0[3-9]|1[0-2])\-29|(\d{4})\-(01|02[3-9]|1[0-2])\-30|(\d{4})\-(0[1,3,5,7,8]|1[0,2])\-31)", r"\4.\3.\2", text)
  92.  
  93. newFile = open("age_dots_filtered.txt", "w+")
  94. newFile.write(filtered)
  95.  
  96. 8.За допомогою регулярного виразу написати програму, що шукає в тексті усі власні назви (послідовність кількох слів, що починається з великої літери), та виводить в файл список цих назв через кому
  97. import re
  98.  
  99. with open("proper_names.txt") as data:
  100. text = data.read()
  101. filtered = re.findall("[A-Z][a-z]+\s[A-Z][a-z]+", text)
  102. string = ""
  103. newFile = open("proper_names_filtered.txt", "w+")
  104. for x in filtered:
  105. string = string +x +", "
  106. newFile.write(string)
  107.  
  108. 9.За допомогою регулярного виразу написати програму, що шукає в тексті усі таблиці та прибирає їх
  109. #!/usr/bin/env python
  110. # coding: utf-8
  111.  
  112. import codecs
  113. import re
  114.  
  115. with codecs.open("tables.txt", encoding = "utf-8") as data:
  116. text = data.read()
  117. filtered = re.sub("\<table\>(.*?)\<\/table\>","", text)
  118. filtered = re.sub("\s\s", " ", filtered)
  119.  
  120. newFile = open("tables_filtered.txt", "w+")
  121. newFile.write(filtered)
  122.  
  123. 10.За допомогою регулярного виразу написати програму, що шукає в тексті усі вирази у круглих дужках та прибирає їх
  124. #!/usr/bin/env python
  125. # coding: utf-8
  126.  
  127. import codecs
  128. import re
  129.  
  130. with codecs.open("brackets.txt", encoding = "utf-8") as data:
  131. text = data.read()
  132.  
  133. filtered = re.sub(r"\(.*?\)","", text)
  134. output = re.sub(r"\s\!","!", filtered)
  135. output = re.sub(r"\s\?","?", output)
  136. output = re.sub(r"\s\,",",", output)
  137. output = re.sub(r"\s\.",".", output)
  138.  
  139. newFile = open("brackets_filtered.txt", "w+")
  140. newFile.write(output)
  141.  
  142. 11.
  143. #!/usr/bin/env python
  144. # coding: utf-8
  145. import codecs
  146. import re
  147.  
  148. def openFile(text):
  149. newFile = open("1.txt", "w+")
  150. newFile.write(text)
  151. newFile.close()
  152.  
  153. def valueCheck(variable):
  154. while True:
  155. try:
  156. value = int(variable)
  157. variable = input("Неправильні дані, введіть ще раз:")
  158. except ValueError:
  159. pass
  160. break
  161. return variable
  162.  
  163. text = "Мене звуть. Я навчаюсь в."
  164. openFile(text)
  165.  
  166. name = input("Введіть ваше ім'я:")
  167. valueCheck(name)
  168. print("Ваше ім'я - "+name)
  169. univ = input("Введіть установу, де ви навчаєтесь:")
  170. valueCheck(univ)
  171. print("Ваша освітня установа - "+univ)
  172.  
  173. with codecs.open("1.txt") as file:
  174. data = file.read()
  175. filtered = re.sub("ь\.","ь "+name+".", data)
  176. filtered = re.sub("в\.","в "+univ+".", filtered)
  177.  
  178. openFile(filtered)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement