Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- import csv
- import urllib.request
- from bs4 import BeautifulSoup
- BASE_URL = 'http://okna-mtk.ru/stati/'
- def get_html(url):
- response = urllib.request.urlopen(url)
- return response.read()
- def parse(html):
- soup = BeautifulSoup(html, features='html.parser') #1 работает РЕЗУЛЬТАТ ПАРСИНГА - СПИСОК []
- table = soup.find('div', id='dle-content') #1 работает
- projects = []
- for row in table.find_all('a', rel='bookmark'): #1 работает
- list_row = list(row)
- print(list_row)
- for row in table.find_all('a', rel='bookmark'):
- if row.has_attr('href'):
- ## link_ = row.get('href')
- link_ = list(row.get('href'))
- print(link_)
- def main():
- parse(get_html(BASE_URL))
- if __name__ == '__main__':
- main()
- ## resalt
- ## ['Зимний режим пластиковых окон, настройка фурнитуры']
- ##['Ремонт окон ПВХ в Москве']
- ##['Ремонт окон любой сложности в Москве']
- ##['Качественный ремонт окон по всей Москве']
- ##['Ремонт окон на выгодных условиях!']
- ##['Ремонт современных окон в Москве']
- ##['Ремонт окон в Москве']
- ##['Ремонт пластиковых окон в Москве']
- ##['Ремонт окон ПВХ в Москве']
- ##['Ремонт пластиковых окон зимой']
- ##['h', 't', 't', 'p', ':', '/', '/', 'o', 'k', 'n', 'a', '-', 'm', 't', 'k', '.', 'r', 'u', '/', 's', 't', 'a', 't', 'i', '/', '1', '3', '8', '-', 'z', 'i', 'm', 'n', 'i', 'y', '-', 'r', 'e', 'z', 'h', 'i', 'm', '-', 'p', 'l', 'a', 's', 't', 'i', 'k', 'o', 'v', 'y', 'h', '-', 'o', 'k', 'o', 'n', '-', 'n', 'a', 's', 't', 'r', 'o', 'y', 'k', 'a', '-', 'f', 'u', 'r', 'n', 'i', 't', 'u', 'r', 'y', '.', 'h', 't', 'm', 'l']
- ##['h', 't', 't', 'p', ':', '/', '/', 'o', 'k', 'n', 'a', '-', 'm', 't', 'k', '.', 'r', 'u', '/', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '/', '1', '3', '4', '-', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '-', 'p', 'v', 'h', '-', 'v', '-', 'm', 'o', 's', 'k', 'v', 'e', '.', 'h', 't', 'm', 'l']
- ##['h', 't', 't', 'p', ':', '/', '/', 'o', 'k', 'n', 'a', '-', 'm', 't', 'k', '.', 'r', 'u', '/', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '/', '1', '3', '3', '-', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '-', 'l', 'y', 'u', 'b', 'o', 'y', '-', 's', 'l', 'o', 'z', 'h', 'n', 'o', 's', 't', 'i', '-', 'v', '-', 'm', 'o', 's', 'k', 'v', 'e', '.', 'h', 't', 'm', 'l']
- ##['h', 't', 't', 'p', ':', '/', '/', 'o', 'k', 'n', 'a', '-', 'm', 't', 'k', '.', 'r', 'u', '/', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '/', '1', '3', '2', '-', 'k', 'a', 'c', 'h', 'e', 's', 't', 'v', 'e', 'n', 'n', 'y', 'y', '-', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '-', 'p', 'o', '-', 'v', 's', 'e', 'y', '-', 'm', 'o', 's', 'k', 'v', 'e', '.', 'h', 't', 'm', 'l']
- ##['h', 't', 't', 'p', ':', '/', '/', 'o', 'k', 'n', 'a', '-', 'm', 't', 'k', '.', 'r', 'u', '/', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '/', '1', '3', '1', '-', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '-', 'n', 'a', '-', 'v', 'y', 'g', 'o', 'd', 'n', 'y', 'h', '-', 'u', 's', 'l', 'o', 'v', 'i', 'y', 'a', 'h', '.', 'h', 't', 'm', 'l']
- ##['h', 't', 't', 'p', ':', '/', '/', 'o', 'k', 'n', 'a', '-', 'm', 't', 'k', '.', 'r', 'u', '/', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '/', '1', '3', '0', '-', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '-', 'v', '-', 'm', 'o', 's', 'k', 'v', 'e', '.', 'h', 't', 'm', 'l']
- ##['h', 't', 't', 'p', ':', '/', '/', 'o', 'k', 'n', 'a', '-', 'm', 't', 'k', '.', 'r', 'u', '/', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '/', '1', '2', '9', '-', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '-', 'v', '-', 'm', 'o', 's', 'k', 'v', 'e', '.', 'h', 't', 'm', 'l']
- ##['h', 't', 't', 'p', ':', '/', '/', 'o', 'k', 'n', 'a', '-', 'm', 't', 'k', '.', 'r', 'u', '/', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '/', '1', '2', '8', '-', 'r', 'e', 'm', 'o', 'n', 't', '-', 'p', 'l', 'a', 's', 't', 'i', 'k', 'o', 'v', 'y', 'h', '-', 'o', 'k', 'o', 'n', '-', 'v', '-', 'm', 'o', 's', 'k', 'v', 'e', '.', 'h', 't', 'm', 'l']
- ##['h', 't', 't', 'p', ':', '/', '/', 'o', 'k', 'n', 'a', '-', 'm', 't', 'k', '.', 'r', 'u', '/', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '/', '1', '2', '7', '-', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '-', 'p', 'v', 'h', '-', 'v', '-', 'm', 'o', 's', 'k', 'v', 'e', '.', 'h', 't', 'm', 'l']
- ##['h', 't', 't', 'p', ':', '/', '/', 'o', 'k', 'n', 'a', '-', 'm', 't', 'k', '.', 'r', 'u', '/', 'r', 'e', 'm', 'o', 'n', 't', '-', 'o', 'k', 'o', 'n', '/', '1', '2', '6', '-', 'r', 'e', 'm', 'o', 'n', 't', '-', 'p', 'l', 'a', 's', 't', 'i', 'k', 'o', 'v', 'y', 'h', '-', 'o', 'k', 'o', 'n', '-', 'z', 'i', 'm', 'o', 'y', '.', 'h', 't', 'm', 'l']
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement