Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- import requests
- import time
- from bs4 import BeautifulSoup
- def http_post(url,buscar_livro):
- payload={
- 'palavra': buscar_livro,
- 'enviar': 'Buscar'
- }
- try:
- return requests.post(url,data=payload)
- except (requests.exceptions.HTTPError, requests.exceptions.RequestException,requests.exceptions.ConnectionError,requests.exceptions.Timeout) as e:
- print(str(e))
- pass
- except Exception as e:
- raise "Algo pode ter dado errado!"
- return none
- def parse_html(content):
- soup = BeautifulSoup(content,'lxml')
- produtos = soup.find_all('table')[10].find_all('td')
- lista_produtos = []
- url = "https://novatec.com.br/"
- url_capa = ''
- url_produto = ' '
- for produto in produtos:
- tag_a = produto.find('a')
- if tag_a:
- if tag_a.next_element.nextelement.img.name == 'img':
- url_capa = '{0}{1}'.format(url,tag_a.img.get)
- for string in produto.stripped_strings:
- if(string =='Esgostado'):
- continue
- lista_produtos.append(string)
- with open('produtos.html','w') as prod:
- prod.write(str(lista_produtos))
- '''
- f = open('td.html','w',encoding='utf-8')
- for produto in produtos:
- f.write(str(produto))
- f.write('\n\n\n')
- f.close()
- '''
- if __name__ == '__main__':
- url = "https://novatec.com.br/busca.php"
- buscar_livro = "Php "
- r = http_post(url,buscar_livro)
- if r:
- parse_html(r.text)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement