Advertisement
Guest User

tutowebscrapping

a guest
May 27th, 2018
92
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 2.07 KB | None | 0 0
  1. import requests
  2. from bs4 import *
  3.  
  4. #########le monde######
  5. print("Le Monde:")
  6. urlMonde = "https://www.lemonde.fr//" #url du figaro
  7. page = requests.get(urlMonde) #on va sur la page en envoyant une requete
  8. codeSource = page.text #on recupere le code source de la page
  9. soup = BeautifulSoup(codeSource, "lxml")
  10.  
  11. baliseTitre = soup.find("h1", attrs={"class":u"tt3"}) #on a la balise du titre
  12. print(baliseTitre.getText())
  13.  
  14. baliseDescription = soup.find("p", attrs={"class":u"description"}) #on a la balise du resume
  15. print(baliseDescription.getText())
  16.  
  17. #########le figaro######
  18. print("Le Figaro")
  19. urlFigaro = "http://www.lefigaro.fr/" #url du figaro
  20. page = requests.get(urlFigaro) #on va sur la page en envoyant une requete
  21. codeSource = page.text #on recupere le code source de la page
  22. soup = BeautifulSoup(codeSource, "lxml")
  23.  
  24. #on doit trouver l'artcile le plus populaires, dans la première balise <span class="fig-toparticles__item-title-inner">
  25.  
  26. balises = soup.find_all("span", attrs={"class":u"fig-toparticles__item-title-inner"}) #on a toutes les balises
  27. print(balises[0].getText()) #contenu de la première balise.
  28.  
  29. #########meteo######
  30. print("Météo")
  31. urlMeteo = "http://france.lachainemeteo.com/meteo-france/ville/previsions-meteo-orleans-3846-0.php" #url
  32. page = requests.get(urlMeteo) #on va sur la page en envoyant une requete
  33. codeSource = page.text #on recupere le code source de la page
  34. soup = BeautifulSoup(codeSource, "html.parser")
  35.  
  36. balisePeriode = soup.find_all("div", attrs={"class":u"nom_quart_jour"}) #les 3 quarts temps affiches
  37. baliseTemperature = soup.find_all("div", attrs={"class":u"tempe"}) #les températures (17, 18, 19)
  38. situation_phrase_ciel = soup.find_all("span", attrs={"class":u"phrase_ciel"}) #3 balises de résumé
  39. situation_phrase_precip = soup.find_all("span", attrs={"class":u"phrase_precip"}) #3 autres balises de résumé
  40.  
  41. i = 0
  42. for periode in balisePeriode:
  43.     print(periode.getText())
  44.     print(baliseTemperature[i+16].getText())
  45.     print(situation_phrase_ciel[i].getText())
  46.     print(situation_phrase_precip[i].getText())
  47.     i += 1
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement