Advertisement
Guest User

Siguiente 6)

a guest
Nov 1st, 2017
91
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 1.87 KB | None | 0 0
  1. import praw
  2. import time
  3.  
  4. from xml.etree.ElementTree import Element, SubElement, ElementTree
  5.  
  6.  
  7. #Creo una instancia de Reddit
  8. reddit = praw.Reddit(client_id='kgNcJc52YxrqhQ', client_secret="GGV2z1gXvScnRsC5slcPMpxmFKY",
  9.                      password='Correplatano!23', user_agent='script:testsscript:v0.1 by /u/cuakcuak8',
  10.                      username='cuakcuak8')
  11.  
  12. from pprint import pprint
  13. pprint(vars(reddit))
  14.  
  15.  
  16. subreddit = reddit.subreddit('history')
  17.  
  18. top = Element('new')
  19. numDocs=0
  20. for submission in subreddit.top(limit=200):
  21.     documento = SubElement(top,"documento")
  22.     numDocs+=1
  23.     print("Numero de documentos = "+str(numDocs))
  24.    
  25.     titulo = SubElement(documento,"titulo")
  26.     titulo.text=submission.title
  27.     contenido = SubElement(documento,"contenido")
  28.     contenido.text = submission.selftext
  29.     fecha = SubElement(documento,"fecha")
  30.     fecha.text = time.strftime('%Y-%m-%d %H:%M:%S GMT', time.localtime(submission.created_utc))
  31.     tipoDeEntrada = SubElement(documento,"tipo_entrada")
  32.     tipoDeEntrada.text = "post"
  33.    
  34.     submission.comments.replace_more(limit=0)
  35.     for comment in submission.comments.list():
  36.             documento = SubElement(top,"documento")
  37.             numDocs+=1
  38.            
  39.             titulo = SubElement(documento,"titulo")
  40.             titulo.text=""
  41.             contenido = SubElement(documento,"contenido")
  42.             contenido.text = comment.body
  43.             fecha = SubElement(documento,"fecha")
  44.             fecha.text = time.strftime('%Y-%m-%d %H:%M:%S GMT', time.localtime(comment.created_utc))
  45.             tipoDeEntrada = SubElement(documento,"tipo_entrada")
  46.             tipoDeEntrada.text = "comentario"      
  47.  
  48. path='/home/masterbigdata/TGINE-P1/historyNEW.xml'            
  49. tree = ElementTree(top)
  50. tree.write(path)  
  51. print("Se han obtenido "+str(numDocs)+" documentos y se han volvado en "+path)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement