daily pastebin goal
53%
SHARE
TWEET

Untitled

a guest Jan 17th, 2015 237 Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. #!/usr/bin/python
  2. # -*- coding: utf-8 -*-
  3. import pwb
  4. import pywikibot
  5. import sys
  6. import codecs
  7. import json
  8. import re
  9.  
  10. try:
  11.         arxiu = "Islandia.txt"
  12.         f2 = codecs.open(arxiu, 'ab', 'utf8')
  13. except (OSError, IOError) as e:
  14.         print u'Problemes per obrir l\'arxiu %s' % arxiu
  15.         exit(0)
  16. #"ARTICLEVIQUIPEDIA" P402 "NUMIDENTIFCADOROSM" S143 Q936
  17.  
  18. liniesIS = []
  19. liniesEN = []
  20. liniesFR = []
  21. liniesOC = []
  22. liniesEU = []
  23. liniesDE = []
  24. liniesAltres = []
  25. elementSenseWikipedia = []
  26.  
  27. def main():
  28.         try:
  29.                 arxiu = "Islandia.JSON"
  30.                 f = codecs.open(arxiu, 'r', 'utf8')
  31.         except (OSError, IOError) as e:
  32.                 print u'Problemes per obrir l\'arxiu %s' % arxiu
  33.                 exit(0)
  34.         txt = f.read()
  35.         f.close()
  36.         jsonObject = json.loads(txt)
  37.         for item in jsonObject['elements']:
  38.                 identificador = ""
  39.                 article = ""
  40.                 element = ""
  41.                 auxiliar = ""
  42.                 linia = ""
  43.                 codi = ""
  44.                 noEsCatalunya = True
  45.                 if item['type'] == "relation":
  46.                         identificador = item['id']
  47.                         if identificador:
  48.                                 if item['tags']:
  49.                                         try:
  50.                                                 article = item['tags']['wikipedia']
  51.                                         except:
  52.                                                 element = item['tags']['name']
  53.                                                 print u"L\'element %s no té el tag Wikipedia" % (element)
  54.                                                 elementaux = u"%s\t" % (element)
  55.                                                 elementSenseWikipedia.append(elementaux)
  56.                                         if article and noEsCatalunya:
  57.                                                 llengua = re.findall(u'(.*?):', article)
  58.                                                 auxiliar = re.sub(u'(.*?):', '', article)      
  59.                                                 #auxiliar = re.findall(u'ca\:(.*?)', article)
  60.                                                 linia = u"%s\tP402\t\"%s\"\tS143\tQ936\n" % (auxiliar, identificador)
  61.                                                 if llengua[0] == 'is':
  62.                                                         liniesIS.append(linia)
  63.                                                 elif llengua[0] == 'en':
  64.                                                         liniesEN.append(linia)
  65.                                                 elif llengua[0] == 'fr':
  66.                                                         liniesFR.append(linia)
  67.                                                 elif llengua[0] == 'oc':
  68.                                                         liniesOC.append(linia)
  69.                                                 elif llengua[0] == 'eu':
  70.                                                         liniesEU.append(linia)
  71.                                                 elif llengua[0] == 'de':
  72.                                                         liniesDE.append(linia)
  73.                                                 else:
  74.                                                         liniesAltres.append(linia)
  75.                                                 llengua = ""
  76.  
  77. def escriuArxiuFinal(liniesLlengua, llengua):
  78.         entradetes = u"Aquests son els enllaços %s:\n\n" % (llengua)
  79.         f2.write(entradetes)
  80.         for liniaXX in liniesLlengua:
  81.                 f2.write(liniaXX)      
  82.         f2.write("\n\n")
  83.                                
  84. if __name__ == '__main__':
  85.         main()
  86.         escriuArxiuFinal(liniesIS, u"islandès")
  87.         escriuArxiuFinal(liniesEN, u"anglès")
  88.         escriuArxiuFinal(liniesFR, u"francès")
  89.         escriuArxiuFinal(liniesOC, u"occità")
  90.         escriuArxiuFinal(liniesEU, u"euskera")
  91.         escriuArxiuFinal(liniesDE, u"alemany")
  92.         escriuArxiuFinal(liniesAltres, u"Altres")
  93.         escriuArxiuFinal(elementSenseWikipedia, u"sense correspondència")
  94.         f2.close()
RAW Paste Data
We use cookies for various purposes including analytics. By continuing to use Pastebin, you agree to our use of cookies as described in the Cookies Policy. OK, I Understand
 
Top