daily pastebin goal
77%
SHARE
TWEET

Untitled

a guest Jan 1st, 2015 179 Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. #!/usr/bin/python
  2. # -*- coding: utf-8 -*-
  3. import pwb
  4. import pywikibot
  5. import sys
  6. import codecs
  7. import json
  8. import re
  9.  
  10. try:
  11.         f2 = codecs.open('CSV_OSM.txt', 'ab', 'utf8')
  12. except (OSError, IOError) as e:
  13.         print u'Problemes per obrir l\'arxiu %s' % arxiu
  14.         exit(0)
  15. #"ARTICLEVIQUIPEDIA" P402 "NUMIDENTIFCADOROSM" S143 Q936
  16.  
  17. liniesCA = []
  18. liniesES = []
  19. liniesFR = []
  20. liniesOC = []
  21. liniesAltres = []
  22. elementSenseWikipedia = []
  23.  
  24. def main():
  25.         try:
  26.                 f = codecs.open("JSONOSM.json", 'r', 'utf8')
  27.         except (OSError, IOError) as e:
  28.                 print u'Problemes per obrir l\'arxiu %s' % arxiu
  29.                 exit(0)
  30.         txt = f.read()
  31.         f.close()
  32.         jsonObject = json.loads(txt)
  33.         for item in jsonObject['elements']:
  34.                 identificador = ""
  35.                 article = ""
  36.                 element = ""
  37.                 auxiliar = ""
  38.                 linia = ""
  39.                 if item['type'] == "relation":
  40.                         identificador = item['id']
  41.                         if identificador:
  42.                                 if item['tags']:
  43.                                         try:
  44.                                                 article = item['tags']['wikipedia']
  45.                                         except:
  46.                                                 element = item['tags']['name']
  47.                                                 print u"L\'element %s no té el tag Wikipedia" % (element)
  48.                                                 elementaux = u"%s\t" % (element)
  49.                                                 elementSenseWikipedia.append(elementaux)
  50.                                         if article:
  51.                                                 llengua = re.findall(u'(.*?):', article)
  52.                                                 auxiliar = re.sub(u'(.*?):', '', article)      
  53.                                                 #auxiliar = re.findall(u'ca\:(.*?)', article)
  54.                                                 linia = u"%s\tP402\t\"%s\"\tS143\tQ936\n" % (auxiliar, identificador)
  55.                                                 if llengua[0] == 'ca':
  56.                                                         liniesCA.append(linia)
  57.                                                 elif llengua[0] == 'es':
  58.                                                         liniesES.append(linia)
  59.                                                 elif llengua[0] == 'fr':
  60.                                                         liniesFR.append(linia)
  61.                                                 elif llengua[0] == 'oc':
  62.                                                         liniesOC.append(linia)
  63.                                                 else:
  64.                                                         liniesAltres.append(linia)
  65.                                                 llengua = ""
  66.  
  67. def escriuArxiuFinal(liniesLlengua, llengua):
  68.         entradetes = u"Aquests son els enllaços %s:\n\n" % (llengua)
  69.         f2.write(entradetes)
  70.         for liniaXX in liniesLlengua:
  71.                 f2.write(liniaXX)      
  72.         f2.write("\n\n")
  73.                                
  74. if __name__ == '__main__':
  75.         main()
  76.         escriuArxiuFinal(liniesCA, u"català")
  77.         escriuArxiuFinal(liniesES, u"castellà")
  78.         escriuArxiuFinal(liniesFR, u"francès")
  79.         escriuArxiuFinal(liniesOC, u"occità")
  80.         escriuArxiuFinal(liniesAltres, u"Altres")
  81.         escriuArxiuFinal(elementSenseWikipedia, u"sense correspondència")
  82.         f2.close()
RAW Paste Data
We use cookies for various purposes including analytics. By continuing to use Pastebin, you agree to our use of cookies as described in the Cookies Policy. OK, I Understand
 
Top