Advertisement
Guest User

Untitled

a guest
Jan 1st, 2015
216
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 2.22 KB | None | 0 0
  1. #!/usr/bin/python
  2. # -*- coding: utf-8 -*-
  3. import pwb
  4. import pywikibot
  5. import sys
  6. import codecs
  7. import json
  8. import re
  9.  
  10. try:
  11. f2 = codecs.open('CSV_OSM.txt', 'ab', 'utf8')
  12. except (OSError, IOError) as e:
  13. print u'Problemes per obrir l\'arxiu %s' % arxiu
  14. exit(0)
  15. #"ARTICLEVIQUIPEDIA" P402 "NUMIDENTIFCADOROSM" S143 Q936
  16.  
  17. liniesCA = []
  18. liniesES = []
  19. liniesFR = []
  20. liniesOC = []
  21. liniesAltres = []
  22. elementSenseWikipedia = []
  23.  
  24. def main():
  25. try:
  26. f = codecs.open("JSONOSM.json", 'r', 'utf8')
  27. except (OSError, IOError) as e:
  28. print u'Problemes per obrir l\'arxiu %s' % arxiu
  29. exit(0)
  30. txt = f.read()
  31. f.close()
  32. jsonObject = json.loads(txt)
  33. for item in jsonObject['elements']:
  34. identificador = ""
  35. article = ""
  36. element = ""
  37. auxiliar = ""
  38. linia = ""
  39. if item['type'] == "relation":
  40. identificador = item['id']
  41. if identificador:
  42. if item['tags']:
  43. try:
  44. article = item['tags']['wikipedia']
  45. except:
  46. element = item['tags']['name']
  47. print u"L\'element %s no té el tag Wikipedia" % (element)
  48. elementaux = u"%s\t" % (element)
  49. elementSenseWikipedia.append(elementaux)
  50. if article:
  51. llengua = re.findall(u'(.*?):', article)
  52. auxiliar = re.sub(u'(.*?):', '', article)
  53. #auxiliar = re.findall(u'ca\:(.*?)', article)
  54. linia = u"%s\tP402\t\"%s\"\tS143\tQ936\n" % (auxiliar, identificador)
  55. if llengua[0] == 'ca':
  56. liniesCA.append(linia)
  57. elif llengua[0] == 'es':
  58. liniesES.append(linia)
  59. elif llengua[0] == 'fr':
  60. liniesFR.append(linia)
  61. elif llengua[0] == 'oc':
  62. liniesOC.append(linia)
  63. else:
  64. liniesAltres.append(linia)
  65. llengua = ""
  66.  
  67. def escriuArxiuFinal(liniesLlengua, llengua):
  68. entradetes = u"Aquests son els enllaços %s:\n\n" % (llengua)
  69. f2.write(entradetes)
  70. for liniaXX in liniesLlengua:
  71. f2.write(liniaXX)
  72. f2.write("\n\n")
  73.  
  74. if __name__ == '__main__':
  75. main()
  76. escriuArxiuFinal(liniesCA, u"català")
  77. escriuArxiuFinal(liniesES, u"castellà")
  78. escriuArxiuFinal(liniesFR, u"francès")
  79. escriuArxiuFinal(liniesOC, u"occità")
  80. escriuArxiuFinal(liniesAltres, u"Altres")
  81. escriuArxiuFinal(elementSenseWikipedia, u"sense correspondència")
  82. f2.close()
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement