Advertisement
Guest User

Untitled

a guest
Jan 17th, 2015
302
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 2.54 KB | None | 0 0
  1. #!/usr/bin/python
  2. # -*- coding: utf-8 -*-
  3. import pwb
  4. import pywikibot
  5. import sys
  6. import codecs
  7. import json
  8. import re
  9.  
  10. try:
  11. arxiu = "Islandia.txt"
  12. f2 = codecs.open(arxiu, 'ab', 'utf8')
  13. except (OSError, IOError) as e:
  14. print u'Problemes per obrir l\'arxiu %s' % arxiu
  15. exit(0)
  16. #"ARTICLEVIQUIPEDIA" P402 "NUMIDENTIFCADOROSM" S143 Q936
  17.  
  18. liniesIS = []
  19. liniesEN = []
  20. liniesFR = []
  21. liniesOC = []
  22. liniesEU = []
  23. liniesDE = []
  24. liniesAltres = []
  25. elementSenseWikipedia = []
  26.  
  27. def main():
  28. try:
  29. arxiu = "Islandia.JSON"
  30. f = codecs.open(arxiu, 'r', 'utf8')
  31. except (OSError, IOError) as e:
  32. print u'Problemes per obrir l\'arxiu %s' % arxiu
  33. exit(0)
  34. txt = f.read()
  35. f.close()
  36. jsonObject = json.loads(txt)
  37. for item in jsonObject['elements']:
  38. identificador = ""
  39. article = ""
  40. element = ""
  41. auxiliar = ""
  42. linia = ""
  43. codi = ""
  44. noEsCatalunya = True
  45. if item['type'] == "relation":
  46. identificador = item['id']
  47. if identificador:
  48. if item['tags']:
  49. try:
  50. article = item['tags']['wikipedia']
  51. except:
  52. element = item['tags']['name']
  53. print u"L\'element %s no té el tag Wikipedia" % (element)
  54. elementaux = u"%s\t" % (element)
  55. elementSenseWikipedia.append(elementaux)
  56. if article and noEsCatalunya:
  57. llengua = re.findall(u'(.*?):', article)
  58. auxiliar = re.sub(u'(.*?):', '', article)
  59. #auxiliar = re.findall(u'ca\:(.*?)', article)
  60. linia = u"%s\tP402\t\"%s\"\tS143\tQ936\n" % (auxiliar, identificador)
  61. if llengua[0] == 'is':
  62. liniesIS.append(linia)
  63. elif llengua[0] == 'en':
  64. liniesEN.append(linia)
  65. elif llengua[0] == 'fr':
  66. liniesFR.append(linia)
  67. elif llengua[0] == 'oc':
  68. liniesOC.append(linia)
  69. elif llengua[0] == 'eu':
  70. liniesEU.append(linia)
  71. elif llengua[0] == 'de':
  72. liniesDE.append(linia)
  73. else:
  74. liniesAltres.append(linia)
  75. llengua = ""
  76.  
  77. def escriuArxiuFinal(liniesLlengua, llengua):
  78. entradetes = u"Aquests son els enllaços %s:\n\n" % (llengua)
  79. f2.write(entradetes)
  80. for liniaXX in liniesLlengua:
  81. f2.write(liniaXX)
  82. f2.write("\n\n")
  83.  
  84. if __name__ == '__main__':
  85. main()
  86. escriuArxiuFinal(liniesIS, u"islandès")
  87. escriuArxiuFinal(liniesEN, u"anglès")
  88. escriuArxiuFinal(liniesFR, u"francès")
  89. escriuArxiuFinal(liniesOC, u"occità")
  90. escriuArxiuFinal(liniesEU, u"euskera")
  91. escriuArxiuFinal(liniesDE, u"alemany")
  92. escriuArxiuFinal(liniesAltres, u"Altres")
  93. escriuArxiuFinal(elementSenseWikipedia, u"sense correspondència")
  94. f2.close()
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement