Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- #!/usr/bin/python
- # -*- coding: utf-8 -*-
- import pwb
- import pywikibot
- import sys
- import codecs
- import json
- import re
- try:
- arxiu = "Islandia.txt"
- f2 = codecs.open(arxiu, 'ab', 'utf8')
- except (OSError, IOError) as e:
- print u'Problemes per obrir l\'arxiu %s' % arxiu
- exit(0)
- #"ARTICLEVIQUIPEDIA" P402 "NUMIDENTIFCADOROSM" S143 Q936
- liniesIS = []
- liniesEN = []
- liniesFR = []
- liniesOC = []
- liniesEU = []
- liniesDE = []
- liniesAltres = []
- elementSenseWikipedia = []
- def main():
- try:
- arxiu = "Islandia.JSON"
- f = codecs.open(arxiu, 'r', 'utf8')
- except (OSError, IOError) as e:
- print u'Problemes per obrir l\'arxiu %s' % arxiu
- exit(0)
- txt = f.read()
- f.close()
- jsonObject = json.loads(txt)
- for item in jsonObject['elements']:
- identificador = ""
- article = ""
- element = ""
- auxiliar = ""
- linia = ""
- codi = ""
- noEsCatalunya = True
- if item['type'] == "relation":
- identificador = item['id']
- if identificador:
- if item['tags']:
- try:
- article = item['tags']['wikipedia']
- except:
- element = item['tags']['name']
- print u"L\'element %s no té el tag Wikipedia" % (element)
- elementaux = u"%s\t" % (element)
- elementSenseWikipedia.append(elementaux)
- if article and noEsCatalunya:
- llengua = re.findall(u'(.*?):', article)
- auxiliar = re.sub(u'(.*?):', '', article)
- #auxiliar = re.findall(u'ca\:(.*?)', article)
- linia = u"%s\tP402\t\"%s\"\tS143\tQ936\n" % (auxiliar, identificador)
- if llengua[0] == 'is':
- liniesIS.append(linia)
- elif llengua[0] == 'en':
- liniesEN.append(linia)
- elif llengua[0] == 'fr':
- liniesFR.append(linia)
- elif llengua[0] == 'oc':
- liniesOC.append(linia)
- elif llengua[0] == 'eu':
- liniesEU.append(linia)
- elif llengua[0] == 'de':
- liniesDE.append(linia)
- else:
- liniesAltres.append(linia)
- llengua = ""
- def escriuArxiuFinal(liniesLlengua, llengua):
- entradetes = u"Aquests son els enllaços %s:\n\n" % (llengua)
- f2.write(entradetes)
- for liniaXX in liniesLlengua:
- f2.write(liniaXX)
- f2.write("\n\n")
- if __name__ == '__main__':
- main()
- escriuArxiuFinal(liniesIS, u"islandès")
- escriuArxiuFinal(liniesEN, u"anglès")
- escriuArxiuFinal(liniesFR, u"francès")
- escriuArxiuFinal(liniesOC, u"occità")
- escriuArxiuFinal(liniesEU, u"euskera")
- escriuArxiuFinal(liniesDE, u"alemany")
- escriuArxiuFinal(liniesAltres, u"Altres")
- escriuArxiuFinal(elementSenseWikipedia, u"sense correspondència")
- f2.close()
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement