Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- # -*- coding: utf-8 -*-
- import pywikibot as pwb
- from pywikibot import pagegenerators as pg
- import urllib
- import json
- import re
- enllac = ' Peix ' # La primera lletra en majusucla!!!!
- plural = ' peixos '
- enllacpunt = ' Peix.'
- pluralpunt = ' peixos.'
- enllac_min = enllac.lower()
- enllacpunt_min = enllacpunt.lower()
- def main(pag):
- site = pwb.Site('ca', 'wikiquote')
- page = pwb.Page(site, pag)
- text = page.text
- coincidencies = text.count(enllac) + text.count(enllac_min)
- print(u"%s: he trobat %s coincidències de la paraula %s i %s." % (pag, coincidencies, enllac, enllac_min))
- if coincidencies == 0:
- print(u"Em salto la pàgina")
- return
- noutext = text.replace(enllac, ' [[' + enllac.replace(' ', '') + ']] ').replace(enllac, ' [[' + enllac_min.replace(' ', '') + ']] ').replace(plural, ' [[' + enllac_min.replace(' ', '') + '|peixos]] ').replace(enllacpunt, ' [[' + enllac.replace(' ', '') + ']].').replace(enllacpunt_min, ' [[' + enllac_min.replace(' ', '') + ']].').replace(pluralpunt, ' [[' + enllac_min.replace(' ', '') + '|' + plural.replace(' ', '') + ']].')
- page.text = noutext
- page.save(u'Bot: Afegint enllaços per la paraula %s' % enllac_min)
- if __name__ == '__main__':
- allpages = pg.AllpagesPageGenerator(site=pwb.Site("ca", "wikiquote"), start="!", namespace=0, includeredirects = True)
- pages = pg.PreloadingGenerator(allpages, pageNumber = 100)
- for page in pages:
- main(page)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement