Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- EXPLANATION:
- ROMANIAN: https://neculaifantanaru.com/python-elimina-cuvintele-de-legatura-din-linkurile-html.html
- ENGLISH: https://neculaifantanaru.com/en/python-removes-connecting-words-from-html-links.html
- -----------------------
- LINK = 'taramul-prea-indepartat-al-zacamintelor-necunoscute.html
- LISTA_CUVINTE_LEGATURA = [
- 'in', 'la', 'unei', 'si', 'sa', 'se', 'de', 'prin', 'unde', 'care', 'a',
- 'al', 'prea', 'lui', 'din', 'ai', 'unui', 'acei', 'un', 'doar', 'tine',
- 'ale', 'sau', 'dintre', 'intre', 'cu','ce', 'va', 'fi', 'este', 'cand', 'o'
- ]
- # folosim DEF cand vrem sa definim o functie => un cuvant cheie in Python
- # REGULA: def nume_functie(lista_argumente)
- def preia_cuvinte_link(link):
- cuvinte = link.split('.')[0] # [0] ia primul element iar daca pun [1] ia al doilea element
- cuvinte = cuvinte.split('-')
- cuvinte_ok = list()
- print("INAINTE REMOVE: ", cuvinte)
- for cuv in cuvinte:
- if cuv not in LISTA_CUVINTE_LEGATURA:
- cuvinte_ok.append(cuv)
- print("DUPA REMOVE: ", cuvinte_ok)
- return cuvinte_ok # am pus retutn fiindca voi avea nevoie de rezultatul functiei de mai sus
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement