Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- import requests
- import re
- import os
- import time
- from concurrent.futures import ThreadPoolExecutor
- #SCRIPT FEITA POR JURISHCRYPTER
- #SE COMPARTILHAR PF DEIXAR CREDITOS
- #EXCLUSIVA DO THOTHUB.TV
- #--------CONFIGURAÇÃO--------
- #Coloque a URL do site entre aspas abaixo:
- DATA = "2020/02"
- URL_ANON = "https://anonimatta.com.br/wp-content/uploads/"+DATA+"/DSC"
- #Numero de tarefas em paralelo para pesquisar no site (não exagere senão da erro)
- MAX_THREADS = 32
- #Nome do arquivo onde serão salvos os links encontrados no site (não catalogados)
- ARQUIVO_ENCONTRADOS = "linksAnonimatta.txt"
- #Pasta onde TODAS as fotos serão salvas
- PASTA_FOTOS = "Anonimatta"
- #Procurar fotos a partir de tais numeros: (nunca vi menor que 1000 ou maior 10k)
- PROCURAR_INICIO = 900
- PROCURAR_FIM = 10000
- #--------FIM---CONFIG--------
- #NÃO MEXER
- headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/44.0.2403.155 Safari/537.36'}
- pool = ThreadPoolExecutor(max_workers=MAX_THREADS)
- pool2 = ThreadPoolExecutor(max_workers=MAX_THREADS)
- file_found = open(ARQUIVO_ENCONTRADOS,"w+")
- achouSub = 0
- def iniciaScrapper(ind, album, folderName, subStr):
- global achouSub
- for i in range(0,3):
- filename="_"+str(ind)+".jpg"
- if(subStr):
- filename="a-"+str(ind)+".jpg"
- if(i==1):
- filename="0"+str(ind)+".jpg"
- if(i==2):
- filename="_"+str(ind)+"a-1.jpg"
- url=album+filename
- r = requests.get(url, params="", headers=headers)
- if r.status_code == 200:
- if(i==2):
- achouSub = ind
- print("%s encontrada"%filename)
- if not os.path.isdir(PASTA_FOTOS):
- os.mkdir(PASTA_FOTOS)
- if not os.path.isdir("%s\%s"%(PASTA_FOTOS, folderName)):
- os.mkdir("%s\%s"%(PASTA_FOTOS, folderName))
- with open("%s\%s\%s"%(PASTA_FOTOS, folderName, filename), 'wb+') as f:
- for chunk in r:
- f.write(chunk)
- if(subStr):
- break
- for ind in range(PROCURAR_INICIO, PROCURAR_FIM+1):
- pool.submit(iniciaScrapper, ind, URL_ANON, DATA.replace('/',' mes '), False)
- pool.shutdown(wait=True)
- if(achouSub != 0):
- for ind in range(1, 100):
- pool2.submit(iniciaScrapper, ind, URL_ANON+"_"+str(achouSub), DATA.replace('/',' mes '), True)
- pool2.shutdown(wait=True)
- file_found.close()
Add Comment
Please, Sign In to add comment