JurishCrypter

Untitled

Apr 12th, 2020
2,246
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 2.44 KB | None | 0 0
  1. import requests
  2. import re
  3. import os
  4. import time
  5. from concurrent.futures import ThreadPoolExecutor
  6.  
  7. #SCRIPT FEITA POR JURISHCRYPTER
  8. #SE COMPARTILHAR PF DEIXAR CREDITOS
  9. #EXCLUSIVA DO THOTHUB.TV
  10. #--------CONFIGURAÇÃO--------
  11. #Coloque a URL do site entre aspas abaixo:
  12. DATA = "2020/02"
  13. URL_ANON = "https://anonimatta.com.br/wp-content/uploads/"+DATA+"/DSC"
  14. #Numero de tarefas em paralelo para pesquisar no site (não exagere senão da erro)
  15. MAX_THREADS = 32
  16. #Nome do arquivo onde serão salvos os links encontrados no site (não catalogados)
  17. ARQUIVO_ENCONTRADOS = "linksAnonimatta.txt"
  18. #Pasta onde TODAS as fotos serão salvas
  19. PASTA_FOTOS = "Anonimatta"
  20. #Procurar fotos a partir de tais numeros: (nunca vi menor que 1000 ou maior 10k)
  21. PROCURAR_INICIO = 900
  22. PROCURAR_FIM = 10000
  23. #--------FIM---CONFIG--------
  24.  
  25. #NÃO MEXER
  26. headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/44.0.2403.155 Safari/537.36'}
  27. pool = ThreadPoolExecutor(max_workers=MAX_THREADS)
  28. pool2 = ThreadPoolExecutor(max_workers=MAX_THREADS)
  29. file_found = open(ARQUIVO_ENCONTRADOS,"w+")
  30. achouSub = 0
  31.  
  32. def iniciaScrapper(ind, album, folderName, subStr):
  33.     global achouSub        
  34.     for i in range(0,3):
  35.         filename="_"+str(ind)+".jpg"
  36.         if(subStr):
  37.             filename="a-"+str(ind)+".jpg"
  38.         if(i==1):
  39.             filename="0"+str(ind)+".jpg"
  40.         if(i==2):
  41.             filename="_"+str(ind)+"a-1.jpg"
  42.         url=album+filename
  43.         r = requests.get(url, params="", headers=headers)
  44.         if r.status_code == 200:
  45.             if(i==2):
  46.                 achouSub = ind
  47.             print("%s encontrada"%filename)
  48.  
  49.             if not os.path.isdir(PASTA_FOTOS):
  50.                 os.mkdir(PASTA_FOTOS)
  51.             if not os.path.isdir("%s\%s"%(PASTA_FOTOS, folderName)):
  52.                 os.mkdir("%s\%s"%(PASTA_FOTOS, folderName))
  53.             with open("%s\%s\%s"%(PASTA_FOTOS, folderName, filename), 'wb+') as f:
  54.                 for chunk in r:
  55.                     f.write(chunk)
  56.             if(subStr):
  57.                 break
  58.  
  59. for ind in range(PROCURAR_INICIO, PROCURAR_FIM+1):
  60.     pool.submit(iniciaScrapper, ind, URL_ANON, DATA.replace('/',' mes '), False)
  61. pool.shutdown(wait=True)
  62.  
  63. if(achouSub != 0):
  64.     for ind in range(1, 100):
  65.         pool2.submit(iniciaScrapper, ind, URL_ANON+"_"+str(achouSub), DATA.replace('/',' mes '), True)
  66.  
  67. pool2.shutdown(wait=True)
  68. file_found.close()
Add Comment
Please, Sign In to add comment