Advertisement
Guest User

tumblr pic crawl

a guest
Jun 25th, 2013
276
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Bash 0.88 KB | None | 0 0
  1. #!/bin/bash
  2.  
  3.  
  4. #DIR="/home/censured/Scripts/Bash"
  5. #name="antoshabrain"
  6.  
  7. ### стадия 1 парсим RSS на наличие ссылок на посты с картинками ###
  8. curl http://antoshabrain.tumblr.com/rss | grep -o "<link>[^>]*" | grep -o "http[^>]*" | cut -d '<' -f1 | grep "post" >> stage1
  9. sleep 2
  10.  
  11. ### стадия 2 изменяем url постов на url html с картинками ###
  12. sed 's/post/image/' stage1 >> stage2
  13. sleep 2
  14.  
  15. ### стадия 3 получаем фаил с прямыми ссылками на картинки ###
  16. xargs curl < stage2  | grep "img id" | grep -o "src=[^>]*" | cut -d " " -f1  | cut -d '"' -f2 >> stage3
  17. sleep 2
  18.  
  19. ### стадия 4 качаем список картинок по шаблону ###
  20. wget --no-parent --wait=1 --limit-rate=512K --recursive --accept=jpg,jpeg,png,gif --no-directories -c -i stage3
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement