Advertisement
Guest User

Untitled

a guest
Aug 22nd, 2014
213
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Bash 1.12 KB | None | 0 0
  1. #!/bin/sh
  2.  
  3. URL="http://www.pathfinder-fr.org/Wiki/Pathfinder-RPG."
  4. EXT=".ashx"
  5. CLASS=("Barbare" "Barde" "Druide" "Ensorceleur" "Guerrier" "Magicien" "Moine" "Paladin" "Pr%C3%AAtre" "R%C3%B4deur" "Roublard")
  6.  
  7.  
  8. for i in ${CLASS[@]}; do
  9.     u="${URL}${i}${EXT}"
  10.     lynx.exe -dump -width 20000 "${u}"                                               | \
  11.         # remove ref to links
  12.         sed 's/\[[^]]*\]//g'                                                         | \
  13.  
  14.         # remove anything except block between these markers
  15.         sed '/Descriptif de la classe/,/Le contenu officiel de/!d'                   | \
  16.  
  17.         # remove first lines (first marker)
  18.         sed '1,4d'                                                                   | \
  19.  
  20.         # remove last line (last marker)
  21.         sed '$d'                                                                     | \
  22.  
  23.         # remove empty lines
  24.         sed '/^[ ]*$/d'                                                              | \
  25.  
  26.         # transform to csv
  27.         sed '/ΒΆ/ { N; s/\(.*\)ΒΆ[ ]*\n[ ]*\(.*\)/"\1";"\2"/; p;}'  > "${i}".csv
  28. done
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement