Advertisement
Guest User

westpol_regex

a guest
Apr 5th, 2016
102
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 1.03 KB | None | 0 0
  1. Der WDR, Javascript und REGEX…
  2.  
  3. Da der WDR seine Mediathek komplett auf Javascript umgestellt und dabei auch seine RSS-Feeds selber geschossen hat, musste ich mir einen neuen Cron-Job-Einzeiler schreiben.
  4.  
  5. Das Script zieht aus der WESTPOL-Übersicht den neuesten HTML-Beitrag, um in dem HTML-Beitrag das Javascript zu extrahieren, in dem sich der Link zur Video-Datei im .mp4-Format versteckt.
  6.  
  7. Tolle Wurst lieber WDR… das ginge auch ohne Javascript – aber vielleicht ist das auch gewollt, was die "Barrierefreiheit" betrifft – das bekommt der NDR besser hin.
  8.  
  9. verwendete Tools: wget, lynx, curl – Befehle: echo, grep, head, sed, tr.
  10.  
  11. =========
  12.  
  13. wget $( lynx -dump "$( echo "$( curl -v --silent "$(lynx -dump http://www1.wdr.de/mediathek/video/sendungen/westpol/index.html | grep "video/sendungen/westpol/video-" | head -n 1 | sed 's/^[ {0-9}.]*//')" --stderr - | grep deviceids )" | sed -n 's/.*url'\'': '\''\([^'\'']*\).*/\1/p')" | tr , '\n' | grep videoURL | grep mp4 | sed -n 's/.*videoURL":"\([^"]*\).*/\1/p' )
  14.  
  15. =========
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement