Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- Der WDR, Javascript und REGEX…
- Da der WDR seine Mediathek komplett auf Javascript umgestellt und dabei auch seine RSS-Feeds selber geschossen hat, musste ich mir einen neuen Cron-Job-Einzeiler schreiben.
- Das Script zieht aus der WESTPOL-Übersicht den neuesten HTML-Beitrag, um in dem HTML-Beitrag das Javascript zu extrahieren, in dem sich der Link zur Video-Datei im .mp4-Format versteckt.
- Tolle Wurst lieber WDR… das ginge auch ohne Javascript – aber vielleicht ist das auch gewollt, was die "Barrierefreiheit" betrifft – das bekommt der NDR besser hin.
- verwendete Tools: wget, lynx, curl – Befehle: echo, grep, head, sed, tr.
- =========
- wget $( lynx -dump "$( echo "$( curl -v --silent "$(lynx -dump http://www1.wdr.de/mediathek/video/sendungen/westpol/index.html | grep "video/sendungen/westpol/video-" | head -n 1 | sed 's/^[ {0-9}.]*//')" --stderr - | grep deviceids )" | sed -n 's/.*url'\'': '\''\([^'\'']*\).*/\1/p')" | tr , '\n' | grep videoURL | grep mp4 | sed -n 's/.*videoURL":"\([^"]*\).*/\1/p' )
- =========
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement