Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- 【Jane Styleでの2ch.netの過去ログ取得方法】2015/12/18
- 0) サポート
- htmltodatのサポートは以下のBBSのスレッドにて行われているが、本説明についての質問はしないようにしてください
- htmltodatサポートスレッド
- http://jbbs.shitaraba.net/bbs/read.cgi/computer/1929/1038588508/
- 1) 入手
- http://mukiyu.g.ribbon.to/
- htmltodat 0.11.8(909k byte)の中のhtmltodat.exe/bregexp.dll/nkf32.dllの3つと
- http://mirrorhenkan.g.ribbon.to/jane/htmltodat-convert2/
- htmltodat-convert2_20121221 (5k byte)の中のhtmltodat-convert2.wsfをJane2ch.exeと同じフォルダに解凍する
- ※ zipの解凍にエクスプローラの機能を使う人は解凍前にダウンロードセキュリティブロックを解除しておく
- (htmltodat0.11.6.zip 及び htmltodat-convert2_20121221.zipを右クリックしプロパティを開いて下の方にある
- セキュリティ 「ブロックの解除」ボタンをクリック後に解凍する)
- ※ なお、Jane Style(Jane2ch.exe)のあるフォルダがわからない人は、以下の3)と同様の手順でコマンド登録に
- コマンド名、Janeのフォルダを開く
- コマンド内容、explorer "$BASEPATH"
- を追加し、レス表示欄で右クリックし、「Janeのフォルダを開く」を選択実行するとフォルダが開く
- 2) 設定
- htmltodat.exeを起動し、prmファイルを以下の手順で作成して終了する
- 左下3番目prmファイルボタン→入力欄を右クリックして以下の「prmファイル設定内容」を貼り付ける
- 保存ボタン→任意の名前.prmと名づけJane2ch.exeと同じフォルダに保存する
- ※ 以降の説明のため、保存したファイル名を仮に「2ch_net.prm」としておく
- 3) コマンド登録
- Jane Styleのメニューから、ツール-設定-コマンド
- コマンド名に、任意に指定する(仮に「過去ログ取得(htmltodat)」としておく)
- 実行するコマンドに、wscript "$BASEPATHhtmltodat-convert2.wsf" "$LINK$URL" "2ch_net"
- を入れて追加ボタンを押して後、OKボタンを押して設定を終了する
- ※ ここで、"2ch_net" は、2)で保存したprmファイル名を拡張子を除いて指定する
- ※ なお、直接Jane2chフォルダにある(無ければ作成)command.datに設定してもよい(Janeを終了して作業する)
- 過去ログ取得(htmltodat)=wscript "$BASEPATHhtmltodat-convert2.wsf" "$LINK$URL" "2ch_net"
- を追加して上書き保存し終了する
- 4) 過去ログを取得する
- 以下のa)~c)のどれかの手順で実行する
- ※ 一度でも該当スレを開いたことがある場合は、事前にログ削除して、a)、c)の手順で実行すればレス内容が表示されないということは起きない
- a) 別スレで表示されているURLのリンクを右クリックし、
- b) 開いている該当する過去ログのスレ表示欄から右クリックし
- c) 書き込みウィンドウやメモ欄でURLを書き込んだ後プレビューでリンクを右クリックし
- ※既に開いたことがある場合は、ログ削除しないと「ここ壊れています」と表示される場合がある
- 上記3)で登録したコマンドを選択する
- htmltodatが起動されて自動実行され、終了後過去スレが表示されるか、又は既に開いている過去スレにフォーカスが移る
- ※***************************************************************************************
- ※ 【スレ内容が表示されない場合】
- ※ 再描画(デフォルトのスレッドツールバーなら左から3つ目のアイコンを右クリック)を実行後、(一旦別スレに移動して戻るか)、
- ※ 又は、一旦スレを閉じて開き直す(メニュー-ファイル-最近閉じたスレから)
- ※***************************************************************************************
- 5) なお、一連のファイルをJane2chフォルダ直下に置きたくない場合、以下のようにwsfファイルを修正する
- 例
- Jane Style
- ┗script
- ┗htmltodat
- ┗htmltodat-convert2.wsf
- ・command.datに
- 過去ログ取得(htmltodat)=wscript "$BASEPATHscript\htmltodat\htmltodat-convert2.wsf" "$LINK$URL" "2ch_net"
- ・htmltodat-convert2.wsf修正箇所
- 【13行目 挿入】
- var base = (new ActiveXObject("WScript.Shell")).CurrentDirectory + "\\";
- (new ActiveXObject("WScript.Shell")).CurrentDirectory = cur;
- 【20行目 curをbaseに】
- var log = GetProf("PATH", "LogBasePath", base, base + "Jane2ch.ini");
- 【66行目 curをbaseに】
- cmd.Run("\"" + base + "Jane2ch.exe\" " + "\"" + WScript.Arguments(0) + "\"");
- 6) スレタイトルを正常なタイトルに設定し直す方法
- 以前のprmファイルを使っていて、スレタイトルが「2ちゃんねる専用ブラウザをご利用の皆さまへ」になってしまうと
- ログを削除して新しいprmファイルで取得しなおしてもスレタイトルは変更されません
- 対処方法
- Jane Styleを終了させ、エクスプローラから直接目的のログファイルの格納されているフォルダを見る
- そこにある [スレッド-ID].idx ファイルと BoardDB.db ファイルを削除する
- Jane Styleを起動する
- ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
- ※以下をコピー&ペーストする場合は、行番号が表示されていない RAW Paste Data 又は メニュー RAW で表示した後で
- コピーするか 又は、一旦左上のメニューから DOWNLOAD してからメモ帖などで開いてコピーしてください
- 以下の05系と06系は一緒のファイルに入れないでファイルを分けてください
- また、切り取り線はコピーしないでください
- ※初出元 http://jbbs.shitaraba.net/bbs/read.cgi/computer/1929/1038588508/934
- http://jbbs.shitaraba.net/bbs/read.cgi/computer/1929/1038588508/936
- ━━━━━━ prmファイル設定内容 : ここから read.cgi ver 06系(新サーバー potato/tamae/hanabi)━━━━━━━
- コメント:
- # 2chのread.cgiからの出力を変換-20151208
- # 2chのcgi仕様変更(06系)に対応
- # まだ今後の推移が読めないので様子見バージョン
- HTTPヘッダの追加:
- User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; LCJB; rv:11.0) like Gecko
- URLの変換:
- s#http://(.+?)/test/read\.cgi/(.+?)/(\d+)/?.*#http://$1/test/read.cgi/$2/$3/#
- アンカー削除:
- false
- プレビューを表示しない:
- true
- 後処理:
- # BE周りの処置
- s#<img src="http://(img\.2ch\.net/.+?)">#sssp://$1#igk
- s#</div><div class="be .*?><a href="http://be\.2ch\.net/user/(\d+).*?>\?(.*?)</a># BE:$1-$2#ig
- # jump.2chは無駄なので取っ払う
- s#<a href="http://jump\.2ch\.net.*?>(.*?)</a>#$1#igk
- # フルパスを相対パスに変換(やらなくても問題ないかもしれないが一応昔の仕様に合わせる)
- s#<a href="http://.*?\.2ch\.net/(test/read\.cgi/.*?/\d+/\d+)#<a href="../$1#igk
- s#<a href="http.*?>(.*?)</a>#$1#igk
- # お絵かき機能のimgタグを除去
- s#<img src="(.*?)">#$1#igk
- 正規表現:
- m#<div\ class="number">([0-9]+).+?<div\ class="name"><b>(?:<a\ href="mailto:(.*?)">)?(.*?)(?:</a>)?</b></div><div\ class="date">(.*?)</div><div\ class="message">(.*?)</div>#mi
- ━━━━━━ prmファイル設定内容 : ここまで ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
- ━━━━━━ prmファイル設定内容 : ここから read.cgi ver 05系(旧サーバー)━━━━━━━━━━━━━━━━
- コメント:
- # 2chのread.cgi 05系からの出力を変換-20151209
- # 元datに近づけるためアンカー削除はオフにし
- # 後処理で不要なもののみ削除する
- # メール欄デコード処理は不要になったので削除
- # バナー広告にマッチしないよう正規表現を修正
- HTTPヘッダの追加:
- User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; LCJB; rv:11.0) like Gecko
- URLの変換:
- s#http://(.+?)/test/read\.cgi/(.+?)/(\d+)/?.*#http://$1/test/read.cgi/$2/$3/#
- アンカー削除:
- false
- プレビューを表示しない:
- true
- 後処理:
- # アンカータグ削除(レスアンカーに対するタグは削除しない)
- s#<a href="http.*?>(.*?)</a>#$1#igk
- # BE周りの処置
- s#<img src="http://(img\.2ch\.net/.+?)">#sssp://$1#igk
- # 以下はhtmltodatの内部処理に組み込まれているので不要
- #s#<a href=.?javascript:be\((\d+)(?:,\d+)?\).*?>\?(.*?)</a>#BE:$1-$2#igk
- 正規表現:
- m#<dt.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+?)</b>(?:</font>|</a>) ?:(.*?)<dd>(.*?)<br><br>(<dt.*?>|</dl>|<div)#mi
- ━━━━━━ prmファイル設定内容 : ここまで ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement