Advertisement
Guest User

Untitled

a guest
Oct 18th, 2019
89
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 1.60 KB | None | 0 0
  1. # このコードは松本香織が作成しました。
  2. #kokkaiWeeklyAPI_1.pyでデータを保存したファイル群から週と件数を抜き出してCSVファイルに保存するコードです。
  3.  
  4. from datetime import *
  5. from datetime import date, timedelta
  6. from bs4 import BeautifulSoup
  7. import pathlib
  8. import glob
  9. import csv
  10. import re
  11.  
  12. FILE_PASS2 = 'パス' #件数を格納するCSVファイルのパスを指定する
  13.  
  14. fw = csv.writer(open(FILE_PASS2, 'w', encoding='utf-8-sig', newline='\n'),delimiter=',')
  15. fw.writerow(['week', 'records'])
  16.  
  17. temp = {} #条件に合致するデータを保存
  18. file_n = [] #条件に合致するファイルを保存
  19.  
  20. p_temp = pathlib.Path('パス') #kokkaiWeeklyAPI_1.pyでデータを保存したファイル群の置いてあるパスを指定する
  21.  
  22. #ファイル名に「GENOM_」を含むファイルのうち、年月日(\d{4}-\d{2}-\d{2})が付されたファイルのみを変数に格納する(適宜調整してください)
  23. file_n = [p for p in p_temp.glob('GENOM_*.txt')
  24. if re.search('\d{4}-\d{2}-\d{2}.txt', str(p))]
  25.  
  26. #ファイル名から週を、ファイルの中身から件数を抜き出してCSVに書き込む(適宜調整してください)
  27. for f in range(len(file_n)):
  28. with open(file_n[f], 'r', encoding='utf-8-sig') as fp:
  29. week_n = str(file_n[f]).replace(r'..\thesis\GENOM_', '').replace(r'.txt', '').replace(r'\d{4}-','')
  30. #week_n = datetime.strptime(week_n, '%Y-%m-%d').date()
  31. soup = BeautifulSoup(fp, 'lxml')
  32. nor = soup.find("numberofrecords").string
  33. temp[f] = nor
  34. fw.writerow([week_n, temp[f]])
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement