Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- import requests
- import time
- import json
- import csv
- def csv_write(path, data):
- '''
- запись данных в csv формате
- Parameters:
- path (str) : имя файла
- data (list) : массив с данными
- ----------
- '''
- with open(path, "a", newline='') as f:
- writer = csv.writer(f, delimiter=',')
- writer.writerow(data)
- def open_file(path):
- '''
- извлечение данных из файла в виде массива.. Значение в файле
- должны быть в столбик
- Parameters:
- path (str) : имя файла
- Returns:
- list: массив с данными
- '''
- with open(path, "r", encoding="utf8") as f:
- data = f.read()
- return data.split("\n")
- inns = open_file("inn.txt")
- for inn in inns:
- header = {
- 'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:67.0) Gecko/20100101 Firefox/67.0',
- 'Accept-Language': 'ru-RU,ru;q=0.8,en-US;q=0.5,en;q=0.3',
- "Connection": "close",
- }
- param = {
- 'vyp3CaptchaToken':"",
- 'page':"" ,
- 'query': inn,
- 'region':"",
- 'PreventChromeAutocomplete':"",
- }
- url = "https://egrul.nalog.ru/"
- response = requests.post(url, json = param, headers = header)
- token = response.json()["t"]
- url = "https://egrul.nalog.ru/search-result/" + token
- response = requests.get(url, headers = header)
- res_data = response.json() #данные ответа
- print(res_data)
- company_details = []
- try:
- # извлекаем полученные данные в цикле for
- for key in ["g","e", "a", "n", "o", "r", "i"]:
- if key in res_data["rows"][0]:
- company_details.append(res_data["rows"][0][key])
- else:
- company_details.append("")
- csv_write("data.csv", company_details) #запись полученых данных
- except:
- print("Error")
- time.sleep(1) # задержка после запроса в секундах
- # break
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement