nnagel

dataset_schema

Sep 30th, 2025
3
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. {
  2.     "actorSpecification": 1,
  3.     "title": "German Imprint Scraper Dataset",
  4.     "description": "",
  5.     "fields": {
  6.       "$schema": "http://json-schema.org/draft-07/schema#",
  7.       "type": "object",
  8.       "properties": {
  9.         "imprintUrl": {
  10.           "type": "string",
  11.           "description": "Found impressum page URL"
  12.         },
  13.         "contact_person": {
  14.           "type": "object",
  15.           "properties": {
  16.             "vorname": {
  17.               "type": "string",
  18.               "description": "First name of the contact person"
  19.             },
  20.             "nachname": {
  21.               "type": "string",
  22.               "description": "Last name of the contact person"
  23.             },
  24.             "anrede": {
  25.               "type": "string",
  26.               "description": "Salutation (Herr/Frau)"
  27.             }
  28.           },
  29.           "required": ["vorname", "nachname", "anrede"]
  30.         },
  31.         "company_name": {
  32.           "type": "string",
  33.           "description": "Full official company name"
  34.         },
  35.         "company_address": {
  36.           "type": "object",
  37.           "properties": {
  38.             "street": {
  39.               "type": "string",
  40.               "description": "Street name"
  41.             },
  42.             "house_number": {
  43.               "type": "string",
  44.               "description": "House number"
  45.             },
  46.             "postalcode": {
  47.               "type": "string",
  48.               "description": "Postal code"
  49.             },
  50.             "city": {
  51.               "type": "string",
  52.               "description": "City name"
  53.             }
  54.           },
  55.           "required": ["street", "house_number", "postalcode", "city"]
  56.         },
  57.         "phone_number": {
  58.           "type": "string",
  59.           "description": "Contact phone number"
  60.         },
  61.         "email": {
  62.           "type": "string",
  63.           "description": "Contact email address"
  64.         },
  65.         "register_number": {
  66.           "type": "string",
  67.           "description": "Commercial register number (e.g., HRB 12345)"
  68.         },
  69.         "vat_id": {
  70.           "type": "string",
  71.           "description": "VAT ID number (e.g., DE123456789)"
  72.         }
  73.       },
  74.       "required": ["imprintUrl", "contact_person", "company_name", "company_address", "phone_number", "email", "register_number", "vat_id"]
  75.     },
  76.     "views": {
  77.       "overview": {
  78.         "title": "Overview",
  79.         "transformation": {
  80.           "fields": [
  81.             "imprintUrl",
  82.             "company_name",
  83.             "contact_person.vorname",
  84.             "contact_person.nachname",
  85.             "contact_person.anrede",
  86.             "company_address.street",
  87.             "company_address.house_number",
  88.             "company_address.postalcode",
  89.             "company_address.city",
  90.             "phone_number",
  91.             "email",
  92.             "register_number",
  93.             "vat_id"
  94.           ],
  95.           "flatten": ["contact_person", "company_address"]
  96.         },
  97.         "display": {
  98.           "component": "table",
  99.           "properties": {
  100.             "imprintUrl": {
  101.               "label": "Imprint URL",
  102.               "format": "link"
  103.             },
  104.             "company_name": {
  105.               "label": "Company Name",
  106.               "format": "text"
  107.             },
  108.             "contact_person.vorname": {
  109.               "label": "First Name",
  110.               "format": "text"
  111.             },
  112.             "contact_person.nachname": {
  113.               "label": "Last Name",
  114.               "format": "text"
  115.             },
  116.             "contact_person.anrede": {
  117.               "label": "Salutation",
  118.               "format": "text"
  119.             },
  120.             "company_address.street": {
  121.               "label": "Street",
  122.               "format": "text"
  123.             },
  124.             "company_address.house_number": {
  125.               "label": "House Number",
  126.               "format": "text"
  127.             },
  128.             "company_address.postalcode": {
  129.               "label": "Postal Code",
  130.               "format": "text"
  131.             },
  132.             "company_address.city": {
  133.               "label": "City",
  134.               "format": "text"
  135.             },
  136.             "phone_number": {
  137.               "label": "Phone",
  138.               "format": "text"
  139.             },
  140.             "email": {
  141.               "label": "Email",
  142.               "format": "link"
  143.             },
  144.             "register_number": {
  145.               "label": "Register Number",
  146.               "format": "text"
  147.             },
  148.             "vat_id": {
  149.               "label": "VAT ID",
  150.               "format": "text"
  151.             }
  152.           }
  153.         }
  154.       }
  155.     }
  156.   }
Advertisement
Add Comment
Please, Sign In to add comment