daily pastebin goal
41%
SHARE
TWEET

Untitled

a guest May 17th, 2018 92 Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. {
  2.  "cells": [
  3.   {
  4.    "cell_type": "markdown",
  5.    "metadata": {},
  6.    "source": [
  7.     "## 고객 별로 쌓여있는 데이터"
  8.    ]
  9.   },
  10.   {
  11.    "cell_type": "code",
  12.    "execution_count": 4,
  13.    "metadata": {},
  14.    "outputs": [
  15.     {
  16.      "name": "stdout",
  17.      "output_type": "stream",
  18.      "text": [
  19.       "(11162, 17)\n"
  20.      ]
  21.     },
  22.     {
  23.      "data": {
  24.       "text/html": [
  25.        "<div>\n",
  26.        "<style scoped>\n",
  27.        "    .dataframe tbody tr th:only-of-type {\n",
  28.        "        vertical-align: middle;\n",
  29.        "    }\n",
  30.        "\n",
  31.        "    .dataframe tbody tr th {\n",
  32.        "        vertical-align: top;\n",
  33.        "    }\n",
  34.        "\n",
  35.        "    .dataframe thead th {\n",
  36.        "        text-align: right;\n",
  37.        "    }\n",
  38.        "</style>\n",
  39.        "<table border=\"1\" class=\"dataframe\">\n",
  40.        "  <thead>\n",
  41.        "    <tr style=\"text-align: right;\">\n",
  42.        "      <th></th>\n",
  43.        "      <th>age</th>\n",
  44.        "      <th>job</th>\n",
  45.        "      <th>marital</th>\n",
  46.        "      <th>education</th>\n",
  47.        "      <th>default</th>\n",
  48.        "      <th>balance</th>\n",
  49.        "      <th>housing</th>\n",
  50.        "      <th>loan</th>\n",
  51.        "      <th>contact</th>\n",
  52.        "      <th>day</th>\n",
  53.        "      <th>month</th>\n",
  54.        "      <th>duration</th>\n",
  55.        "      <th>campaign</th>\n",
  56.        "      <th>pdays</th>\n",
  57.        "      <th>previous</th>\n",
  58.        "      <th>poutcome</th>\n",
  59.        "      <th>deposit</th>\n",
  60.        "    </tr>\n",
  61.        "  </thead>\n",
  62.        "  <tbody>\n",
  63.        "    <tr>\n",
  64.        "      <th>0</th>\n",
  65.        "      <td>59</td>\n",
  66.        "      <td>admin.</td>\n",
  67.        "      <td>married</td>\n",
  68.        "      <td>secondary</td>\n",
  69.        "      <td>no</td>\n",
  70.        "      <td>2343</td>\n",
  71.        "      <td>yes</td>\n",
  72.        "      <td>no</td>\n",
  73.        "      <td>unknown</td>\n",
  74.        "      <td>5</td>\n",
  75.        "      <td>may</td>\n",
  76.        "      <td>1042</td>\n",
  77.        "      <td>1</td>\n",
  78.        "      <td>-1</td>\n",
  79.        "      <td>0</td>\n",
  80.        "      <td>unknown</td>\n",
  81.        "      <td>yes</td>\n",
  82.        "    </tr>\n",
  83.        "    <tr>\n",
  84.        "      <th>1</th>\n",
  85.        "      <td>56</td>\n",
  86.        "      <td>admin.</td>\n",
  87.        "      <td>married</td>\n",
  88.        "      <td>secondary</td>\n",
  89.        "      <td>no</td>\n",
  90.        "      <td>45</td>\n",
  91.        "      <td>no</td>\n",
  92.        "      <td>no</td>\n",
  93.        "      <td>unknown</td>\n",
  94.        "      <td>5</td>\n",
  95.        "      <td>may</td>\n",
  96.        "      <td>1467</td>\n",
  97.        "      <td>1</td>\n",
  98.        "      <td>-1</td>\n",
  99.        "      <td>0</td>\n",
  100.        "      <td>unknown</td>\n",
  101.        "      <td>yes</td>\n",
  102.        "    </tr>\n",
  103.        "    <tr>\n",
  104.        "      <th>2</th>\n",
  105.        "      <td>41</td>\n",
  106.        "      <td>technician</td>\n",
  107.        "      <td>married</td>\n",
  108.        "      <td>secondary</td>\n",
  109.        "      <td>no</td>\n",
  110.        "      <td>1270</td>\n",
  111.        "      <td>yes</td>\n",
  112.        "      <td>no</td>\n",
  113.        "      <td>unknown</td>\n",
  114.        "      <td>5</td>\n",
  115.        "      <td>may</td>\n",
  116.        "      <td>1389</td>\n",
  117.        "      <td>1</td>\n",
  118.        "      <td>-1</td>\n",
  119.        "      <td>0</td>\n",
  120.        "      <td>unknown</td>\n",
  121.        "      <td>yes</td>\n",
  122.        "    </tr>\n",
  123.        "    <tr>\n",
  124.        "      <th>3</th>\n",
  125.        "      <td>55</td>\n",
  126.        "      <td>services</td>\n",
  127.        "      <td>married</td>\n",
  128.        "      <td>secondary</td>\n",
  129.        "      <td>no</td>\n",
  130.        "      <td>2476</td>\n",
  131.        "      <td>yes</td>\n",
  132.        "      <td>no</td>\n",
  133.        "      <td>unknown</td>\n",
  134.        "      <td>5</td>\n",
  135.        "      <td>may</td>\n",
  136.        "      <td>579</td>\n",
  137.        "      <td>1</td>\n",
  138.        "      <td>-1</td>\n",
  139.        "      <td>0</td>\n",
  140.        "      <td>unknown</td>\n",
  141.        "      <td>yes</td>\n",
  142.        "    </tr>\n",
  143.        "    <tr>\n",
  144.        "      <th>4</th>\n",
  145.        "      <td>54</td>\n",
  146.        "      <td>admin.</td>\n",
  147.        "      <td>married</td>\n",
  148.        "      <td>tertiary</td>\n",
  149.        "      <td>no</td>\n",
  150.        "      <td>184</td>\n",
  151.        "      <td>no</td>\n",
  152.        "      <td>no</td>\n",
  153.        "      <td>unknown</td>\n",
  154.        "      <td>5</td>\n",
  155.        "      <td>may</td>\n",
  156.        "      <td>673</td>\n",
  157.        "      <td>2</td>\n",
  158.        "      <td>-1</td>\n",
  159.        "      <td>0</td>\n",
  160.        "      <td>unknown</td>\n",
  161.        "      <td>yes</td>\n",
  162.        "    </tr>\n",
  163.        "  </tbody>\n",
  164.        "</table>\n",
  165.        "</div>"
  166.       ],
  167.       "text/plain": [
  168.        "   age         job  marital  education default  balance housing loan  contact  \\\n",
  169.        "0   59      admin.  married  secondary      no     2343     yes   no  unknown   \n",
  170.        "1   56      admin.  married  secondary      no       45      no   no  unknown   \n",
  171.        "2   41  technician  married  secondary      no     1270     yes   no  unknown   \n",
  172.        "3   55    services  married  secondary      no     2476     yes   no  unknown   \n",
  173.        "4   54      admin.  married   tertiary      no      184      no   no  unknown   \n",
  174.        "\n",
  175.        "   day month  duration  campaign  pdays  previous poutcome deposit  \n",
  176.        "0    5   may      1042         1     -1         0  unknown     yes  \n",
  177.        "1    5   may      1467         1     -1         0  unknown     yes  \n",
  178.        "2    5   may      1389         1     -1         0  unknown     yes  \n",
  179.        "3    5   may       579         1     -1         0  unknown     yes  \n",
  180.        "4    5   may       673         2     -1         0  unknown     yes  "
  181.       ]
  182.      },
  183.      "execution_count": 4,
  184.      "metadata": {},
  185.      "output_type": "execute_result"
  186.     }
  187.    ],
  188.    "source": [
  189.     "import pandas as pd\n",
  190.     "bank = pd.read_csv(\"./bank.csv\", sep = \",\", error_bad_lines = False, header = 0)\n",
  191.     "print(bank.shape)\n",
  192.     "bank.head(5)"
  193.    ]
  194.   },
  195.   {
  196.    "cell_type": "markdown",
  197.    "metadata": {},
  198.    "source": [
  199.     "## 칼럼에 대한 설명은 다음과 같아요!"
  200.    ]
  201.   },
  202.   {
  203.    "cell_type": "markdown",
  204.    "metadata": {},
  205.    "source": [
  206.     "- 1 - age: 나이\n",
  207.     "- 2 - job: 직업 (categorical: 'admin.','blue-collar','entrepreneur','housemaid','management','retired','self-employed','services','student','technician','unemployed','unknown')\n",
  208.     "- 3 - marital: 결혼여부 (categorical: 'divorced','married','single','unknown'; note: 'divorced' means divorced or widowed)\n",
  209.     "- 4 - education: 교육수준 (categorical: primary, secondary, tertiary and unknown, 뭐 고등교육이냐 등등)\n",
  210.     "- 5 - default: 이 은행명으로 신용카드 등록되어 있는지? (categorical: 'no','yes','unknown')\n",
  211.     "- 6 - housing: 이 은행에서 주택자금대출을 받았는지 (categorical: 'no','yes','unknown')\n",
  212.     "- 7 - loan: 개인신용대출이 있는지? (categorical: 'no','yes','unknown')\n",
  213.     "- 8 - balance: 이 은행명으로 계좌가 있고, 거기에 얼마나 금액이 있는지?\n",
  214.     "- 8 - contact: 권유할 때 이전에 유선전화/휴대폰 둘 중 어떤 수단으로 컨택했는지? (categorical: 'cellular','telephone') \n",
  215.     "- 9 - month: 언제 최근에 컨택했는지 (월) (categorical: 'jan', 'feb', 'mar', ..., 'nov', 'dec')\n",
  216.     "- 10 - day: 언제 최근에 컨택했는지 (일) (categorical: 'mon','tue','wed','thu','fri')\n",
  217.     "- 11 - duration: 컨택했을 때 얼마나 전화통화 길게 했는지 (초단위) Important note: this attribute highly affects the output target (e.g., if duration=0 then y='no'). Yet, the duration is not known before a call is performed. Also, after the end of the call y is obviously known. Thus, this input should only be included for benchmark purposes and should be discarded if the intention is to have a realistic predictive model.\n",
  218.     "- 12 - campaign: 뭐랄까 이 고객에 대한 마케팅 캠페인을 얼마나 진행했었는지 (그 수단이 메일이든 뭐든) (numeric, includes last contact)\n",
  219.     "- 13 - pdays: 이 고객에게 캠페인을 한지 얼마나 지났나? (일) (numeric; 999 means client was not previously contacted)\n",
  220.     "- 14 - previous: 직전 캠페인할 때 얼마나 전화컨택을 했는지 (numeric)\n",
  221.     "- 15 - poutcome: 직전 캠페인 성공여부 (categorical: 'failure','nonexistent','success')\n",
  222.     "\n",
  223.     "- (target) - y - 정기예금 그래서 가입했어? has the client subscribed a term deposit? (binary: 'yes','no')"
  224.    ]
  225.   }
  226.  ],
  227.  "metadata": {
  228.   "kernelspec": {
  229.    "display_name": "Python 3",
  230.    "language": "python",
  231.    "name": "python3"
  232.   },
  233.   "language_info": {
  234.    "codemirror_mode": {
  235.     "name": "ipython",
  236.     "version": 3
  237.    },
  238.    "file_extension": ".py",
  239.    "mimetype": "text/x-python",
  240.    "name": "python",
  241.    "nbconvert_exporter": "python",
  242.    "pygments_lexer": "ipython3",
  243.    "version": "3.5.4"
  244.   }
  245.  },
  246.  "nbformat": 4,
  247.  "nbformat_minor": 2
  248. }
RAW Paste Data
We use cookies for various purposes including analytics. By continuing to use Pastebin, you agree to our use of cookies as described in the Cookies Policy. OK, I Understand
 
Top