SHARE
TWEET

Untitled

a guest Mar 25th, 2019 202 Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. {
  2.  "cells": [
  3.   {
  4.    "cell_type": "markdown",
  5.    "metadata": {},
  6.    "source": [
  7.     "# Problem Statement :\n",
  8.     "-------------\n",
  9.     "\n",
  10.     "The Indian Premier League (IPL) is a professional league for Twenty20 cricket championship in India.\n",
  11.     "It started in the year 2007-2008 and is running in its ninth year of existence.\n",
  12.     "The pattern of the league is such that each team plays all other teams twice in the league stage, one in the HOME venue and other in the AWAY venue. \n",
  13.     "After the league stage top four teams enter the semi-final stage and the top two teams enter the final contest.\n",
  14.     "\n",
  15.     "\n",
  16.     "## Objective\n",
  17.     "---------\n",
  18.     "The goal of the contest is to develop a model to predict likelihood of a team winning the match. \n",
  19.     "The true label of which team (team batting first or second) won the match is provided as “Team Won”. See data dictionary for more explanation.\n",
  20.     " \n",
  21.     "\n",
  22.     "## Dataset\n",
  23.     "-------\n",
  24.     "Dataset on all match statistics plus some derived features from season 2008 to 2012 is provided as an attachment supported by a data \n",
  25.     "dictionary for the same.\n",
  26.     "The training dataset contains match statistics from 2008 to 2011 season. And the test dataset contains match statistics from 2012 season. \n",
  27.     "\n",
  28.     "-- train data : train.csv <br/>\n",
  29.     "-- test data  : test.csv<br/>\n",
  30.     "-- data dictionary : data_dictionary.xlsx\n",
  31.     "\n",
  32.     "## Expectations\n",
  33.     "------------\n",
  34.     "\n",
  35.     "We are looking for prediction of a team (either Team 1 or Team 2) winning the match & probability score for the team winning the game.\n"
  36.    ]
  37.   },
  38.   {
  39.    "cell_type": "markdown",
  40.    "metadata": {},
  41.    "source": [
  42.     "## Solution/Approach\n",
  43.     "#### Steps\n",
  44.     "1. Reading csv/xlsx etc file and then checking dimension,few rows to know little about data etc and merging the train and test datasets\n",
  45.     "2. Variable identification to know about <b>continuous or categorical in nature</b>\n",
  46.     "3. Univariate analysis<br/>\n",
  47.     "    A. Continuous Variables<br/>\n",
  48.     "    Tabular and graphical method is used to know about <b>mean,median,mode,missing values,Q1,Q3,skewness,outliers</b> etc\n",
  49.     "    \n",
  50.     "    B. Categorical Variables<br/>\n",
  51.     "    Tabular and graphical method is used to know about number of times each value occuring in that particular column<br/>\n",
  52.     "    <br/>\n",
  53.     "4. Bivariate analysis<br/>\n",
  54.     "    Tabular and graphical method is used to know about relation between continuous-continuous variables using            \n",
  55.     "    <b>correlation</b>,categorical-continuous variables using bar plot.\n",
  56.     "5. Outliers Treatment:<br/>\n",
  57.     "    Using <b>box plot</b>, i am able to find outliers then using <b>Q1-1.5(Q3-Q1)</b> and <b>Q3+1.5(Q3-Q1)</b> , i am replacing     that outliers with median.\n",
  58.     "6. Variable Transormation:<br/>\n",
  59.     "    Using LabelEncoder from sckikit learn ,transforming categorical varaibles into numerical form. \n",
  60.     "    \n",
  61.     "7. Modeling:<br/>\n",
  62.     "   a.Separating indepedent and dependent variable from our data set<br/><br/>\n",
  63.     "   <b>7.1 Bagging and Boosting Techniques (Accuracy : 86%)</b><br/>\n",
  64.     "   <b>7.2 Logistic Regression(Accuracy : 93%)</b><br/>\n",
  65.     "   <b>7.3 Neural Network(Accuracy : 84%)</b><br/>\n",
  66.     "   \n",
  67.     "   b.Predicting the value for each of the above techniques and maximum likelihood<br/>\n",
  68.     "   c.Finally compare the <b>accuracy</b> of each of the model.<br/>\n",
  69.     "   d.<b>I had included two new columns(my_prediction,likelihood_winning) in test dataset to compare from original values.</b>"
  70.    ]
  71.   },
  72.   {
  73.    "cell_type": "markdown",
  74.    "metadata": {},
  75.    "source": [
  76.     "# 1. Exploring the dataset :"
  77.    ]
  78.   },
  79.   {
  80.    "cell_type": "code",
  81.    "execution_count": 253,
  82.    "metadata": {},
  83.    "outputs": [],
  84.    "source": [
  85.     "# importing common use libraries\n",
  86.     "\n",
  87.     "import pandas as pd\n",
  88.     "import numpy as np\n",
  89.     "import matplotlib.pyplot as plt\n",
  90.     "import seaborn as sns\n",
  91.     "%matplotlib inline\n",
  92.     "\n",
  93.     "import warnings\n",
  94.     "warnings.filterwarnings(\"ignore\")"
  95.    ]
  96.   },
  97.   {
  98.    "cell_type": "code",
  99.    "execution_count": 254,
  100.    "metadata": {},
  101.    "outputs": [
  102.     {
  103.      "data": {
  104.       "text/html": [
  105.        "<div>\n",
  106.        "<style scoped>\n",
  107.        "    .dataframe tbody tr th:only-of-type {\n",
  108.        "        vertical-align: middle;\n",
  109.        "    }\n",
  110.        "\n",
  111.        "    .dataframe tbody tr th {\n",
  112.        "        vertical-align: top;\n",
  113.        "    }\n",
  114.        "\n",
  115.        "    .dataframe thead th {\n",
  116.        "        text-align: right;\n",
  117.        "    }\n",
  118.        "</style>\n",
  119.        "<table border=\"1\" class=\"dataframe\">\n",
  120.        "  <thead>\n",
  121.        "    <tr style=\"text-align: right;\">\n",
  122.        "      <th></th>\n",
  123.        "      <th>Variable Name</th>\n",
  124.        "      <th>Description</th>\n",
  125.        "      <th>Cricketing Jargons</th>\n",
  126.        "    </tr>\n",
  127.        "  </thead>\n",
  128.        "  <tbody>\n",
  129.        "    <tr>\n",
  130.        "      <th>0</th>\n",
  131.        "      <td>Team 1</td>\n",
  132.        "      <td>Team batting first and bowling second</td>\n",
  133.        "      <td>NaN</td>\n",
  134.        "    </tr>\n",
  135.        "    <tr>\n",
  136.        "      <th>1</th>\n",
  137.        "      <td>Team 2</td>\n",
  138.        "      <td>Team batting second and bowling first</td>\n",
  139.        "      <td>Bowled\\na mode of a batsman's dismissal. Occur...</td>\n",
  140.        "    </tr>\n",
  141.        "    <tr>\n",
  142.        "      <th>2</th>\n",
  143.        "      <td>City of match</td>\n",
  144.        "      <td>City where the match is played</td>\n",
  145.        "      <td>Catch\\nto dismiss a batsman by a fielder catch...</td>\n",
  146.        "    </tr>\n",
  147.        "    <tr>\n",
  148.        "      <th>3</th>\n",
  149.        "      <td>Day</td>\n",
  150.        "      <td>Day of the week when the match is played</td>\n",
  151.        "      <td>Run out\\ndismissal by a member of the fielding...</td>\n",
  152.        "    </tr>\n",
  153.        "    <tr>\n",
  154.        "      <th>4</th>\n",
  155.        "      <td>Date of Match</td>\n",
  156.        "      <td>Date of the year when the match is played</td>\n",
  157.        "      <td>Leg before wicket (LBW)\\na way of dismissing t...</td>\n",
  158.        "    </tr>\n",
  159.        "    <tr>\n",
  160.        "      <th>5</th>\n",
  161.        "      <td>Time of Match</td>\n",
  162.        "      <td>Time of the day when the match is played</td>\n",
  163.        "      <td>Stumping: It requires co-operation between a b...</td>\n",
  164.        "    </tr>\n",
  165.        "    <tr>\n",
  166.        "      <th>6</th>\n",
  167.        "      <td>Avg Wind Speed</td>\n",
  168.        "      <td>Average speed of the wind on the day when the ...</td>\n",
  169.        "      <td>Strike rate\\n percentage equal to the number o...</td>\n",
  170.        "    </tr>\n",
  171.        "    <tr>\n",
  172.        "      <th>7</th>\n",
  173.        "      <td>Avg Humidity</td>\n",
  174.        "      <td>Average humidity on the day when the match is ...</td>\n",
  175.        "      <td>Innings\\none player's or one team's turn to ba...</td>\n",
  176.        "    </tr>\n",
  177.        "    <tr>\n",
  178.        "      <th>8</th>\n",
  179.        "      <td>Inn 1 Team 1 NOP R>25,SR>125</td>\n",
  180.        "      <td>NoP(Number of players) in Team 1 that scored m...</td>\n",
  181.        "      <td>Spin bowling\\na style of bowling in which a sp...</td>\n",
  182.        "    </tr>\n",
  183.        "    <tr>\n",
  184.        "      <th>9</th>\n",
  185.        "      <td>Inn 1 Team 1 NOP R<25, SR>125</td>\n",
  186.        "      <td>NoP(Number of players) in Team 1 that scored l...</td>\n",
  187.        "      <td>NaN</td>\n",
  188.        "    </tr>\n",
  189.        "    <tr>\n",
  190.        "      <th>10</th>\n",
  191.        "      <td>Inn 1 Team 1 Total 4s</td>\n",
  192.        "      <td>Total Number of 4s hit by Team 1 in the first ...</td>\n",
  193.        "      <td>NaN</td>\n",
  194.        "    </tr>\n",
  195.        "    <tr>\n",
  196.        "      <th>11</th>\n",
  197.        "      <td>Inn 1 Team 1 Total 6s</td>\n",
  198.        "      <td>Total Number of 6s hit by Team 1 in the first ...</td>\n",
  199.        "      <td>NaN</td>\n",
  200.        "    </tr>\n",
  201.        "    <tr>\n",
  202.        "      <th>12</th>\n",
  203.        "      <td>Inn 1 Team 1 Max Strike Rate_ALLBatsmen</td>\n",
  204.        "      <td>Maximum strike rate achieved including all bat...</td>\n",
  205.        "      <td>NaN</td>\n",
  206.        "    </tr>\n",
  207.        "    <tr>\n",
  208.        "      <th>13</th>\n",
  209.        "      <td>Inn 1 Team 2 NoP fast bowlers</td>\n",
  210.        "      <td>NoP(Number of players) in Team 2 who are fast ...</td>\n",
  211.        "      <td>NaN</td>\n",
  212.        "    </tr>\n",
  213.        "    <tr>\n",
  214.        "      <th>14</th>\n",
  215.        "      <td>Inn 1 Team 2 NoP Spinners</td>\n",
  216.        "      <td>NoP(Number of players) in Team 2 who are spinn...</td>\n",
  217.        "      <td>NaN</td>\n",
  218.        "    </tr>\n",
  219.        "    <tr>\n",
  220.        "      <th>15</th>\n",
  221.        "      <td>Inn 1 Team 2 wickets taken_catches_runout</td>\n",
  222.        "      <td>Number of wickets taken by Team 2 in the first...</td>\n",
  223.        "      <td>NaN</td>\n",
  224.        "    </tr>\n",
  225.        "    <tr>\n",
  226.        "      <th>16</th>\n",
  227.        "      <td>Inn1 Team 2 wickets taken_ bowled _lbw_caught ...</td>\n",
  228.        "      <td>Number of wickets taken by Team 2 in the first...</td>\n",
  229.        "      <td>NaN</td>\n",
  230.        "    </tr>\n",
  231.        "    <tr>\n",
  232.        "      <th>17</th>\n",
  233.        "      <td>Inn 1 Team 2 Extras conceded in_wides_No Balls</td>\n",
  234.        "      <td>Total Number Extra runs conceded by Team 2 in ...</td>\n",
  235.        "      <td>NaN</td>\n",
  236.        "    </tr>\n",
  237.        "    <tr>\n",
  238.        "      <th>18</th>\n",
  239.        "      <td>Inn 2 Team 2 NOP R>25,SR>125</td>\n",
  240.        "      <td>NoP(Number of players) in Team 2 that scored m...</td>\n",
  241.        "      <td>NaN</td>\n",
  242.        "    </tr>\n",
  243.        "    <tr>\n",
  244.        "      <th>19</th>\n",
  245.        "      <td>Inn 2 Team 2 NOP R<25, SR>125</td>\n",
  246.        "      <td>NoP(Number of players) in Team 2 that scored l...</td>\n",
  247.        "      <td>NaN</td>\n",
  248.        "    </tr>\n",
  249.        "    <tr>\n",
  250.        "      <th>20</th>\n",
  251.        "      <td>Inn 2 Team 2 Total 4s</td>\n",
  252.        "      <td>Total Number of 4s hit by Team 2 in the second...</td>\n",
  253.        "      <td>NaN</td>\n",
  254.        "    </tr>\n",
  255.        "    <tr>\n",
  256.        "      <th>21</th>\n",
  257.        "      <td>Inn 2 Team 2 Total 6s</td>\n",
  258.        "      <td>Total Number of 6s hit by Team 2 in the second...</td>\n",
  259.        "      <td>NaN</td>\n",
  260.        "    </tr>\n",
  261.        "    <tr>\n",
  262.        "      <th>22</th>\n",
  263.        "      <td>Inn 2 Team 2 Max Strike Rate_ALLBatsmen</td>\n",
  264.        "      <td>Maximum strike rate achieved including all bat...</td>\n",
  265.        "      <td>NaN</td>\n",
  266.        "    </tr>\n",
  267.        "    <tr>\n",
  268.        "      <th>23</th>\n",
  269.        "      <td>Inn 2 Team 1 NoP fast bowlers</td>\n",
  270.        "      <td>NoP(Number of players) in Team 1 who are fast ...</td>\n",
  271.        "      <td>NaN</td>\n",
  272.        "    </tr>\n",
  273.        "    <tr>\n",
  274.        "      <th>24</th>\n",
  275.        "      <td>Inn 2 Team 1 NoP Spinners</td>\n",
  276.        "      <td>NoP(Number of players) in Team 1 who are spinn...</td>\n",
  277.        "      <td>NaN</td>\n",
  278.        "    </tr>\n",
  279.        "    <tr>\n",
  280.        "      <th>25</th>\n",
  281.        "      <td>Inn 2 Team 1 wickets taken_catches_runout</td>\n",
  282.        "      <td>Number of wickets taken by Team 1 in the secon...</td>\n",
  283.        "      <td>NaN</td>\n",
  284.        "    </tr>\n",
  285.        "    <tr>\n",
  286.        "      <th>26</th>\n",
  287.        "      <td>Inn 2 Team 1 wickets taken_ bowled _lbw_caught...</td>\n",
  288.        "      <td>Number of wickets taken by Team 1 in the secon...</td>\n",
  289.        "      <td>NaN</td>\n",
  290.        "    </tr>\n",
  291.        "    <tr>\n",
  292.        "      <th>27</th>\n",
  293.        "      <td>Inn 2 Team 1 Extras conceded in_wides_No Balls</td>\n",
  294.        "      <td>Total Number Extra runs conceded by Team 1 in ...</td>\n",
  295.        "      <td>NaN</td>\n",
  296.        "    </tr>\n",
  297.        "    <tr>\n",
  298.        "      <th>28</th>\n",
  299.        "      <td>Team won (team 1=1, team 2=0)</td>\n",
  300.        "      <td>If Team batting first i.e. Team1 won the match...</td>\n",
  301.        "      <td>NaN</td>\n",
  302.        "    </tr>\n",
  303.        "  </tbody>\n",
  304.        "</table>\n",
  305.        "</div>"
  306.       ],
  307.       "text/plain": [
  308.        "                                        Variable Name  \\\n",
  309.        "0                                              Team 1   \n",
  310.        "1                                              Team 2   \n",
  311.        "2                                       City of match   \n",
  312.        "3                                                 Day   \n",
  313.        "4                                       Date of Match   \n",
  314.        "5                                       Time of Match   \n",
  315.        "6                                      Avg Wind Speed   \n",
  316.        "7                                        Avg Humidity   \n",
  317.        "8                        Inn 1 Team 1 NOP R>25,SR>125   \n",
  318.        "9                       Inn 1 Team 1 NOP R<25, SR>125   \n",
  319.        "10                              Inn 1 Team 1 Total 4s   \n",
  320.        "11                              Inn 1 Team 1 Total 6s   \n",
  321.        "12            Inn 1 Team 1 Max Strike Rate_ALLBatsmen   \n",
  322.        "13                      Inn 1 Team 2 NoP fast bowlers   \n",
  323.        "14                          Inn 1 Team 2 NoP Spinners   \n",
  324.        "15          Inn 1 Team 2 wickets taken_catches_runout   \n",
  325.        "16  Inn1 Team 2 wickets taken_ bowled _lbw_caught ...   \n",
  326.        "17     Inn 1 Team 2 Extras conceded in_wides_No Balls   \n",
  327.        "18                       Inn 2 Team 2 NOP R>25,SR>125   \n",
  328.        "19                      Inn 2 Team 2 NOP R<25, SR>125   \n",
  329.        "20                              Inn 2 Team 2 Total 4s   \n",
  330.        "21                              Inn 2 Team 2 Total 6s   \n",
  331.        "22            Inn 2 Team 2 Max Strike Rate_ALLBatsmen   \n",
  332.        "23                      Inn 2 Team 1 NoP fast bowlers   \n",
  333.        "24                          Inn 2 Team 1 NoP Spinners   \n",
  334.        "25          Inn 2 Team 1 wickets taken_catches_runout   \n",
  335.        "26  Inn 2 Team 1 wickets taken_ bowled _lbw_caught...   \n",
  336.        "27     Inn 2 Team 1 Extras conceded in_wides_No Balls   \n",
  337.        "28                      Team won (team 1=1, team 2=0)   \n",
  338.        "\n",
  339.        "                                          Description  \\\n",
  340.        "0               Team batting first and bowling second   \n",
  341.        "1               Team batting second and bowling first   \n",
  342.        "2                      City where the match is played   \n",
  343.        "3            Day of the week when the match is played   \n",
  344.        "4           Date of the year when the match is played   \n",
  345.        "5            Time of the day when the match is played   \n",
  346.        "6   Average speed of the wind on the day when the ...   \n",
  347.        "7   Average humidity on the day when the match is ...   \n",
  348.        "8   NoP(Number of players) in Team 1 that scored m...   \n",
  349.        "9   NoP(Number of players) in Team 1 that scored l...   \n",
  350.        "10  Total Number of 4s hit by Team 1 in the first ...   \n",
  351.        "11  Total Number of 6s hit by Team 1 in the first ...   \n",
  352.        "12  Maximum strike rate achieved including all bat...   \n",
  353.        "13  NoP(Number of players) in Team 2 who are fast ...   \n",
  354.        "14  NoP(Number of players) in Team 2 who are spinn...   \n",
  355.        "15  Number of wickets taken by Team 2 in the first...   \n",
  356.        "16  Number of wickets taken by Team 2 in the first...   \n",
  357.        "17  Total Number Extra runs conceded by Team 2 in ...   \n",
  358.        "18  NoP(Number of players) in Team 2 that scored m...   \n",
  359.        "19  NoP(Number of players) in Team 2 that scored l...   \n",
  360.        "20  Total Number of 4s hit by Team 2 in the second...   \n",
  361.        "21  Total Number of 6s hit by Team 2 in the second...   \n",
  362.        "22  Maximum strike rate achieved including all bat...   \n",
  363.        "23  NoP(Number of players) in Team 1 who are fast ...   \n",
  364.        "24  NoP(Number of players) in Team 1 who are spinn...   \n",
  365.        "25  Number of wickets taken by Team 1 in the secon...   \n",
  366.        "26  Number of wickets taken by Team 1 in the secon...   \n",
  367.        "27  Total Number Extra runs conceded by Team 1 in ...   \n",
  368.        "28  If Team batting first i.e. Team1 won the match...   \n",
  369.        "\n",
  370.        "                                   Cricketing Jargons  \n",
  371.        "0                                                 NaN  \n",
  372.        "1   Bowled\\na mode of a batsman's dismissal. Occur...  \n",
  373.        "2   Catch\\nto dismiss a batsman by a fielder catch...  \n",
  374.        "3   Run out\\ndismissal by a member of the fielding...  \n",
  375.        "4   Leg before wicket (LBW)\\na way of dismissing t...  \n",
  376.        "5   Stumping: It requires co-operation between a b...  \n",
  377.        "6   Strike rate\\n percentage equal to the number o...  \n",
  378.        "7   Innings\\none player's or one team's turn to ba...  \n",
  379.        "8   Spin bowling\\na style of bowling in which a sp...  \n",
  380.        "9                                                 NaN  \n",
  381.        "10                                                NaN  \n",
  382.        "11                                                NaN  \n",
  383.        "12                                                NaN  \n",
  384.        "13                                                NaN  \n",
  385.        "14                                                NaN  \n",
  386.        "15                                                NaN  \n",
  387.        "16                                                NaN  \n",
  388.        "17                                                NaN  \n",
  389.        "18                                                NaN  \n",
  390.        "19                                                NaN  \n",
  391.        "20                                                NaN  \n",
  392.        "21                                                NaN  \n",
  393.        "22                                                NaN  \n",
  394.        "23                                                NaN  \n",
  395.        "24                                                NaN  \n",
  396.        "25                                                NaN  \n",
  397.        "26                                                NaN  \n",
  398.        "27                                                NaN  \n",
  399.        "28                                                NaN  "
  400.       ]
  401.      },
  402.      "execution_count": 254,
  403.      "metadata": {},
  404.      "output_type": "execute_result"
  405.     }
  406.    ],
  407.    "source": [
  408.     "# importing the dataset\n",
  409.     "\n",
  410.     "train=pd.read_csv('train.csv')\n",
  411.     "test=pd.read_csv('test.csv')\n",
  412.     "data_dict=pd.read_excel('data_dictionary.xlsx')\n",
  413.     "\n",
  414.     "data_dict"
  415.    ]
  416.   },
  417.   {
  418.    "cell_type": "code",
  419.    "execution_count": 255,
  420.    "metadata": {},
  421.    "outputs": [],
  422.    "source": [
  423.     "# copying the original dataset\n",
  424.     "\n",
  425.     "train_original=train.copy()\n",
  426.     "test_original=test.copy()"
  427.    ]
  428.   },
  429.   {
  430.    "cell_type": "code",
  431.    "execution_count": 256,
  432.    "metadata": {},
  433.    "outputs": [
  434.     {
  435.      "data": {
  436.       "text/plain": [
  437.        "((252, 30), (76, 30))"
  438.       ]
  439.      },
  440.      "execution_count": 256,
  441.      "metadata": {},
  442.      "output_type": "execute_result"
  443.     }
  444.    ],
  445.    "source": [
  446.     "# checking dimension\n",
  447.     "\n",
  448.     "train.shape,test.shape"
  449.    ]
  450.   },
  451.   {
  452.    "cell_type": "code",
  453.    "execution_count": 257,
  454.    "metadata": {},
  455.    "outputs": [
  456.     {
  457.      "data": {
  458.       "text/plain": [
  459.        "['Game ID',\n",
  460.        " 'Team 1',\n",
  461.        " 'Team 2',\n",
  462.        " 'City',\n",
  463.        " 'DayOfWeek',\n",
  464.        " 'DateOfGame',\n",
  465.        " 'TimeOfGame',\n",
  466.        " 'AvgWindSpeed',\n",
  467.        " 'AvgHumidity',\n",
  468.        " 'Inn 1 Team 1 NOP R>25,SR>125',\n",
  469.        " 'Inn 1 Team 1 NOP R<25, SR>125',\n",
  470.        " 'Inn 1 Team 1 Total 4s',\n",
  471.        " 'Inn 1 Team 1 Total 6s',\n",
  472.        " 'Inn 1 Team 1 Max Strike Rate_ALLBatsmen',\n",
  473.        " 'Inn 1 Team 2 NoP fast bowlers',\n",
  474.        " 'Inn 1 Team 2 NoP Spinners',\n",
  475.        " 'Inn 1 Team 2 wickets taken_catches_runout',\n",
  476.        " 'Inn1 Team 2 wickets taken_ bowled _lbw_caught by keeper_stumping',\n",
  477.        " 'Inn 1 Team 2 Extras conceded in_wides_No Balls',\n",
  478.        " 'Inn 2 Team 2 NOP R>25,SR>125',\n",
  479.        " 'Inn 2 Team 2 NOP R<25, SR>125',\n",
  480.        " 'Inn 2 Team 2 Total 4s',\n",
  481.        " 'Inn 2 Team 2 Total 6s',\n",
  482.        " 'Inn 2 Team 2 Max Strike Rate_ALLBatsmen',\n",
  483.        " 'Inn 2 Team 1 NoP fast bowlers',\n",
  484.        " 'Inn 2 Team 1 NoP Spinners',\n",
  485.        " 'Inn 2 Team 1 wickets taken_catches_runout',\n",
  486.        " 'Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping',\n",
  487.        " 'Inn 2 Team 1 Extras conceded in_wides_No Balls',\n",
  488.        " 'Winner (team 1=1, team 2=0)']"
  489.       ]
  490.      },
  491.      "execution_count": 257,
  492.      "metadata": {},
  493.      "output_type": "execute_result"
  494.     }
  495.    ],
  496.    "source": [
  497.     "# seeing columns in train dataset\n",
  498.     "\n",
  499.     "train.columns.tolist()"
  500.    ]
  501.   },
  502.   {
  503.    "cell_type": "code",
  504.    "execution_count": 258,
  505.    "metadata": {},
  506.    "outputs": [
  507.     {
  508.      "data": {
  509.       "text/plain": [
  510.        "['Game ID',\n",
  511.        " 'Team 1',\n",
  512.        " 'Team 2',\n",
  513.        " 'CityOfGame',\n",
  514.        " 'Day',\n",
  515.        " 'DateOfGame',\n",
  516.        " 'TimeOfGame',\n",
  517.        " 'AvgWindSpeed',\n",
  518.        " 'AvgHumidity',\n",
  519.        " 'Inn 1 Team 1 NOP R>25,SR>125',\n",
  520.        " 'Inn 1 Team 1 NOP R<25, SR>125',\n",
  521.        " 'Inn 1 Team 1 Total 4s',\n",
  522.        " 'Inn 1 Team 1 Total 6s',\n",
  523.        " 'Inn 1 Team 1 Max Strike Rate_ALLBatsmen',\n",
  524.        " 'Inn 1 Team 2 NoP fast bowlers',\n",
  525.        " 'Inn 1 Team 2 NoP Spinners',\n",
  526.        " 'Inn 1 Team 2 wickets taken_catches_runout',\n",
  527.        " 'Inn1 Team 2 wickets taken_ bowled _lbw_caught by keeper_stumping',\n",
  528.        " 'Inn 1 Team 2 Extras conceded in_wides_No Balls',\n",
  529.        " 'Inn 2 Team 2 NOP R>25,SR>125',\n",
  530.        " 'Inn 2 Team 2 NOP R<25, SR>125',\n",
  531.        " 'Inn 2 Team 2 Total 4s',\n",
  532.        " 'Inn 2 Team 2 Total 6s',\n",
  533.        " 'Inn 2 Team 2 Max Strike Rate_ALLBatsmen',\n",
  534.        " 'Inn 2 Team 1 NoP fast bowlers',\n",
  535.        " 'Inn 2 Team 1 NoP Spinners',\n",
  536.        " 'Inn 2 Team 1 wickets taken_catches_runout',\n",
  537.        " 'Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping',\n",
  538.        " 'Inn 2 Team 1 Extras conceded in_wides_No Balls',\n",
  539.        " 'Winner (team 1=1, team 2=0)']"
  540.       ]
  541.      },
  542.      "execution_count": 258,
  543.      "metadata": {},
  544.      "output_type": "execute_result"
  545.     }
  546.    ],
  547.    "source": [
  548.     "# seeing columns in test datset\n",
  549.     "\n",
  550.     "test.columns.tolist()"
  551.    ]
  552.   },
  553.   {
  554.    "cell_type": "code",
  555.    "execution_count": 259,
  556.    "metadata": {},
  557.    "outputs": [
  558.     {
  559.      "data": {
  560.       "text/html": [
  561.        "<div>\n",
  562.        "<style scoped>\n",
  563.        "    .dataframe tbody tr th:only-of-type {\n",
  564.        "        vertical-align: middle;\n",
  565.        "    }\n",
  566.        "\n",
  567.        "    .dataframe tbody tr th {\n",
  568.        "        vertical-align: top;\n",
  569.        "    }\n",
  570.        "\n",
  571.        "    .dataframe thead th {\n",
  572.        "        text-align: right;\n",
  573.        "    }\n",
  574.        "</style>\n",
  575.        "<table border=\"1\" class=\"dataframe\">\n",
  576.        "  <thead>\n",
  577.        "    <tr style=\"text-align: right;\">\n",
  578.        "      <th></th>\n",
  579.        "      <th>Game ID</th>\n",
  580.        "      <th>Team 1</th>\n",
  581.        "      <th>Team 2</th>\n",
  582.        "      <th>City</th>\n",
  583.        "      <th>DayOfWeek</th>\n",
  584.        "      <th>DateOfGame</th>\n",
  585.        "      <th>TimeOfGame</th>\n",
  586.        "      <th>AvgWindSpeed</th>\n",
  587.        "      <th>AvgHumidity</th>\n",
  588.        "      <th>Inn 1 Team 1 NOP R>25,SR>125</th>\n",
  589.        "      <th>...</th>\n",
  590.        "      <th>Inn 2 Team 2 NOP R<25, SR>125</th>\n",
  591.        "      <th>Inn 2 Team 2 Total 4s</th>\n",
  592.        "      <th>Inn 2 Team 2 Total 6s</th>\n",
  593.        "      <th>Inn 2 Team 2 Max Strike Rate_ALLBatsmen</th>\n",
  594.        "      <th>Inn 2 Team 1 NoP fast bowlers</th>\n",
  595.        "      <th>Inn 2 Team 1 NoP Spinners</th>\n",
  596.        "      <th>Inn 2 Team 1 wickets taken_catches_runout</th>\n",
  597.        "      <th>Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping</th>\n",
  598.        "      <th>Inn 2 Team 1 Extras conceded in_wides_No Balls</th>\n",
  599.        "      <th>Winner (team 1=1, team 2=0)</th>\n",
  600.        "    </tr>\n",
  601.        "  </thead>\n",
  602.        "  <tbody>\n",
  603.        "    <tr>\n",
  604.        "      <th>0</th>\n",
  605.        "      <td>1</td>\n",
  606.        "      <td>Koramangala Traffic Jammers</td>\n",
  607.        "      <td>Whitefield Water Loggers</td>\n",
  608.        "      <td>Whitefield</td>\n",
  609.        "      <td>1</td>\n",
  610.        "      <td>01-01-2012</td>\n",
  611.        "      <td>20:00:00</td>\n",
  612.        "      <td>6</td>\n",
  613.        "      <td>0.49</td>\n",
  614.        "      <td>1</td>\n",
  615.        "      <td>...</td>\n",
  616.        "      <td>0</td>\n",
  617.        "      <td>3</td>\n",
  618.        "      <td>3</td>\n",
  619.        "      <td>120.00</td>\n",
  620.        "      <td>5</td>\n",
  621.        "      <td>0</td>\n",
  622.        "      <td>6</td>\n",
  623.        "      <td>4</td>\n",
  624.        "      <td>11</td>\n",
  625.        "      <td>1</td>\n",
  626.        "    </tr>\n",
  627.        "    <tr>\n",
  628.        "      <th>1</th>\n",
  629.        "      <td>2</td>\n",
  630.        "      <td>Electronic City Power Savers</td>\n",
  631.        "      <td>Silkboard Slow Movers</td>\n",
  632.        "      <td>Silkboard</td>\n",
  633.        "      <td>2</td>\n",
  634.        "      <td>01-02-2012</td>\n",
  635.        "      <td>17:00:00</td>\n",
  636.        "      <td>7</td>\n",
  637.        "      <td>0.44</td>\n",
  638.        "      <td>3</td>\n",
  639.        "      <td>...</td>\n",
  640.        "      <td>2</td>\n",
  641.        "      <td>18</td>\n",
  642.        "      <td>9</td>\n",
  643.        "      <td>215.15</td>\n",
  644.        "      <td>4</td>\n",
  645.        "      <td>1</td>\n",
  646.        "      <td>4</td>\n",
  647.        "      <td>0</td>\n",
  648.        "      <td>5</td>\n",
  649.        "      <td>1</td>\n",
  650.        "    </tr>\n",
  651.        "    <tr>\n",
  652.        "      <th>2</th>\n",
  653.        "      <td>3</td>\n",
  654.        "      <td>Indranagar Pub Watchers</td>\n",
  655.        "      <td>Sarjapur Water Tankers</td>\n",
  656.        "      <td>Sarjapur</td>\n",
  657.        "      <td>3</td>\n",
  658.        "      <td>01-03-2012</td>\n",
  659.        "      <td>20:30:00</td>\n",
  660.        "      <td>11</td>\n",
  661.        "      <td>0.23</td>\n",
  662.        "      <td>2</td>\n",
  663.        "      <td>...</td>\n",
  664.        "      <td>1</td>\n",
  665.        "      <td>18</td>\n",
  666.        "      <td>1</td>\n",
  667.        "      <td>300.00</td>\n",
  668.        "      <td>3</td>\n",
  669.        "      <td>3</td>\n",
  670.        "      <td>0</td>\n",
  671.        "      <td>1</td>\n",
  672.        "      <td>10</td>\n",
  673.        "      <td>0</td>\n",
  674.        "    </tr>\n",
  675.        "    <tr>\n",
  676.        "      <th>3</th>\n",
  677.        "      <td>4</td>\n",
  678.        "      <td>Bellandur Froth Fighters</td>\n",
  679.        "      <td>Koramangala Traffic Jammers</td>\n",
  680.        "      <td>Koramangala</td>\n",
  681.        "      <td>4</td>\n",
  682.        "      <td>01-04-2012</td>\n",
  683.        "      <td>16:00:00</td>\n",
  684.        "      <td>6</td>\n",
  685.        "      <td>0.61</td>\n",
  686.        "      <td>0</td>\n",
  687.        "      <td>...</td>\n",
  688.        "      <td>0</td>\n",
  689.        "      <td>5</td>\n",
  690.        "      <td>4</td>\n",
  691.        "      <td>100.00</td>\n",
  692.        "      <td>4</td>\n",
  693.        "      <td>2</td>\n",
  694.        "      <td>3</td>\n",
  695.        "      <td>2</td>\n",
  696.        "      <td>16</td>\n",
  697.        "      <td>0</td>\n",
  698.        "    </tr>\n",
  699.        "    <tr>\n",
  700.        "      <th>4</th>\n",
  701.        "      <td>5</td>\n",
  702.        "      <td>Marathalli Chokers</td>\n",
  703.        "      <td>Whitefield Water Loggers</td>\n",
  704.        "      <td>Marathalli</td>\n",
  705.        "      <td>5</td>\n",
  706.        "      <td>01-05-2012</td>\n",
  707.        "      <td>20:00:00</td>\n",
  708.        "      <td>6</td>\n",
  709.        "      <td>0.56</td>\n",
  710.        "      <td>3</td>\n",
  711.        "      <td>...</td>\n",
  712.        "      <td>3</td>\n",
  713.        "      <td>15</td>\n",
  714.        "      <td>6</td>\n",
  715.        "      <td>205.26</td>\n",
  716.        "      <td>4</td>\n",
  717.        "      <td>2</td>\n",
  718.        "      <td>4</td>\n",
  719.        "      <td>1</td>\n",
  720.        "      <td>5</td>\n",
  721.        "      <td>0</td>\n",
  722.        "    </tr>\n",
  723.        "    <tr>\n",
  724.        "      <th>5</th>\n",
  725.        "      <td>6</td>\n",
  726.        "      <td>Silkboard Slow Movers</td>\n",
  727.        "      <td>Indranagar Pub Watchers</td>\n",
  728.        "      <td>Indranagar</td>\n",
  729.        "      <td>6</td>\n",
  730.        "      <td>01-06-2012</td>\n",
  731.        "      <td>20:00:00</td>\n",
  732.        "      <td>11</td>\n",
  733.        "      <td>0.19</td>\n",
  734.        "      <td>1</td>\n",
  735.        "      <td>...</td>\n",
  736.        "      <td>2</td>\n",
  737.        "      <td>17</td>\n",
  738.        "      <td>7</td>\n",
  739.        "      <td>155.10</td>\n",
  740.        "      <td>5</td>\n",
  741.        "      <td>1</td>\n",
  742.        "      <td>2</td>\n",
  743.        "      <td>2</td>\n",
  744.        "      <td>10</td>\n",
  745.        "      <td>0</td>\n",
  746.        "    </tr>\n",
  747.        "    <tr>\n",
  748.        "      <th>6</th>\n",
  749.        "      <td>7</td>\n",
  750.        "      <td>Bellandur Froth Fighters</td>\n",
  751.        "      <td>Sarjapur Water Tankers</td>\n",
  752.        "      <td>Bellandur</td>\n",
  753.        "      <td>7</td>\n",
  754.        "      <td>01-07-2012</td>\n",
  755.        "      <td>20:00:00</td>\n",
  756.        "      <td>8</td>\n",
  757.        "      <td>0.20</td>\n",
  758.        "      <td>1</td>\n",
  759.        "      <td>...</td>\n",
  760.        "      <td>1</td>\n",
  761.        "      <td>15</td>\n",
  762.        "      <td>6</td>\n",
  763.        "      <td>229.26</td>\n",
  764.        "      <td>3</td>\n",
  765.        "      <td>3</td>\n",
  766.        "      <td>0</td>\n",
  767.        "      <td>1</td>\n",
  768.        "      <td>7</td>\n",
  769.        "      <td>0</td>\n",
  770.        "    </tr>\n",
  771.        "    <tr>\n",
  772.        "      <th>7</th>\n",
  773.        "      <td>8</td>\n",
  774.        "      <td>Electronic City Power Savers</td>\n",
  775.        "      <td>Marathalli Chokers</td>\n",
  776.        "      <td>Electronic City</td>\n",
  777.        "      <td>1</td>\n",
  778.        "      <td>01-08-2012</td>\n",
  779.        "      <td>20:00:00</td>\n",
  780.        "      <td>5</td>\n",
  781.        "      <td>0.73</td>\n",
  782.        "      <td>3</td>\n",
  783.        "      <td>...</td>\n",
  784.        "      <td>3</td>\n",
  785.        "      <td>19</td>\n",
  786.        "      <td>8</td>\n",
  787.        "      <td>225.00</td>\n",
  788.        "      <td>4</td>\n",
  789.        "      <td>1</td>\n",
  790.        "      <td>5</td>\n",
  791.        "      <td>2</td>\n",
  792.        "      <td>8</td>\n",
  793.        "      <td>1</td>\n",
  794.        "    </tr>\n",
  795.        "    <tr>\n",
  796.        "      <th>8</th>\n",
  797.        "      <td>9</td>\n",
  798.        "      <td>Bellandur Froth Fighters</td>\n",
  799.        "      <td>Indranagar Pub Watchers</td>\n",
  800.        "      <td>Bellandur</td>\n",
  801.        "      <td>2</td>\n",
  802.        "      <td>01-09-2012</td>\n",
  803.        "      <td>20:00:00</td>\n",
  804.        "      <td>8</td>\n",
  805.        "      <td>0.20</td>\n",
  806.        "      <td>1</td>\n",
  807.        "      <td>...</td>\n",
  808.        "      <td>3</td>\n",
  809.        "      <td>18</td>\n",
  810.        "      <td>14</td>\n",
  811.        "      <td>244.44</td>\n",
  812.        "      <td>3</td>\n",
  813.        "      <td>3</td>\n",
  814.        "      <td>5</td>\n",
  815.        "      <td>2</td>\n",
  816.        "      <td>3</td>\n",
  817.        "      <td>0</td>\n",
  818.        "    </tr>\n",
  819.        "    <tr>\n",
  820.        "      <th>9</th>\n",
  821.        "      <td>10</td>\n",
  822.        "      <td>Silkboard Slow Movers</td>\n",
  823.        "      <td>Marathalli Chokers</td>\n",
  824.        "      <td>Silkboard</td>\n",
  825.        "      <td>3</td>\n",
  826.        "      <td>01-10-2012</td>\n",
  827.        "      <td>20:00:00</td>\n",
  828.        "      <td>10</td>\n",
  829.        "      <td>0.52</td>\n",
  830.        "      <td>1</td>\n",
  831.        "      <td>...</td>\n",
  832.        "      <td>2</td>\n",
  833.        "      <td>12</td>\n",
  834.        "      <td>4</td>\n",
  835.        "      <td>170.00</td>\n",
  836.        "      <td>4</td>\n",
  837.        "      <td>1</td>\n",
  838.        "      <td>5</td>\n",
  839.        "      <td>3</td>\n",
  840.        "      <td>6</td>\n",
  841.        "      <td>1</td>\n",
  842.        "    </tr>\n",
  843.        "  </tbody>\n",
  844.        "</table>\n",
  845.        "<p>10 rows × 30 columns</p>\n",
  846.        "</div>"
  847.       ],
  848.       "text/plain": [
  849.        "   Game ID                        Team 1                       Team 2  \\\n",
  850.        "0        1   Koramangala Traffic Jammers    Whitefield Water Loggers    \n",
  851.        "1        2  Electronic City Power Savers        Silkboard Slow Movers   \n",
  852.        "2        3       Indranagar Pub Watchers       Sarjapur Water Tankers   \n",
  853.        "3        4      Bellandur Froth Fighters  Koramangala Traffic Jammers   \n",
  854.        "4        5           Marathalli Chokers     Whitefield Water Loggers    \n",
  855.        "5        6         Silkboard Slow Movers      Indranagar Pub Watchers   \n",
  856.        "6        7      Bellandur Froth Fighters       Sarjapur Water Tankers   \n",
  857.        "7        8  Electronic City Power Savers          Marathalli Chokers    \n",
  858.        "8        9      Bellandur Froth Fighters      Indranagar Pub Watchers   \n",
  859.        "9       10         Silkboard Slow Movers          Marathalli Chokers    \n",
  860.        "\n",
  861.        "              City  DayOfWeek  DateOfGame TimeOfGame  AvgWindSpeed  \\\n",
  862.        "0       Whitefield          1  01-01-2012   20:00:00             6   \n",
  863.        "1        Silkboard          2  01-02-2012   17:00:00             7   \n",
  864.        "2         Sarjapur          3  01-03-2012   20:30:00            11   \n",
  865.        "3      Koramangala          4  01-04-2012   16:00:00             6   \n",
  866.        "4       Marathalli          5  01-05-2012   20:00:00             6   \n",
  867.        "5       Indranagar          6  01-06-2012   20:00:00            11   \n",
  868.        "6        Bellandur          7  01-07-2012   20:00:00             8   \n",
  869.        "7  Electronic City          1  01-08-2012   20:00:00             5   \n",
  870.        "8        Bellandur          2  01-09-2012   20:00:00             8   \n",
  871.        "9        Silkboard          3  01-10-2012   20:00:00            10   \n",
  872.        "\n",
  873.        "   AvgHumidity  Inn 1 Team 1 NOP R>25,SR>125  ...  \\\n",
  874.        "0         0.49                             1  ...   \n",
  875.        "1         0.44                             3  ...   \n",
  876.        "2         0.23                             2  ...   \n",
  877.        "3         0.61                             0  ...   \n",
  878.        "4         0.56                             3  ...   \n",
  879.        "5         0.19                             1  ...   \n",
  880.        "6         0.20                             1  ...   \n",
  881.        "7         0.73                             3  ...   \n",
  882.        "8         0.20                             1  ...   \n",
  883.        "9         0.52                             1  ...   \n",
  884.        "\n",
  885.        "   Inn 2 Team 2 NOP R<25, SR>125  Inn 2 Team 2 Total 4s  \\\n",
  886.        "0                              0                      3   \n",
  887.        "1                              2                     18   \n",
  888.        "2                              1                     18   \n",
  889.        "3                              0                      5   \n",
  890.        "4                              3                     15   \n",
  891.        "5                              2                     17   \n",
  892.        "6                              1                     15   \n",
  893.        "7                              3                     19   \n",
  894.        "8                              3                     18   \n",
  895.        "9                              2                     12   \n",
  896.        "\n",
  897.        "   Inn 2 Team 2 Total 6s  Inn 2 Team 2 Max Strike Rate_ALLBatsmen  \\\n",
  898.        "0                      3                                   120.00   \n",
  899.        "1                      9                                   215.15   \n",
  900.        "2                      1                                   300.00   \n",
  901.        "3                      4                                   100.00   \n",
  902.        "4                      6                                   205.26   \n",
  903.        "5                      7                                   155.10   \n",
  904.        "6                      6                                   229.26   \n",
  905.        "7                      8                                   225.00   \n",
  906.        "8                     14                                   244.44   \n",
  907.        "9                      4                                   170.00   \n",
  908.        "\n",
  909.        "   Inn 2 Team 1 NoP fast bowlers  Inn 2 Team 1 NoP Spinners  \\\n",
  910.        "0                              5                          0   \n",
  911.        "1                              4                          1   \n",
  912.        "2                              3                          3   \n",
  913.        "3                              4                          2   \n",
  914.        "4                              4                          2   \n",
  915.        "5                              5                          1   \n",
  916.        "6                              3                          3   \n",
  917.        "7                              4                          1   \n",
  918.        "8                              3                          3   \n",
  919.        "9                              4                          1   \n",
  920.        "\n",
  921.        "   Inn 2 Team 1 wickets taken_catches_runout  \\\n",
  922.        "0                                          6   \n",
  923.        "1                                          4   \n",
  924.        "2                                          0   \n",
  925.        "3                                          3   \n",
  926.        "4                                          4   \n",
  927.        "5                                          2   \n",
  928.        "6                                          0   \n",
  929.        "7                                          5   \n",
  930.        "8                                          5   \n",
  931.        "9                                          5   \n",
  932.        "\n",
  933.        "   Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping  \\\n",
  934.        "0                                                  4                  \n",
  935.        "1                                                  0                  \n",
  936.        "2                                                  1                  \n",
  937.        "3                                                  2                  \n",
  938.        "4                                                  1                  \n",
  939.        "5                                                  2                  \n",
  940.        "6                                                  1                  \n",
  941.        "7                                                  2                  \n",
  942.        "8                                                  2                  \n",
  943.        "9                                                  3                  \n",
  944.        "\n",
  945.        "   Inn 2 Team 1 Extras conceded in_wides_No Balls  Winner (team 1=1, team 2=0)  \n",
  946.        "0                                              11                            1  \n",
  947.        "1                                               5                            1  \n",
  948.        "2                                              10                            0  \n",
  949.        "3                                              16                            0  \n",
  950.        "4                                               5                            0  \n",
  951.        "5                                              10                            0  \n",
  952.        "6                                               7                            0  \n",
  953.        "7                                               8                            1  \n",
  954.        "8                                               3                            0  \n",
  955.        "9                                               6                            1  \n",
  956.        "\n",
  957.        "[10 rows x 30 columns]"
  958.       ]
  959.      },
  960.      "execution_count": 259,
  961.      "metadata": {},
  962.      "output_type": "execute_result"
  963.     }
  964.    ],
  965.    "source": [
  966.     "# observing values of first 10 rows\n",
  967.     "\n",
  968.     "train.head(10)"
  969.    ]
  970.   },
  971.   {
  972.    "cell_type": "code",
  973.    "execution_count": 260,
  974.    "metadata": {},
  975.    "outputs": [
  976.     {
  977.      "data": {
  978.       "text/html": [
  979.        "<div>\n",
  980.        "<style scoped>\n",
  981.        "    .dataframe tbody tr th:only-of-type {\n",
  982.        "        vertical-align: middle;\n",
  983.        "    }\n",
  984.        "\n",
  985.        "    .dataframe tbody tr th {\n",
  986.        "        vertical-align: top;\n",
  987.        "    }\n",
  988.        "\n",
  989.        "    .dataframe thead th {\n",
  990.        "        text-align: right;\n",
  991.        "    }\n",
  992.        "</style>\n",
  993.        "<table border=\"1\" class=\"dataframe\">\n",
  994.        "  <thead>\n",
  995.        "    <tr style=\"text-align: right;\">\n",
  996.        "      <th></th>\n",
  997.        "      <th>Game ID</th>\n",
  998.        "      <th>Team 1</th>\n",
  999.        "      <th>Team 2</th>\n",
  1000.        "      <th>CityOfGame</th>\n",
  1001.        "      <th>Day</th>\n",
  1002.        "      <th>DateOfGame</th>\n",
  1003.        "      <th>TimeOfGame</th>\n",
  1004.        "      <th>AvgWindSpeed</th>\n",
  1005.        "      <th>AvgHumidity</th>\n",
  1006.        "      <th>Inn 1 Team 1 NOP R>25,SR>125</th>\n",
  1007.        "      <th>...</th>\n",
  1008.        "      <th>Inn 2 Team 2 NOP R<25, SR>125</th>\n",
  1009.        "      <th>Inn 2 Team 2 Total 4s</th>\n",
  1010.        "      <th>Inn 2 Team 2 Total 6s</th>\n",
  1011.        "      <th>Inn 2 Team 2 Max Strike Rate_ALLBatsmen</th>\n",
  1012.        "      <th>Inn 2 Team 1 NoP fast bowlers</th>\n",
  1013.        "      <th>Inn 2 Team 1 NoP Spinners</th>\n",
  1014.        "      <th>Inn 2 Team 1 wickets taken_catches_runout</th>\n",
  1015.        "      <th>Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping</th>\n",
  1016.        "      <th>Inn 2 Team 1 Extras conceded in_wides_No Balls</th>\n",
  1017.        "      <th>Winner (team 1=1, team 2=0)</th>\n",
  1018.        "    </tr>\n",
  1019.        "  </thead>\n",
  1020.        "  <tbody>\n",
  1021.        "    <tr>\n",
  1022.        "      <th>0</th>\n",
  1023.        "      <td>253</td>\n",
  1024.        "      <td>Electronic City Power Savers</td>\n",
  1025.        "      <td>Marathalli Chokers</td>\n",
  1026.        "      <td>Electronic City</td>\n",
  1027.        "      <td>6</td>\n",
  1028.        "      <td>01-01-2016</td>\n",
  1029.        "      <td>20:00:00</td>\n",
  1030.        "      <td>5</td>\n",
  1031.        "      <td>0.62</td>\n",
  1032.        "      <td>1</td>\n",
  1033.        "      <td>...</td>\n",
  1034.        "      <td>0</td>\n",
  1035.        "      <td>9</td>\n",
  1036.        "      <td>5</td>\n",
  1037.        "      <td>142.85</td>\n",
  1038.        "      <td>3</td>\n",
  1039.        "      <td>3</td>\n",
  1040.        "      <td>1</td>\n",
  1041.        "      <td>1</td>\n",
  1042.        "      <td>3</td>\n",
  1043.        "      <td>0</td>\n",
  1044.        "    </tr>\n",
  1045.        "    <tr>\n",
  1046.        "      <th>1</th>\n",
  1047.        "      <td>254</td>\n",
  1048.        "      <td>Koramangala Traffic Jammers</td>\n",
  1049.        "      <td>Sarjapur Water Tankers</td>\n",
  1050.        "      <td>Koramangala</td>\n",
  1051.        "      <td>7</td>\n",
  1052.        "      <td>01-02-2016</td>\n",
  1053.        "      <td>20:00:00</td>\n",
  1054.        "      <td>6</td>\n",
  1055.        "      <td>0.66</td>\n",
  1056.        "      <td>1</td>\n",
  1057.        "      <td>...</td>\n",
  1058.        "      <td>1</td>\n",
  1059.        "      <td>8</td>\n",
  1060.        "      <td>4</td>\n",
  1061.        "      <td>210.00</td>\n",
  1062.        "      <td>3</td>\n",
  1063.        "      <td>2</td>\n",
  1064.        "      <td>1</td>\n",
  1065.        "      <td>1</td>\n",
  1066.        "      <td>1</td>\n",
  1067.        "      <td>0</td>\n",
  1068.        "    </tr>\n",
  1069.        "    <tr>\n",
  1070.        "      <th>2</th>\n",
  1071.        "      <td>255</td>\n",
  1072.        "      <td>HSR High Rent Payers</td>\n",
  1073.        "      <td>Marathalli Chokers</td>\n",
  1074.        "      <td>Marathalli</td>\n",
  1075.        "      <td>1</td>\n",
  1076.        "      <td>01-03-2016</td>\n",
  1077.        "      <td>16:00:00</td>\n",
  1078.        "      <td>5</td>\n",
  1079.        "      <td>0.64</td>\n",
  1080.        "      <td>0</td>\n",
  1081.        "      <td>...</td>\n",
  1082.        "      <td>1</td>\n",
  1083.        "      <td>8</td>\n",
  1084.        "      <td>1</td>\n",
  1085.        "      <td>166.66</td>\n",
  1086.        "      <td>4</td>\n",
  1087.        "      <td>2</td>\n",
  1088.        "      <td>2</td>\n",
  1089.        "      <td>7</td>\n",
  1090.        "      <td>4</td>\n",
  1091.        "      <td>1</td>\n",
  1092.        "    </tr>\n",
  1093.        "    <tr>\n",
  1094.        "      <th>3</th>\n",
  1095.        "      <td>256</td>\n",
  1096.        "      <td>Indranagar Pub Watchers</td>\n",
  1097.        "      <td>Silkboard Slow Movers</td>\n",
  1098.        "      <td>Indranagar</td>\n",
  1099.        "      <td>2</td>\n",
  1100.        "      <td>01-04-2016</td>\n",
  1101.        "      <td>20:00:00</td>\n",
  1102.        "      <td>5</td>\n",
  1103.        "      <td>0.64</td>\n",
  1104.        "      <td>1</td>\n",
  1105.        "      <td>...</td>\n",
  1106.        "      <td>3</td>\n",
  1107.        "      <td>14</td>\n",
  1108.        "      <td>4</td>\n",
  1109.        "      <td>166.66</td>\n",
  1110.        "      <td>2</td>\n",
  1111.        "      <td>4</td>\n",
  1112.        "      <td>6</td>\n",
  1113.        "      <td>3</td>\n",
  1114.        "      <td>2</td>\n",
  1115.        "      <td>1</td>\n",
  1116.        "    </tr>\n",
  1117.        "    <tr>\n",
  1118.        "      <th>4</th>\n",
  1119.        "      <td>257</td>\n",
  1120.        "      <td>Whitefield Water Loggers</td>\n",
  1121.        "      <td>Sarjapur Water Tankers</td>\n",
  1122.        "      <td>Whitefield</td>\n",
  1123.        "      <td>3</td>\n",
  1124.        "      <td>01-05-2016</td>\n",
  1125.        "      <td>16:00:00</td>\n",
  1126.        "      <td>5</td>\n",
  1127.        "      <td>0.62</td>\n",
  1128.        "      <td>2</td>\n",
  1129.        "      <td>...</td>\n",
  1130.        "      <td>2</td>\n",
  1131.        "      <td>13</td>\n",
  1132.        "      <td>2</td>\n",
  1133.        "      <td>160.00</td>\n",
  1134.        "      <td>4</td>\n",
  1135.        "      <td>2</td>\n",
  1136.        "      <td>6</td>\n",
  1137.        "      <td>1</td>\n",
  1138.        "      <td>2</td>\n",
  1139.        "      <td>1</td>\n",
  1140.        "    </tr>\n",
  1141.        "  </tbody>\n",
  1142.        "</table>\n",
  1143.        "<p>5 rows × 30 columns</p>\n",
  1144.        "</div>"
  1145.       ],
  1146.       "text/plain": [
  1147.        "   Game ID                        Team 1                  Team 2  \\\n",
  1148.        "0      253  Electronic City Power Savers     Marathalli Chokers    \n",
  1149.        "1      254   Koramangala Traffic Jammers  Sarjapur Water Tankers   \n",
  1150.        "2      255          HSR High Rent Payers     Marathalli Chokers    \n",
  1151.        "3      256       Indranagar Pub Watchers   Silkboard Slow Movers   \n",
  1152.        "4      257     Whitefield Water Loggers   Sarjapur Water Tankers   \n",
  1153.        "\n",
  1154.        "        CityOfGame  Day  DateOfGame TimeOfGame  AvgWindSpeed  AvgHumidity  \\\n",
  1155.        "0  Electronic City    6  01-01-2016   20:00:00             5         0.62   \n",
  1156.        "1      Koramangala    7  01-02-2016   20:00:00             6         0.66   \n",
  1157.        "2       Marathalli    1  01-03-2016   16:00:00             5         0.64   \n",
  1158.        "3       Indranagar    2  01-04-2016   20:00:00             5         0.64   \n",
  1159.        "4       Whitefield    3  01-05-2016   16:00:00             5         0.62   \n",
  1160.        "\n",
  1161.        "   Inn 1 Team 1 NOP R>25,SR>125  ...  Inn 2 Team 2 NOP R<25, SR>125  \\\n",
  1162.        "0                             1  ...                              0   \n",
  1163.        "1                             1  ...                              1   \n",
  1164.        "2                             0  ...                              1   \n",
  1165.        "3                             1  ...                              3   \n",
  1166.        "4                             2  ...                              2   \n",
  1167.        "\n",
  1168.        "   Inn 2 Team 2 Total 4s  Inn 2 Team 2 Total 6s  \\\n",
  1169.        "0                      9                      5   \n",
  1170.        "1                      8                      4   \n",
  1171.        "2                      8                      1   \n",
  1172.        "3                     14                      4   \n",
  1173.        "4                     13                      2   \n",
  1174.        "\n",
  1175.        "   Inn 2 Team 2 Max Strike Rate_ALLBatsmen  Inn 2 Team 1 NoP fast bowlers  \\\n",
  1176.        "0                                   142.85                              3   \n",
  1177.        "1                                   210.00                              3   \n",
  1178.        "2                                   166.66                              4   \n",
  1179.        "3                                   166.66                              2   \n",
  1180.        "4                                   160.00                              4   \n",
  1181.        "\n",
  1182.        "   Inn 2 Team 1 NoP Spinners  Inn 2 Team 1 wickets taken_catches_runout  \\\n",
  1183.        "0                          3                                          1   \n",
  1184.        "1                          2                                          1   \n",
  1185.        "2                          2                                          2   \n",
  1186.        "3                          4                                          6   \n",
  1187.        "4                          2                                          6   \n",
  1188.        "\n",
  1189.        "   Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping  \\\n",
  1190.        "0                                                  1                  \n",
  1191.        "1                                                  1                  \n",
  1192.        "2                                                  7                  \n",
  1193.        "3                                                  3                  \n",
  1194.        "4                                                  1                  \n",
  1195.        "\n",
  1196.        "   Inn 2 Team 1 Extras conceded in_wides_No Balls  Winner (team 1=1, team 2=0)  \n",
  1197.        "0                                               3                            0  \n",
  1198.        "1                                               1                            0  \n",
  1199.        "2                                               4                            1  \n",
  1200.        "3                                               2                            1  \n",
  1201.        "4                                               2                            1  \n",
  1202.        "\n",
  1203.        "[5 rows x 30 columns]"
  1204.       ]
  1205.      },
  1206.      "execution_count": 260,
  1207.      "metadata": {},
  1208.      "output_type": "execute_result"
  1209.     }
  1210.    ],
  1211.    "source": [
  1212.     "test.head()"
  1213.    ]
  1214.   },
  1215.   {
  1216.    "cell_type": "markdown",
  1217.    "metadata": {},
  1218.    "source": [
  1219.     "# Observations :\n",
  1220.     "1. In train dataset we have two columns whose name is different from those two columns which are in test dataset but in both datasets, they are representing the same so i am renaming test dataset columns name with that of train dataset column name"
  1221.    ]
  1222.   },
  1223.   {
  1224.    "cell_type": "code",
  1225.    "execution_count": 261,
  1226.    "metadata": {},
  1227.    "outputs": [
  1228.     {
  1229.      "data": {
  1230.       "text/plain": [
  1231.        "(76, 30)"
  1232.       ]
  1233.      },
  1234.      "execution_count": 261,
  1235.      "metadata": {},
  1236.      "output_type": "execute_result"
  1237.     }
  1238.    ],
  1239.    "source": [
  1240.     "test.rename(columns={'CityOfGame': 'City','Day':'DayOfWeek'}, inplace=True)\n",
  1241.     "test.shape"
  1242.    ]
  1243.   },
  1244.   {
  1245.    "cell_type": "code",
  1246.    "execution_count": 262,
  1247.    "metadata": {},
  1248.    "outputs": [
  1249.     {
  1250.      "data": {
  1251.       "text/plain": [
  1252.        "(328, 30)"
  1253.       ]
  1254.      },
  1255.      "execution_count": 262,
  1256.      "metadata": {},
  1257.      "output_type": "execute_result"
  1258.     }
  1259.    ],
  1260.    "source": [
  1261.     "# merging the two dataset so that we can do analysis in one go\n",
  1262.     "\n",
  1263.     "train_data=pd.merge(train,test,how='outer')\n",
  1264.     "train_data.shape"
  1265.    ]
  1266.   },
  1267.   {
  1268.    "cell_type": "code",
  1269.    "execution_count": 263,
  1270.    "metadata": {},
  1271.    "outputs": [
  1272.     {
  1273.      "data": {
  1274.       "text/html": [
  1275.        "<div>\n",
  1276.        "<style scoped>\n",
  1277.        "    .dataframe tbody tr th:only-of-type {\n",
  1278.        "        vertical-align: middle;\n",
  1279.        "    }\n",
  1280.        "\n",
  1281.        "    .dataframe tbody tr th {\n",
  1282.        "        vertical-align: top;\n",
  1283.        "    }\n",
  1284.        "\n",
  1285.        "    .dataframe thead th {\n",
  1286.        "        text-align: right;\n",
  1287.        "    }\n",
  1288.        "</style>\n",
  1289.        "<table border=\"1\" class=\"dataframe\">\n",
  1290.        "  <thead>\n",
  1291.        "    <tr style=\"text-align: right;\">\n",
  1292.        "      <th></th>\n",
  1293.        "      <th>Game ID</th>\n",
  1294.        "      <th>Team 1</th>\n",
  1295.        "      <th>Team 2</th>\n",
  1296.        "      <th>City</th>\n",
  1297.        "      <th>DayOfWeek</th>\n",
  1298.        "      <th>DateOfGame</th>\n",
  1299.        "      <th>TimeOfGame</th>\n",
  1300.        "      <th>AvgWindSpeed</th>\n",
  1301.        "      <th>AvgHumidity</th>\n",
  1302.        "      <th>Inn 1 Team 1 NOP R>25,SR>125</th>\n",
  1303.        "      <th>...</th>\n",
  1304.        "      <th>Inn 2 Team 2 NOP R<25, SR>125</th>\n",
  1305.        "      <th>Inn 2 Team 2 Total 4s</th>\n",
  1306.        "      <th>Inn 2 Team 2 Total 6s</th>\n",
  1307.        "      <th>Inn 2 Team 2 Max Strike Rate_ALLBatsmen</th>\n",
  1308.        "      <th>Inn 2 Team 1 NoP fast bowlers</th>\n",
  1309.        "      <th>Inn 2 Team 1 NoP Spinners</th>\n",
  1310.        "      <th>Inn 2 Team 1 wickets taken_catches_runout</th>\n",
  1311.        "      <th>Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping</th>\n",
  1312.        "      <th>Inn 2 Team 1 Extras conceded in_wides_No Balls</th>\n",
  1313.        "      <th>Winner (team 1=1, team 2=0)</th>\n",
  1314.        "    </tr>\n",
  1315.        "  </thead>\n",
  1316.        "  <tbody>\n",
  1317.        "    <tr>\n",
  1318.        "      <th>0</th>\n",
  1319.        "      <td>1</td>\n",
  1320.        "      <td>Koramangala Traffic Jammers</td>\n",
  1321.        "      <td>Whitefield Water Loggers</td>\n",
  1322.        "      <td>Whitefield</td>\n",
  1323.        "      <td>1</td>\n",
  1324.        "      <td>01-01-2012</td>\n",
  1325.        "      <td>20:00:00</td>\n",
  1326.        "      <td>6</td>\n",
  1327.        "      <td>0.49</td>\n",
  1328.        "      <td>1</td>\n",
  1329.        "      <td>...</td>\n",
  1330.        "      <td>0</td>\n",
  1331.        "      <td>3</td>\n",
  1332.        "      <td>3</td>\n",
  1333.        "      <td>120.00</td>\n",
  1334.        "      <td>5</td>\n",
  1335.        "      <td>0</td>\n",
  1336.        "      <td>6</td>\n",
  1337.        "      <td>4</td>\n",
  1338.        "      <td>11</td>\n",
  1339.        "      <td>1</td>\n",
  1340.        "    </tr>\n",
  1341.        "    <tr>\n",
  1342.        "      <th>1</th>\n",
  1343.        "      <td>2</td>\n",
  1344.        "      <td>Electronic City Power Savers</td>\n",
  1345.        "      <td>Silkboard Slow Movers</td>\n",
  1346.        "      <td>Silkboard</td>\n",
  1347.        "      <td>2</td>\n",
  1348.        "      <td>01-02-2012</td>\n",
  1349.        "      <td>17:00:00</td>\n",
  1350.        "      <td>7</td>\n",
  1351.        "      <td>0.44</td>\n",
  1352.        "      <td>3</td>\n",
  1353.        "      <td>...</td>\n",
  1354.        "      <td>2</td>\n",
  1355.        "      <td>18</td>\n",
  1356.        "      <td>9</td>\n",
  1357.        "      <td>215.15</td>\n",
  1358.        "      <td>4</td>\n",
  1359.        "      <td>1</td>\n",
  1360.        "      <td>4</td>\n",
  1361.        "      <td>0</td>\n",
  1362.        "      <td>5</td>\n",
  1363.        "      <td>1</td>\n",
  1364.        "    </tr>\n",
  1365.        "    <tr>\n",
  1366.        "      <th>2</th>\n",
  1367.        "      <td>3</td>\n",
  1368.        "      <td>Indranagar Pub Watchers</td>\n",
  1369.        "      <td>Sarjapur Water Tankers</td>\n",
  1370.        "      <td>Sarjapur</td>\n",
  1371.        "      <td>3</td>\n",
  1372.        "      <td>01-03-2012</td>\n",
  1373.        "      <td>20:30:00</td>\n",
  1374.        "      <td>11</td>\n",
  1375.        "      <td>0.23</td>\n",
  1376.        "      <td>2</td>\n",
  1377.        "      <td>...</td>\n",
  1378.        "      <td>1</td>\n",
  1379.        "      <td>18</td>\n",
  1380.        "      <td>1</td>\n",
  1381.        "      <td>300.00</td>\n",
  1382.        "      <td>3</td>\n",
  1383.        "      <td>3</td>\n",
  1384.        "      <td>0</td>\n",
  1385.        "      <td>1</td>\n",
  1386.        "      <td>10</td>\n",
  1387.        "      <td>0</td>\n",
  1388.        "    </tr>\n",
  1389.        "    <tr>\n",
  1390.        "      <th>3</th>\n",
  1391.        "      <td>4</td>\n",
  1392.        "      <td>Bellandur Froth Fighters</td>\n",
  1393.        "      <td>Koramangala Traffic Jammers</td>\n",
  1394.        "      <td>Koramangala</td>\n",
  1395.        "      <td>4</td>\n",
  1396.        "      <td>01-04-2012</td>\n",
  1397.        "      <td>16:00:00</td>\n",
  1398.        "      <td>6</td>\n",
  1399.        "      <td>0.61</td>\n",
  1400.        "      <td>0</td>\n",
  1401.        "      <td>...</td>\n",
  1402.        "      <td>0</td>\n",
  1403.        "      <td>5</td>\n",
  1404.        "      <td>4</td>\n",
  1405.        "      <td>100.00</td>\n",
  1406.        "      <td>4</td>\n",
  1407.        "      <td>2</td>\n",
  1408.        "      <td>3</td>\n",
  1409.        "      <td>2</td>\n",
  1410.        "      <td>16</td>\n",
  1411.        "      <td>0</td>\n",
  1412.        "    </tr>\n",
  1413.        "    <tr>\n",
  1414.        "      <th>4</th>\n",
  1415.        "      <td>5</td>\n",
  1416.        "      <td>Marathalli Chokers</td>\n",
  1417.        "      <td>Whitefield Water Loggers</td>\n",
  1418.        "      <td>Marathalli</td>\n",
  1419.        "      <td>5</td>\n",
  1420.        "      <td>01-05-2012</td>\n",
  1421.        "      <td>20:00:00</td>\n",
  1422.        "      <td>6</td>\n",
  1423.        "      <td>0.56</td>\n",
  1424.        "      <td>3</td>\n",
  1425.        "      <td>...</td>\n",
  1426.        "      <td>3</td>\n",
  1427.        "      <td>15</td>\n",
  1428.        "      <td>6</td>\n",
  1429.        "      <td>205.26</td>\n",
  1430.        "      <td>4</td>\n",
  1431.        "      <td>2</td>\n",
  1432.        "      <td>4</td>\n",
  1433.        "      <td>1</td>\n",
  1434.        "      <td>5</td>\n",
  1435.        "      <td>0</td>\n",
  1436.        "    </tr>\n",
  1437.        "  </tbody>\n",
  1438.        "</table>\n",
  1439.        "<p>5 rows × 30 columns</p>\n",
  1440.        "</div>"
  1441.       ],
  1442.       "text/plain": [
  1443.        "   Game ID                        Team 1                       Team 2  \\\n",
  1444.        "0        1   Koramangala Traffic Jammers    Whitefield Water Loggers    \n",
  1445.        "1        2  Electronic City Power Savers        Silkboard Slow Movers   \n",
  1446.        "2        3       Indranagar Pub Watchers       Sarjapur Water Tankers   \n",
  1447.        "3        4      Bellandur Froth Fighters  Koramangala Traffic Jammers   \n",
  1448.        "4        5           Marathalli Chokers     Whitefield Water Loggers    \n",
  1449.        "\n",
  1450.        "          City  DayOfWeek  DateOfGame TimeOfGame  AvgWindSpeed  AvgHumidity  \\\n",
  1451.        "0   Whitefield          1  01-01-2012   20:00:00             6         0.49   \n",
  1452.        "1    Silkboard          2  01-02-2012   17:00:00             7         0.44   \n",
  1453.        "2     Sarjapur          3  01-03-2012   20:30:00            11         0.23   \n",
  1454.        "3  Koramangala          4  01-04-2012   16:00:00             6         0.61   \n",
  1455.        "4   Marathalli          5  01-05-2012   20:00:00             6         0.56   \n",
  1456.        "\n",
  1457.        "   Inn 1 Team 1 NOP R>25,SR>125  ...  Inn 2 Team 2 NOP R<25, SR>125  \\\n",
  1458.        "0                             1  ...                              0   \n",
  1459.        "1                             3  ...                              2   \n",
  1460.        "2                             2  ...                              1   \n",
  1461.        "3                             0  ...                              0   \n",
  1462.        "4                             3  ...                              3   \n",
  1463.        "\n",
  1464.        "   Inn 2 Team 2 Total 4s  Inn 2 Team 2 Total 6s  \\\n",
  1465.        "0                      3                      3   \n",
  1466.        "1                     18                      9   \n",
  1467.        "2                     18                      1   \n",
  1468.        "3                      5                      4   \n",
  1469.        "4                     15                      6   \n",
  1470.        "\n",
  1471.        "   Inn 2 Team 2 Max Strike Rate_ALLBatsmen  Inn 2 Team 1 NoP fast bowlers  \\\n",
  1472.        "0                                   120.00                              5   \n",
  1473.        "1                                   215.15                              4   \n",
  1474.        "2                                   300.00                              3   \n",
  1475.        "3                                   100.00                              4   \n",
  1476.        "4                                   205.26                              4   \n",
  1477.        "\n",
  1478.        "   Inn 2 Team 1 NoP Spinners  Inn 2 Team 1 wickets taken_catches_runout  \\\n",
  1479.        "0                          0                                          6   \n",
  1480.        "1                          1                                          4   \n",
  1481.        "2                          3                                          0   \n",
  1482.        "3                          2                                          3   \n",
  1483.        "4                          2                                          4   \n",
  1484.        "\n",
  1485.        "   Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping  \\\n",
  1486.        "0                                                  4                  \n",
  1487.        "1                                                  0                  \n",
  1488.        "2                                                  1                  \n",
  1489.        "3                                                  2                  \n",
  1490.        "4                                                  1                  \n",
  1491.        "\n",
  1492.        "   Inn 2 Team 1 Extras conceded in_wides_No Balls  Winner (team 1=1, team 2=0)  \n",
  1493.        "0                                              11                            1  \n",
  1494.        "1                                               5                            1  \n",
  1495.        "2                                              10                            0  \n",
  1496.        "3                                              16                            0  \n",
  1497.        "4                                               5                            0  \n",
  1498.        "\n",
  1499.        "[5 rows x 30 columns]"
  1500.       ]
  1501.      },
  1502.      "execution_count": 263,
  1503.      "metadata": {},
  1504.      "output_type": "execute_result"
  1505.     }
  1506.    ],
  1507.    "source": [
  1508.     "train_data.head(5)"
  1509.    ]
  1510.   },
  1511.   {
  1512.    "cell_type": "markdown",
  1513.    "metadata": {},
  1514.    "source": [
  1515.     "# 2. Variables Identification :"
  1516.    ]
  1517.   },
  1518.   {
  1519.    "cell_type": "code",
  1520.    "execution_count": 264,
  1521.    "metadata": {},
  1522.    "outputs": [
  1523.     {
  1524.      "name": "stdout",
  1525.      "output_type": "stream",
  1526.      "text": [
  1527.       "<class 'pandas.core.frame.DataFrame'>\n",
  1528.       "Int64Index: 328 entries, 0 to 327\n",
  1529.       "Data columns (total 30 columns):\n",
  1530.       "Game ID                                                             328 non-null int64\n",
  1531.       "Team 1                                                              328 non-null object\n",
  1532.       "Team 2                                                              328 non-null object\n",
  1533.       "City                                                                328 non-null object\n",
  1534.       "DayOfWeek                                                           328 non-null int64\n",
  1535.       "DateOfGame                                                          328 non-null object\n",
  1536.       "TimeOfGame                                                          328 non-null object\n",
  1537.       "AvgWindSpeed                                                        328 non-null int64\n",
  1538.       "AvgHumidity                                                         328 non-null float64\n",
  1539.       "Inn 1 Team 1 NOP R>25,SR>125                                        328 non-null int64\n",
  1540.       "Inn 1 Team 1 NOP R<25, SR>125                                       328 non-null int64\n",
  1541.       "Inn 1 Team 1 Total 4s                                               328 non-null int64\n",
  1542.       "Inn 1 Team 1 Total 6s                                               328 non-null int64\n",
  1543.       "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                             328 non-null float64\n",
  1544.       "Inn 1 Team 2 NoP fast bowlers                                       328 non-null int64\n",
  1545.       "Inn 1 Team 2 NoP Spinners                                           328 non-null int64\n",
  1546.       "Inn 1 Team 2 wickets taken_catches_runout                           328 non-null int64\n",
  1547.       "Inn1 Team 2 wickets taken_ bowled _lbw_caught by keeper_stumping    328 non-null int64\n",
  1548.       "Inn 1 Team 2 Extras conceded in_wides_No Balls                      328 non-null int64\n",
  1549.       "Inn 2 Team 2 NOP R>25,SR>125                                        328 non-null int64\n",
  1550.       "Inn 2 Team 2 NOP R<25, SR>125                                       328 non-null int64\n",
  1551.       "Inn 2 Team 2 Total 4s                                               328 non-null int64\n",
  1552.       "Inn 2 Team 2 Total 6s                                               328 non-null int64\n",
  1553.       "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                             328 non-null float64\n",
  1554.       "Inn 2 Team 1 NoP fast bowlers                                       328 non-null int64\n",
  1555.       "Inn 2 Team 1 NoP Spinners                                           328 non-null int64\n",
  1556.       "Inn 2 Team 1 wickets taken_catches_runout                           328 non-null int64\n",
  1557.       "Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping    328 non-null int64\n",
  1558.       "Inn 2 Team 1 Extras conceded in_wides_No Balls                      328 non-null int64\n",
  1559.       "Winner (team 1=1, team 2=0)                                         328 non-null int64\n",
  1560.       "dtypes: float64(3), int64(22), object(5)\n",
  1561.       "memory usage: 79.4+ KB\n"
  1562.      ]
  1563.     }
  1564.    ],
  1565.    "source": [
  1566.     "train_data.info()"
  1567.    ]
  1568.   },
  1569.   {
  1570.    "cell_type": "markdown",
  1571.    "metadata": {},
  1572.    "source": [
  1573.     "## Observation:\n",
  1574.     "1. We don't have any missing value in above dataset"
  1575.    ]
  1576.   },
  1577.   {
  1578.    "cell_type": "code",
  1579.    "execution_count": 265,
  1580.    "metadata": {},
  1581.    "outputs": [
  1582.     {
  1583.      "name": "stdout",
  1584.      "output_type": "stream",
  1585.      "text": [
  1586.       "Game ID\n",
  1587.       "328    1\n",
  1588.       "103    1\n",
  1589.       "105    1\n",
  1590.       "106    1\n",
  1591.       "107    1\n",
  1592.       "108    1\n",
  1593.       "109    1\n",
  1594.       "110    1\n",
  1595.       "111    1\n",
  1596.       "112    1\n",
  1597.       "113    1\n",
  1598.       "114    1\n",
  1599.       "115    1\n",
  1600.       "116    1\n",
  1601.       "117    1\n",
  1602.       "118    1\n",
  1603.       "119    1\n",
  1604.       "120    1\n",
  1605.       "121    1\n",
  1606.       "104    1\n",
  1607.       "102    1\n",
  1608.       "327    1\n",
  1609.       "101    1\n",
  1610.       "84     1\n",
  1611.       "85     1\n",
  1612.       "86     1\n",
  1613.       "87     1\n",
  1614.       "88     1\n",
  1615.       "89     1\n",
  1616.       "90     1\n",
  1617.       "      ..\n",
  1618.       "236    1\n",
  1619.       "237    1\n",
  1620.       "238    1\n",
  1621.       "239    1\n",
  1622.       "240    1\n",
  1623.       "241    1\n",
  1624.       "242    1\n",
  1625.       "243    1\n",
  1626.       "244    1\n",
  1627.       "227    1\n",
  1628.       "226    1\n",
  1629.       "225    1\n",
  1630.       "215    1\n",
  1631.       "208    1\n",
  1632.       "209    1\n",
  1633.       "210    1\n",
  1634.       "211    1\n",
  1635.       "212    1\n",
  1636.       "213    1\n",
  1637.       "214    1\n",
  1638.       "216    1\n",
  1639.       "224    1\n",
  1640.       "217    1\n",
  1641.       "218    1\n",
  1642.       "219    1\n",
  1643.       "220    1\n",
  1644.       "221    1\n",
  1645.       "222    1\n",
  1646.       "223    1\n",
  1647.       "1      1\n",
  1648.       "Name: Game ID, Length: 328, dtype: int64\n",
  1649.       "***************************************************\n",
  1650.       "Team 1\n",
  1651.       "Electronic City Power Savers    52\n",
  1652.       "Bellandur Froth Fighters        44\n",
  1653.       "Koramangala Traffic Jammers     41\n",
  1654.       "Marathalli Chokers              39\n",
  1655.       "Indranagar Pub Watchers         37\n",
  1656.       "Silkboard Slow Movers           36\n",
  1657.       "Sarjapur Water Tankers          30\n",
  1658.       "Whitefield Water Loggers        29\n",
  1659.       "Airport Flyers                   7\n",
  1660.       "HSR High Rent Payers             7\n",
  1661.       "Forum Fans                       6\n",
  1662.       "Name: Team 1, dtype: int64\n",
  1663.       "***************************************************\n",
  1664.       "Team 2\n",
  1665.       "Whitefield Water Loggers        50\n",
  1666.       "Sarjapur Water Tankers          46\n",
  1667.       "Marathalli Chokers              38\n",
  1668.       "Silkboard Slow Movers           37\n",
  1669.       "Indranagar Pub Watchers         37\n",
  1670.       "Koramangala Traffic Jammers     34\n",
  1671.       "Bellandur Froth Fighters        32\n",
  1672.       "Electronic City Power Savers    30\n",
  1673.       "HSR High Rent Payers             9\n",
  1674.       "Forum Fans                       8\n",
  1675.       "Airport Flyers                   7\n",
  1676.       "Name: Team 2, dtype: int64\n",
  1677.       "***************************************************\n",
  1678.       "City\n",
  1679.       "Marathalli         55\n",
  1680.       "Sarjapur           48\n",
  1681.       "Koramangala        48\n",
  1682.       "Whitefield         42\n",
  1683.       "Indranagar         35\n",
  1684.       "Electronic City    35\n",
  1685.       "Silkboard          33\n",
  1686.       "Bellandur          22\n",
  1687.       "HSR                10\n",
  1688.       "Name: City, dtype: int64\n",
  1689.       "***************************************************\n",
  1690.       "DayOfWeek\n",
  1691.       "7    47\n",
  1692.       "6    47\n",
  1693.       "5    47\n",
  1694.       "4    47\n",
  1695.       "3    47\n",
  1696.       "1    47\n",
  1697.       "2    46\n",
  1698.       "Name: DayOfWeek, dtype: int64\n",
  1699.       "***************************************************\n",
  1700.       "DateOfGame\n",
  1701.       "01-11-2014    1\n",
  1702.       "03-01-2015    1\n",
  1703.       "01-02-2012    1\n",
  1704.       "02-25-2014    1\n",
  1705.       "02-24-2012    1\n",
  1706.       "03-09-2015    1\n",
  1707.       "01-07-2013    1\n",
  1708.       "02-24-2013    1\n",
  1709.       "02-06-2013    1\n",
  1710.       "02-23-2013    1\n",
  1711.       "02-04-2012    1\n",
  1712.       "03-06-2015    1\n",
  1713.       "02-01-2014    1\n",
  1714.       "02-05-2013    1\n",
  1715.       "03-03-2015    1\n",
  1716.       "01-21-2012    1\n",
  1717.       "01-31-2012    1\n",
  1718.       "02-05-2016    1\n",
  1719.       "02-21-2016    1\n",
  1720.       "03-07-2016    1\n",
  1721.       "01-24-2016    1\n",
  1722.       "02-23-2015    1\n",
  1723.       "03-14-2015    1\n",
  1724.       "02-16-2016    1\n",
  1725.       "02-23-2012    1\n",
  1726.       "03-04-2016    1\n",
  1727.       "02-26-2013    1\n",
  1728.       "01-11-2015    1\n",
  1729.       "01-15-2015    1\n",
  1730.       "01-14-2016    1\n",
  1731.       "             ..\n",
  1732.       "03-12-2016    1\n",
  1733.       "01-23-2016    1\n",
  1734.       "02-26-2012    1\n",
  1735.       "02-17-2012    1\n",
  1736.       "01-15-2016    1\n",
  1737.       "02-28-2016    1\n",
  1738.       "01-19-2016    1\n",
  1739.       "01-01-2015    1\n",
  1740.       "01-06-2015    1\n",
  1741.       "01-06-2013    1\n",
  1742.       "01-05-2015    1\n",
  1743.       "01-09-2014    1\n",
  1744.       "03-08-2016    1\n",
  1745.       "01-28-2015    1\n",
  1746.       "02-12-2013    1\n",
  1747.       "01-16-2012    1\n",
  1748.       "03-05-2015    1\n",
  1749.       "02-18-2012    1\n",
  1750.       "01-30-2016    1\n",
  1751.       "01-17-2012    1\n",
  1752.       "01-20-2014    1\n",
  1753.       "01-26-2012    1\n",
  1754.       "01-11-2016    1\n",
  1755.       "02-19-2012    1\n",
  1756.       "02-07-2013    1\n",
  1757.       "01-27-2015    1\n",
  1758.       "02-08-2014    1\n",
  1759.       "02-10-2015    1\n",
  1760.       "03-16-2016    1\n",
  1761.       "02-02-2013    1\n",
  1762.       "Name: DateOfGame, Length: 328, dtype: int64\n",
  1763.       "***************************************************\n",
  1764.       "TimeOfGame\n",
  1765.       "20:00:00    184\n",
  1766.       "16:00:00     80\n",
  1767.       "16:30:00     25\n",
  1768.       "12:30:00     22\n",
  1769.       "16:45:00     10\n",
  1770.       "20:30:00      2\n",
  1771.       "15:00:00      1\n",
  1772.       "17:10:00      1\n",
  1773.       "17:00:00      1\n",
  1774.       "20:15:00      1\n",
  1775.       "18:50:00      1\n",
  1776.       "Name: TimeOfGame, dtype: int64\n",
  1777.       "***************************************************\n",
  1778.       "AvgWindSpeed\n",
  1779.       "6     90\n",
  1780.       "7     79\n",
  1781.       "8     66\n",
  1782.       "5     34\n",
  1783.       "9     22\n",
  1784.       "10    16\n",
  1785.       "11     5\n",
  1786.       "4      4\n",
  1787.       "19     2\n",
  1788.       "15     2\n",
  1789.       "13     2\n",
  1790.       "12     2\n",
  1791.       "22     1\n",
  1792.       "18     1\n",
  1793.       "14     1\n",
  1794.       "3      1\n",
  1795.       "Name: AvgWindSpeed, dtype: int64\n",
  1796.       "***************************************************\n",
  1797.       "AvgHumidity\n",
  1798.       "0.72    23\n",
  1799.       "0.73    23\n",
  1800.       "0.74    19\n",
  1801.       "0.70    18\n",
  1802.       "0.61    15\n",
  1803.       "0.64    13\n",
  1804.       "0.65    13\n",
  1805.       "0.68    12\n",
  1806.       "0.75    12\n",
  1807.       "0.67    12\n",
  1808.       "0.62    12\n",
  1809.       "0.58    10\n",
  1810.       "0.60    10\n",
  1811.       "0.66    10\n",
  1812.       "0.71     9\n",
  1813.       "0.63     9\n",
  1814.       "0.69     9\n",
  1815.       "0.54     8\n",
  1816.       "0.55     7\n",
  1817.       "0.77     7\n",
  1818.       "0.49     7\n",
  1819.       "0.76     7\n",
  1820.       "0.56     6\n",
  1821.       "0.50     6\n",
  1822.       "0.52     4\n",
  1823.       "0.46     4\n",
  1824.       "0.44     4\n",
  1825.       "0.78     3\n",
  1826.       "0.48     3\n",
  1827.       "0.59     3\n",
  1828.       "0.53     3\n",
  1829.       "0.40     2\n",
  1830.       "0.88     2\n",
  1831.       "0.19     2\n",
  1832.       "0.20     2\n",
  1833.       "0.45     2\n",
  1834.       "0.51     2\n",
  1835.       "0.18     1\n",
  1836.       "0.39     1\n",
  1837.       "0.16     1\n",
  1838.       "0.47     1\n",
  1839.       "0.34     1\n",
  1840.       "0.28     1\n",
  1841.       "0.43     1\n",
  1842.       "0.80     1\n",
  1843.       "0.17     1\n",
  1844.       "0.82     1\n",
  1845.       "0.32     1\n",
  1846.       "0.22     1\n",
  1847.       "0.57     1\n",
  1848.       "0.23     1\n",
  1849.       "0.36     1\n",
  1850.       "Name: AvgHumidity, dtype: int64\n",
  1851.       "***************************************************\n",
  1852.       "Inn 1 Team 1 NOP R>25,SR>125\n",
  1853.       "1    112\n",
  1854.       "2    100\n",
  1855.       "0     66\n",
  1856.       "3     49\n",
  1857.       "4      1\n",
  1858.       "Name: Inn 1 Team 1 NOP R>25,SR>125, dtype: int64\n",
  1859.       "***************************************************\n",
  1860.       "Inn 1 Team 1 NOP R<25, SR>125\n",
  1861.       "1    120\n",
  1862.       "2     84\n",
  1863.       "0     66\n",
  1864.       "3     38\n",
  1865.       "4     15\n",
  1866.       "5      3\n",
  1867.       "6      2\n",
  1868.       "Name: Inn 1 Team 1 NOP R<25, SR>125, dtype: int64\n",
  1869.       "***************************************************\n",
  1870.       "Inn 1 Team 1 Total 4s\n",
  1871.       "13    38\n",
  1872.       "14    32\n",
  1873.       "15    30\n",
  1874.       "12    27\n",
  1875.       "11    21\n",
  1876.       "16    20\n",
  1877.       "10    19\n",
  1878.       "18    19\n",
  1879.       "9     16\n",
  1880.       "19    15\n",
  1881.       "17    14\n",
  1882.       "20    12\n",
  1883.       "8     11\n",
  1884.       "7     10\n",
  1885.       "6      9\n",
  1886.       "0      7\n",
  1887.       "21     6\n",
  1888.       "23     6\n",
  1889.       "22     5\n",
  1890.       "24     4\n",
  1891.       "5      3\n",
  1892.       "4      3\n",
  1893.       "25     1\n",
  1894.       "Name: Inn 1 Team 1 Total 4s, dtype: int64\n",
  1895.       "***************************************************\n",
  1896.       "Inn 1 Team 1 Total 6s\n",
  1897.       "3     48\n",
  1898.       "5     42\n",
  1899.       "6     42\n",
  1900.       "2     39\n",
  1901.       "4     34\n",
  1902.       "7     33\n",
  1903.       "8     23\n",
  1904.       "1     23\n",
  1905.       "9     12\n",
  1906.       "0     11\n",
  1907.       "10     6\n",
  1908.       "12     5\n",
  1909.       "11     3\n",
  1910.       "14     3\n",
  1911.       "16     1\n",
  1912.       "13     1\n",
  1913.       "15     1\n",
  1914.       "17     1\n",
  1915.       "Name: Inn 1 Team 1 Total 6s, dtype: int64\n",
  1916.       "***************************************************\n",
  1917.       "Inn 1 Team 1 Max Strike Rate_ALLBatsmen\n",
  1918.       "200.00    28\n",
  1919.       "300.00    15\n",
  1920.       "250.00    13\n",
  1921.       "175.00    11\n",
  1922.       "150.00    11\n",
  1923.       "166.66     8\n",
  1924.       "400.00     8\n",
  1925.       "160.00     8\n",
  1926.       "171.42     8\n",
  1927.       "185.71     7\n",
  1928.       "233.33     7\n",
  1929.       "0.00       6\n",
  1930.       "220.00     6\n",
  1931.       "180.00     6\n",
  1932.       "133.33     5\n",
  1933.       "183.33     5\n",
  1934.       "225.00     4\n",
  1935.       "142.85     4\n",
  1936.       "161.11     4\n",
  1937.       "162.50     3\n",
  1938.       "144.44     3\n",
  1939.       "135.29     3\n",
  1940.       "209.09     3\n",
  1941.       "216.66     3\n",
  1942.       "275.00     3\n",
  1943.       "164.28     3\n",
  1944.       "214.28     3\n",
  1945.       "155.55     2\n",
  1946.       "187.50     2\n",
  1947.       "262.50     2\n",
  1948.       "          ..\n",
  1949.       "105.55     1\n",
  1950.       "108.69     1\n",
  1951.       "192.10     1\n",
  1952.       "190.90     1\n",
  1953.       "253.84     1\n",
  1954.       "143.90     1\n",
  1955.       "226.66     1\n",
  1956.       "186.95     1\n",
  1957.       "252.94     1\n",
  1958.       "158.33     1\n",
  1959.       "172.72     1\n",
  1960.       "140.54     1\n",
  1961.       "285.71     1\n",
  1962.       "131.25     1\n",
  1963.       "156.25     1\n",
  1964.       "237.50     1\n",
  1965.       "137.50     1\n",
  1966.       "215.78     1\n",
  1967.       "178.94     1\n",
  1968.       "272.22     1\n",
  1969.       "223.52     1\n",
  1970.       "188.23     1\n",
  1971.       "160.86     1\n",
  1972.       "132.55     1\n",
  1973.       "182.35     1\n",
  1974.       "117.64     1\n",
  1975.       "316.66     1\n",
  1976.       "168.42     1\n",
  1977.       "177.77     1\n",
  1978.       "203.22     1\n",
  1979.       "Name: Inn 1 Team 1 Max Strike Rate_ALLBatsmen, Length: 147, dtype: int64\n",
  1980.       "***************************************************\n",
  1981.       "Inn 1 Team 2 NoP fast bowlers\n",
  1982.       "4    152\n",
  1983.       "3     85\n",
  1984.       "5     61\n",
  1985.       "2     16\n",
  1986.       "6      7\n",
  1987.       "0      7\n",
  1988.       "Name: Inn 1 Team 2 NoP fast bowlers, dtype: int64\n",
  1989.       "***************************************************\n",
  1990.       "Inn 1 Team 2 NoP Spinners\n",
  1991.       "2    128\n",
  1992.       "3     86\n",
  1993.       "1     72\n",
  1994.       "4     27\n",
  1995.       "0     13\n",
  1996.       "6      1\n",
  1997.       "5      1\n",
  1998.       "Name: Inn 1 Team 2 NoP Spinners, dtype: int64\n",
  1999.       "***************************************************\n",
  2000.       "Inn 1 Team 2 wickets taken_catches_runout\n",
  2001.       "3    79\n",
  2002.       "4    66\n",
  2003.       "5    60\n",
  2004.       "6    38\n",
  2005.       "2    29\n",
  2006.       "1    24\n",
  2007.       "0    12\n",
  2008.       "7    11\n",
  2009.       "8     5\n",
  2010.       "9     4\n",
  2011.       "Name: Inn 1 Team 2 wickets taken_catches_runout, dtype: int64\n",
  2012.       "***************************************************\n",
  2013.       "Inn1 Team 2 wickets taken_ bowled _lbw_caught by keeper_stumping\n",
  2014.       "1    81\n",
  2015.       "2    80\n",
  2016.       "3    68\n",
  2017.       "0    41\n",
  2018.       "4    32\n",
  2019.       "5    18\n",
  2020.       "6     5\n",
  2021.       "8     2\n",
  2022.       "7     1\n",
  2023.       "Name: Inn1 Team 2 wickets taken_ bowled _lbw_caught by keeper_stumping, dtype: int64\n",
  2024.       "***************************************************\n",
  2025.       "Inn 1 Team 2 Extras conceded in_wides_No Balls\n",
  2026.       "2     43\n",
  2027.       "4     43\n",
  2028.       "3     42\n",
  2029.       "5     37\n",
  2030.       "1     28\n",
  2031.       "6     26\n",
  2032.       "7     23\n",
  2033.       "8     15\n",
  2034.       "11    15\n",
  2035.       "9     14\n",
  2036.       "10    11\n",
  2037.       "0     10\n",
  2038.       "13     6\n",
  2039.       "14     6\n",
  2040.       "12     5\n",
  2041.       "16     2\n",
  2042.       "19     2\n",
  2043.       "Name: Inn 1 Team 2 Extras conceded in_wides_No Balls, dtype: int64\n",
  2044.       "***************************************************\n",
  2045.       "Inn 2 Team 2 NOP R>25,SR>125\n",
  2046.       "1    131\n",
  2047.       "2     90\n",
  2048.       "0     80\n",
  2049.       "3     26\n",
  2050.       "4      1\n",
  2051.       "Name: Inn 2 Team 2 NOP R>25,SR>125, dtype: int64\n",
  2052.       "***************************************************\n",
  2053.       "Inn 2 Team 2 NOP R<25, SR>125\n",
  2054.       "1    104\n",
  2055.       "0     97\n",
  2056.       "2     72\n",
  2057.       "3     47\n",
  2058.       "4      6\n",
  2059.       "5      2\n",
  2060.       "Name: Inn 2 Team 2 NOP R<25, SR>125, dtype: int64\n",
  2061.       "***************************************************\n",
  2062.       "Inn 2 Team 2 Total 4s\n",
  2063.       "12    35\n",
  2064.       "11    32\n",
  2065.       "10    31\n",
  2066.       "13    30\n",
  2067.       "14    26\n",
  2068.       "9     25\n",
  2069.       "15    25\n",
  2070.       "17    24\n",
  2071.       "8     16\n",
  2072.       "18    16\n",
  2073.       "16    14\n",
  2074.       "7     12\n",
  2075.       "20     8\n",
  2076.       "0      7\n",
  2077.       "19     7\n",
  2078.       "21     5\n",
  2079.       "22     3\n",
  2080.       "6      3\n",
  2081.       "5      2\n",
  2082.       "3      2\n",
  2083.       "1      2\n",
  2084.       "23     1\n",
  2085.       "4      1\n",
  2086.       "25     1\n",
  2087.       "Name: Inn 2 Team 2 Total 4s, dtype: int64\n",
  2088.       "***************************************************\n",
  2089.       "Inn 2 Team 2 Total 6s\n",
  2090.       "3     48\n",
  2091.       "4     47\n",
  2092.       "5     43\n",
  2093.       "2     38\n",
  2094.       "6     37\n",
  2095.       "1     30\n",
  2096.       "7     26\n",
  2097.       "8     15\n",
  2098.       "0     15\n",
  2099.       "9     12\n",
  2100.       "10     6\n",
  2101.       "11     5\n",
  2102.       "14     2\n",
  2103.       "13     2\n",
  2104.       "12     2\n",
  2105.       "Name: Inn 2 Team 2 Total 6s, dtype: int64\n",
  2106.       "***************************************************\n",
  2107.       "Inn 2 Team 2 Max Strike Rate_ALLBatsmen\n",
  2108.       "200.00    29\n",
  2109.       "166.66    11\n",
  2110.       "300.00    10\n",
  2111.       "266.66     9\n",
  2112.       "150.00     9\n",
  2113.       "233.33     9\n",
  2114.       "0.00       7\n",
  2115.       "171.42     6\n",
  2116.       "250.00     6\n",
  2117.       "157.14     6\n",
  2118.       "175.00     5\n",
  2119.       "142.85     4\n",
  2120.       "220.00     4\n",
  2121.       "160.00     4\n",
  2122.       "240.00     4\n",
  2123.       "187.50     4\n",
  2124.       "137.50     3\n",
  2125.       "400.00     3\n",
  2126.       "133.33     3\n",
  2127.       "176.47     3\n",
  2128.       "275.00     3\n",
  2129.       "140.00     3\n",
  2130.       "242.85     3\n",
  2131.       "125.00     3\n",
  2132.       "180.00     3\n",
  2133.       "170.00     3\n",
  2134.       "182.35     2\n",
  2135.       "325.00     2\n",
  2136.       "156.52     2\n",
  2137.       "167.74     2\n",
  2138.       "          ..\n",
  2139.       "215.15     1\n",
  2140.       "152.38     1\n",
  2141.       "121.05     1\n",
  2142.       "220.83     1\n",
  2143.       "161.90     1\n",
  2144.       "173.17     1\n",
  2145.       "143.90     1\n",
  2146.       "172.41     1\n",
  2147.       "366.66     1\n",
  2148.       "145.94     1\n",
  2149.       "178.57     1\n",
  2150.       "185.45     1\n",
  2151.       "238.46     1\n",
  2152.       "209.09     1\n",
  2153.       "195.65     1\n",
  2154.       "213.04     1\n",
  2155.       "159.09     1\n",
  2156.       "126.66     1\n",
  2157.       "147.91     1\n",
  2158.       "168.75     1\n",
  2159.       "145.09     1\n",
  2160.       "206.25     1\n",
  2161.       "231.91     1\n",
  2162.       "193.93     1\n",
  2163.       "162.50     1\n",
  2164.       "135.71     1\n",
  2165.       "385.71     1\n",
  2166.       "139.13     1\n",
  2167.       "220.58     1\n",
  2168.       "120.00     1\n",
  2169.       "Name: Inn 2 Team 2 Max Strike Rate_ALLBatsmen, Length: 163, dtype: int64\n",
  2170.       "***************************************************\n",
  2171.       "Inn 2 Team 1 NoP fast bowlers\n",
  2172.       "4    146\n",
  2173.       "3     98\n",
  2174.       "5     42\n",
  2175.       "2     29\n",
  2176.       "0      7\n",
  2177.       "6      4\n",
  2178.       "8      1\n",
  2179.       "1      1\n",
  2180.       "Name: Inn 2 Team 1 NoP fast bowlers, dtype: int64\n",
  2181.       "***************************************************\n",
  2182.       "Inn 2 Team 1 NoP Spinners\n",
  2183.       "2    122\n",
  2184.       "3     95\n",
  2185.       "1     71\n",
  2186.       "4     25\n",
  2187.       "0     13\n",
  2188.       "5      2\n",
  2189.       "Name: Inn 2 Team 1 NoP Spinners, dtype: int64\n",
  2190.       "***************************************************\n",
  2191.       "Inn 2 Team 1 wickets taken_catches_runout\n",
  2192.       "2    54\n",
  2193.       "5    53\n",
  2194.       "4    52\n",
  2195.       "1    47\n",
  2196.       "3    44\n",
  2197.       "6    33\n",
  2198.       "0    27\n",
  2199.       "7     9\n",
  2200.       "8     7\n",
  2201.       "9     2\n",
  2202.       "Name: Inn 2 Team 1 wickets taken_catches_runout, dtype: int64\n",
  2203.       "***************************************************\n",
  2204.       "Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping\n",
  2205.       "1    77\n",
  2206.       "2    73\n",
  2207.       "0    58\n",
  2208.       "3    54\n",
  2209.       "4    38\n",
  2210.       "5    17\n",
  2211.       "6     7\n",
  2212.       "7     3\n",
  2213.       "8     1\n",
  2214.       "Name: Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping, dtype: int64\n",
  2215.       "***************************************************\n",
  2216.       "Inn 2 Team 1 Extras conceded in_wides_No Balls\n",
  2217.       "3     41\n",
  2218.       "4     40\n",
  2219.       "7     38\n",
  2220.       "2     35\n",
  2221.       "6     35\n",
  2222.       "5     30\n",
  2223.       "1     28\n",
  2224.       "8     25\n",
  2225.       "9     16\n",
  2226.       "0     14\n",
  2227.       "10    11\n",
  2228.       "15     4\n",
  2229.       "13     4\n",
  2230.       "11     3\n",
  2231.       "16     2\n",
  2232.       "12     1\n",
  2233.       "14     1\n",
  2234.       "Name: Inn 2 Team 1 Extras conceded in_wides_No Balls, dtype: int64\n",
  2235.       "***************************************************\n",
  2236.       "Winner (team 1=1, team 2=0)\n",
  2237.       "0    183\n",
  2238.       "1    145\n",
  2239.       "Name: Winner (team 1=1, team 2=0), dtype: int64\n",
  2240.       "***************************************************\n"
  2241.      ]
  2242.     }
  2243.    ],
  2244.    "source": [
  2245.     "# checking how many number of times each value is coming in each of the columns\n",
  2246.     "\n",
  2247.     "for i in train_data.columns.tolist():\n",
  2248.     "    print(i)\n",
  2249.     "    print(train_data[i].value_counts())\n",
  2250.     "    print('*'*51)"
  2251.    ]
  2252.   },
  2253.   {
  2254.    "cell_type": "markdown",
  2255.    "metadata": {},
  2256.    "source": [
  2257.     "## Observations :\n",
  2258.     "\n",
  2259.     "1. Columns <b>'Game ID' and 'DateOfGame'</b> is appearing exactly like primary key(as in DBMS),in each row value differs so i will drop these two columns\n",
  2260.     "2. Columns <b>'Team 1','Team 2','City' and 'TimeOfGame'</b> have 'Object' type so we require either int or float type because scikit works on numerical value"
  2261.    ]
  2262.   },
  2263.   {
  2264.    "cell_type": "code",
  2265.    "execution_count": 266,
  2266.    "metadata": {},
  2267.    "outputs": [],
  2268.    "source": [
  2269.     "# dropping two columns 'Game ID' and 'DateOfGame'\n",
  2270.     "\n",
  2271.     "train_data.drop(['Game ID','DateOfGame'],axis=1,inplace=True)"
  2272.    ]
  2273.   },
  2274.   {
  2275.    "cell_type": "code",
  2276.    "execution_count": 267,
  2277.    "metadata": {},
  2278.    "outputs": [
  2279.     {
  2280.      "data": {
  2281.       "text/plain": [
  2282.        "(328, 28)"
  2283.       ]
  2284.      },
  2285.      "execution_count": 267,
  2286.      "metadata": {},
  2287.      "output_type": "execute_result"
  2288.     }
  2289.    ],
  2290.    "source": [
  2291.     "# now we have 28 columns instead of 30\n",
  2292.     "\n",
  2293.     "train_data.shape"
  2294.    ]
  2295.   },
  2296.   {
  2297.    "cell_type": "markdown",
  2298.    "metadata": {},
  2299.    "source": [
  2300.     "## 3. Univariate Analysis"
  2301.    ]
  2302.   },
  2303.   {
  2304.    "cell_type": "markdown",
  2305.    "metadata": {},
  2306.    "source": [
  2307.     "### 3.1 Continuous Variables"
  2308.    ]
  2309.   },
  2310.   {
  2311.    "cell_type": "code",
  2312.    "execution_count": 268,
  2313.    "metadata": {},
  2314.    "outputs": [
  2315.     {
  2316.      "data": {
  2317.       "text/html": [
  2318.        "<div>\n",
  2319.        "<style scoped>\n",
  2320.        "    .dataframe tbody tr th:only-of-type {\n",
  2321.        "        vertical-align: middle;\n",
  2322.        "    }\n",
  2323.        "\n",
  2324.        "    .dataframe tbody tr th {\n",
  2325.        "        vertical-align: top;\n",
  2326.        "    }\n",
  2327.        "\n",
  2328.        "    .dataframe thead th {\n",
  2329.        "        text-align: right;\n",
  2330.        "    }\n",
  2331.        "</style>\n",
  2332.        "<table border=\"1\" class=\"dataframe\">\n",
  2333.        "  <thead>\n",
  2334.        "    <tr style=\"text-align: right;\">\n",
  2335.        "      <th></th>\n",
  2336.        "      <th>DayOfWeek</th>\n",
  2337.        "      <th>AvgWindSpeed</th>\n",
  2338.        "      <th>AvgHumidity</th>\n",
  2339.        "      <th>Inn 1 Team 1 NOP R>25,SR>125</th>\n",
  2340.        "      <th>Inn 1 Team 1 NOP R<25, SR>125</th>\n",
  2341.        "      <th>Inn 1 Team 1 Total 4s</th>\n",
  2342.        "      <th>Inn 1 Team 1 Total 6s</th>\n",
  2343.        "      <th>Inn 1 Team 1 Max Strike Rate_ALLBatsmen</th>\n",
  2344.        "      <th>Inn 1 Team 2 NoP fast bowlers</th>\n",
  2345.        "      <th>Inn 1 Team 2 NoP Spinners</th>\n",
  2346.        "      <th>...</th>\n",
  2347.        "      <th>Inn 2 Team 2 NOP R<25, SR>125</th>\n",
  2348.        "      <th>Inn 2 Team 2 Total 4s</th>\n",
  2349.        "      <th>Inn 2 Team 2 Total 6s</th>\n",
  2350.        "      <th>Inn 2 Team 2 Max Strike Rate_ALLBatsmen</th>\n",
  2351.        "      <th>Inn 2 Team 1 NoP fast bowlers</th>\n",
  2352.        "      <th>Inn 2 Team 1 NoP Spinners</th>\n",
  2353.        "      <th>Inn 2 Team 1 wickets taken_catches_runout</th>\n",
  2354.        "      <th>Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping</th>\n",
  2355.        "      <th>Inn 2 Team 1 Extras conceded in_wides_No Balls</th>\n",
  2356.        "      <th>Winner (team 1=1, team 2=0)</th>\n",
  2357.        "    </tr>\n",
  2358.        "  </thead>\n",
  2359.        "  <tbody>\n",
  2360.        "    <tr>\n",
  2361.        "      <th>count</th>\n",
  2362.        "      <td>328.000000</td>\n",
  2363.        "      <td>328.000000</td>\n",
  2364.        "      <td>328.000000</td>\n",
  2365.        "      <td>328.000000</td>\n",
  2366.        "      <td>328.000000</td>\n",
  2367.        "      <td>328.000000</td>\n",
  2368.        "      <td>328.000000</td>\n",
  2369.        "      <td>328.000000</td>\n",
  2370.        "      <td>328.000000</td>\n",
  2371.        "      <td>328.000000</td>\n",
  2372.        "      <td>...</td>\n",
  2373.        "      <td>328.000000</td>\n",
  2374.        "      <td>328.000000</td>\n",
  2375.        "      <td>328.000000</td>\n",
  2376.        "      <td>328.000000</td>\n",
  2377.        "      <td>328.000000</td>\n",
  2378.        "      <td>328.000000</td>\n",
  2379.        "      <td>328.000000</td>\n",
  2380.        "      <td>328.000000</td>\n",
  2381.        "      <td>328.000000</td>\n",
  2382.        "      <td>328.000000</td>\n",
  2383.        "    </tr>\n",
  2384.        "    <tr>\n",
  2385.        "      <th>mean</th>\n",
  2386.        "      <td>4.006098</td>\n",
  2387.        "      <td>7.301829</td>\n",
  2388.        "      <td>0.633323</td>\n",
  2389.        "      <td>1.411585</td>\n",
  2390.        "      <td>1.490854</td>\n",
  2391.        "      <td>13.536585</td>\n",
  2392.        "      <td>4.945122</td>\n",
  2393.        "      <td>199.352104</td>\n",
  2394.        "      <td>3.786585</td>\n",
  2395.        "      <td>2.149390</td>\n",
  2396.        "      <td>...</td>\n",
  2397.        "      <td>1.289634</td>\n",
  2398.        "      <td>12.560976</td>\n",
  2399.        "      <td>4.506098</td>\n",
  2400.        "      <td>189.311585</td>\n",
  2401.        "      <td>3.594512</td>\n",
  2402.        "      <td>2.164634</td>\n",
  2403.        "      <td>3.338415</td>\n",
  2404.        "      <td>2.112805</td>\n",
  2405.        "      <td>5.073171</td>\n",
  2406.        "      <td>0.442073</td>\n",
  2407.        "    </tr>\n",
  2408.        "    <tr>\n",
  2409.        "      <th>std</th>\n",
  2410.        "      <td>2.003046</td>\n",
  2411.        "      <td>2.183563</td>\n",
  2412.        "      <td>0.121442</td>\n",
  2413.        "      <td>0.982159</td>\n",
  2414.        "      <td>1.180852</td>\n",
  2415.        "      <td>4.729231</td>\n",
  2416.        "      <td>3.012214</td>\n",
  2417.        "      <td>72.673405</td>\n",
  2418.        "      <td>1.012251</td>\n",
  2419.        "      <td>1.013185</td>\n",
  2420.        "      <td>...</td>\n",
  2421.        "      <td>1.127207</td>\n",
  2422.        "      <td>4.327842</td>\n",
  2423.        "      <td>2.788129</td>\n",
  2424.        "      <td>60.710497</td>\n",
  2425.        "      <td>1.042037</td>\n",
  2426.        "      <td>1.000168</td>\n",
  2427.        "      <td>2.068724</td>\n",
  2428.        "      <td>1.646817</td>\n",
  2429.        "      <td>3.221793</td>\n",
  2430.        "      <td>0.497392</td>\n",
  2431.        "    </tr>\n",
  2432.        "    <tr>\n",
  2433.        "      <th>min</th>\n",
  2434.        "      <td>1.000000</td>\n",
  2435.        "      <td>3.000000</td>\n",
  2436.        "      <td>0.160000</td>\n",
  2437.        "      <td>0.000000</td>\n",
  2438.        "      <td>0.000000</td>\n",
  2439.        "      <td>0.000000</td>\n",
  2440.        "      <td>0.000000</td>\n",
  2441.        "      <td>0.000000</td>\n",
  2442.        "      <td>0.000000</td>\n",
  2443.        "      <td>0.000000</td>\n",
  2444.        "      <td>...</td>\n",
  2445.        "      <td>0.000000</td>\n",
  2446.        "      <td>0.000000</td>\n",
  2447.        "      <td>0.000000</td>\n",
  2448.        "      <td>0.000000</td>\n",
  2449.        "      <td>0.000000</td>\n",
  2450.        "      <td>0.000000</td>\n",
  2451.        "      <td>0.000000</td>\n",
  2452.        "      <td>0.000000</td>\n",
  2453.        "      <td>0.000000</td>\n",
  2454.        "      <td>0.000000</td>\n",
  2455.        "    </tr>\n",
  2456.        "    <tr>\n",
  2457.        "      <th>25%</th>\n",
  2458.        "      <td>2.000000</td>\n",
  2459.        "      <td>6.000000</td>\n",
  2460.        "      <td>0.580000</td>\n",
  2461.        "      <td>1.000000</td>\n",
  2462.        "      <td>1.000000</td>\n",
  2463.        "      <td>11.000000</td>\n",
  2464.        "      <td>3.000000</td>\n",
  2465.        "      <td>161.110000</td>\n",
  2466.        "      <td>3.000000</td>\n",
  2467.        "      <td>1.000000</td>\n",
  2468.        "      <td>...</td>\n",
  2469.        "      <td>0.000000</td>\n",
  2470.        "      <td>10.000000</td>\n",
  2471.        "      <td>2.000000</td>\n",
  2472.        "      <td>153.092500</td>\n",
  2473.        "      <td>3.000000</td>\n",
  2474.        "      <td>1.000000</td>\n",
  2475.        "      <td>2.000000</td>\n",
  2476.        "      <td>1.000000</td>\n",
  2477.        "      <td>3.000000</td>\n",
  2478.        "      <td>0.000000</td>\n",
  2479.        "    </tr>\n",
  2480.        "    <tr>\n",
  2481.        "      <th>50%</th>\n",
  2482.        "      <td>4.000000</td>\n",
  2483.        "      <td>7.000000</td>\n",
  2484.        "      <td>0.660000</td>\n",
  2485.        "      <td>1.000000</td>\n",
  2486.        "      <td>1.000000</td>\n",
  2487.        "      <td>13.500000</td>\n",
  2488.        "      <td>5.000000</td>\n",
  2489.        "      <td>185.710000</td>\n",
  2490.        "      <td>4.000000</td>\n",
  2491.        "      <td>2.000000</td>\n",
  2492.        "      <td>...</td>\n",
  2493.        "      <td>1.000000</td>\n",
  2494.        "      <td>12.000000</td>\n",
  2495.        "      <td>4.000000</td>\n",
  2496.        "      <td>182.350000</td>\n",
  2497.        "      <td>4.000000</td>\n",
  2498.        "      <td>2.000000</td>\n",
  2499.        "      <td>3.000000</td>\n",
  2500.        "      <td>2.000000</td>\n",
  2501.        "      <td>5.000000</td>\n",
  2502.        "      <td>0.000000</td>\n",
  2503.        "    </tr>\n",
  2504.        "    <tr>\n",
  2505.        "      <th>75%</th>\n",
  2506.        "      <td>6.000000</td>\n",
  2507.        "      <td>8.000000</td>\n",
  2508.        "      <td>0.720000</td>\n",
  2509.        "      <td>2.000000</td>\n",
  2510.        "      <td>2.000000</td>\n",
  2511.        "      <td>16.250000</td>\n",
  2512.        "      <td>7.000000</td>\n",
  2513.        "      <td>223.182500</td>\n",
  2514.        "      <td>4.000000</td>\n",
  2515.        "      <td>3.000000</td>\n",
  2516.        "      <td>...</td>\n",
  2517.        "      <td>2.000000</td>\n",
  2518.        "      <td>15.000000</td>\n",
  2519.        "      <td>6.000000</td>\n",
  2520.        "      <td>222.220000</td>\n",
  2521.        "      <td>4.000000</td>\n",
  2522.        "      <td>3.000000</td>\n",
  2523.        "      <td>5.000000</td>\n",
  2524.        "      <td>3.000000</td>\n",
  2525.        "      <td>7.000000</td>\n",
  2526.        "      <td>1.000000</td>\n",
  2527.        "    </tr>\n",
  2528.        "    <tr>\n",
  2529.        "      <th>max</th>\n",
  2530.        "      <td>7.000000</td>\n",
  2531.        "      <td>22.000000</td>\n",
  2532.        "      <td>0.880000</td>\n",
  2533.        "      <td>4.000000</td>\n",
  2534.        "      <td>6.000000</td>\n",
  2535.        "      <td>25.000000</td>\n",
  2536.        "      <td>17.000000</td>\n",
  2537.        "      <td>600.000000</td>\n",
  2538.        "      <td>6.000000</td>\n",
  2539.        "      <td>6.000000</td>\n",
  2540.        "      <td>...</td>\n",
  2541.        "      <td>5.000000</td>\n",
  2542.        "      <td>25.000000</td>\n",
  2543.        "      <td>14.000000</td>\n",
  2544.        "      <td>400.000000</td>\n",
  2545.        "      <td>8.000000</td>\n",
  2546.        "      <td>5.000000</td>\n",
  2547.        "      <td>9.000000</td>\n",
  2548.        "      <td>8.000000</td>\n",
  2549.        "      <td>16.000000</td>\n",
  2550.        "      <td>1.000000</td>\n",
  2551.        "    </tr>\n",
  2552.        "  </tbody>\n",
  2553.        "</table>\n",
  2554.        "<p>8 rows × 24 columns</p>\n",
  2555.        "</div>"
  2556.       ],
  2557.       "text/plain": [
  2558.        "        DayOfWeek  AvgWindSpeed  AvgHumidity  Inn 1 Team 1 NOP R>25,SR>125  \\\n",
  2559.        "count  328.000000    328.000000   328.000000                    328.000000   \n",
  2560.        "mean     4.006098      7.301829     0.633323                      1.411585   \n",
  2561.        "std      2.003046      2.183563     0.121442                      0.982159   \n",
  2562.        "min      1.000000      3.000000     0.160000                      0.000000   \n",
  2563.        "25%      2.000000      6.000000     0.580000                      1.000000   \n",
  2564.        "50%      4.000000      7.000000     0.660000                      1.000000   \n",
  2565.        "75%      6.000000      8.000000     0.720000                      2.000000   \n",
  2566.        "max      7.000000     22.000000     0.880000                      4.000000   \n",
  2567.        "\n",
  2568.        "       Inn 1 Team 1 NOP R<25, SR>125  Inn 1 Team 1 Total 4s  \\\n",
  2569.        "count                     328.000000             328.000000   \n",
  2570.        "mean                        1.490854              13.536585   \n",
  2571.        "std                         1.180852               4.729231   \n",
  2572.        "min                         0.000000               0.000000   \n",
  2573.        "25%                         1.000000              11.000000   \n",
  2574.        "50%                         1.000000              13.500000   \n",
  2575.        "75%                         2.000000              16.250000   \n",
  2576.        "max                         6.000000              25.000000   \n",
  2577.        "\n",
  2578.        "       Inn 1 Team 1 Total 6s  Inn 1 Team 1 Max Strike Rate_ALLBatsmen  \\\n",
  2579.        "count             328.000000                               328.000000   \n",
  2580.        "mean                4.945122                               199.352104   \n",
  2581.        "std                 3.012214                                72.673405   \n",
  2582.        "min                 0.000000                                 0.000000   \n",
  2583.        "25%                 3.000000                               161.110000   \n",
  2584.        "50%                 5.000000                               185.710000   \n",
  2585.        "75%                 7.000000                               223.182500   \n",
  2586.        "max                17.000000                               600.000000   \n",
  2587.        "\n",
  2588.        "       Inn 1 Team 2 NoP fast bowlers  Inn 1 Team 2 NoP Spinners  ...  \\\n",
  2589.        "count                     328.000000                 328.000000  ...   \n",
  2590.        "mean                        3.786585                   2.149390  ...   \n",
  2591.        "std                         1.012251                   1.013185  ...   \n",
  2592.        "min                         0.000000                   0.000000  ...   \n",
  2593.        "25%                         3.000000                   1.000000  ...   \n",
  2594.        "50%                         4.000000                   2.000000  ...   \n",
  2595.        "75%                         4.000000                   3.000000  ...   \n",
  2596.        "max                         6.000000                   6.000000  ...   \n",
  2597.        "\n",
  2598.        "       Inn 2 Team 2 NOP R<25, SR>125  Inn 2 Team 2 Total 4s  \\\n",
  2599.        "count                     328.000000             328.000000   \n",
  2600.        "mean                        1.289634              12.560976   \n",
  2601.        "std                         1.127207               4.327842   \n",
  2602.        "min                         0.000000               0.000000   \n",
  2603.        "25%                         0.000000              10.000000   \n",
  2604.        "50%                         1.000000              12.000000   \n",
  2605.        "75%                         2.000000              15.000000   \n",
  2606.        "max                         5.000000              25.000000   \n",
  2607.        "\n",
  2608.        "       Inn 2 Team 2 Total 6s  Inn 2 Team 2 Max Strike Rate_ALLBatsmen  \\\n",
  2609.        "count             328.000000                               328.000000   \n",
  2610.        "mean                4.506098                               189.311585   \n",
  2611.        "std                 2.788129                                60.710497   \n",
  2612.        "min                 0.000000                                 0.000000   \n",
  2613.        "25%                 2.000000                               153.092500   \n",
  2614.        "50%                 4.000000                               182.350000   \n",
  2615.        "75%                 6.000000                               222.220000   \n",
  2616.        "max                14.000000                               400.000000   \n",
  2617.        "\n",
  2618.        "       Inn 2 Team 1 NoP fast bowlers  Inn 2 Team 1 NoP Spinners  \\\n",
  2619.        "count                     328.000000                 328.000000   \n",
  2620.        "mean                        3.594512                   2.164634   \n",
  2621.        "std                         1.042037                   1.000168   \n",
  2622.        "min                         0.000000                   0.000000   \n",
  2623.        "25%                         3.000000                   1.000000   \n",
  2624.        "50%                         4.000000                   2.000000   \n",
  2625.        "75%                         4.000000                   3.000000   \n",
  2626.        "max                         8.000000                   5.000000   \n",
  2627.        "\n",
  2628.        "       Inn 2 Team 1 wickets taken_catches_runout  \\\n",
  2629.        "count                                 328.000000   \n",
  2630.        "mean                                    3.338415   \n",
  2631.        "std                                     2.068724   \n",
  2632.        "min                                     0.000000   \n",
  2633.        "25%                                     2.000000   \n",
  2634.        "50%                                     3.000000   \n",
  2635.        "75%                                     5.000000   \n",
  2636.        "max                                     9.000000   \n",
  2637.        "\n",
  2638.        "       Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping  \\\n",
  2639.        "count                                         328.000000                  \n",
  2640.        "mean                                            2.112805                  \n",
  2641.        "std                                             1.646817                  \n",
  2642.        "min                                             0.000000                  \n",
  2643.        "25%                                             1.000000                  \n",
  2644.        "50%                                             2.000000                  \n",
  2645.        "75%                                             3.000000                  \n",
  2646.        "max                                             8.000000                  \n",
  2647.        "\n",
  2648.        "       Inn 2 Team 1 Extras conceded in_wides_No Balls  \\\n",
  2649.        "count                                      328.000000   \n",
  2650.        "mean                                         5.073171   \n",
  2651.        "std                                          3.221793   \n",
  2652.        "min                                          0.000000   \n",
  2653.        "25%                                          3.000000   \n",
  2654.        "50%                                          5.000000   \n",
  2655.        "75%                                          7.000000   \n",
  2656.        "max                                         16.000000   \n",
  2657.        "\n",
  2658.        "       Winner (team 1=1, team 2=0)  \n",
  2659.        "count                   328.000000  \n",
  2660.        "mean                      0.442073  \n",
  2661.        "std                       0.497392  \n",
  2662.        "min                       0.000000  \n",
  2663.        "25%                       0.000000  \n",
  2664.        "50%                       0.000000  \n",
  2665.        "75%                       1.000000  \n",
  2666.        "max                       1.000000  \n",
  2667.        "\n",
  2668.        "[8 rows x 24 columns]"
  2669.       ]
  2670.      },
  2671.      "execution_count": 268,
  2672.      "metadata": {},
  2673.      "output_type": "execute_result"
  2674.     }
  2675.    ],
  2676.    "source": [
  2677.     "train_data.describe()"
  2678.    ]
  2679.   },
  2680.   {
  2681.    "cell_type": "code",
  2682.    "execution_count": 269,
  2683.    "metadata": {},
  2684.    "outputs": [
  2685.     {
  2686.      "data": {
  2687.       "image/png": "\n",
  2688.       "text/plain": [
  2689.        "<Figure size 936x648 with 3 Axes>"
  2690.       ]
  2691.      },
  2692.      "metadata": {
  2693.       "needs_background": "light"
  2694.      },
  2695.      "output_type": "display_data"
  2696.     }
  2697.    ],
  2698.    "source": [
  2699.     "#train_data.hist('AvgHumidity')\n",
  2700.     "\n",
  2701.     "plt.figure(figsize=(13,9))\n",
  2702.     "plt.subplot(221)\n",
  2703.     "sns.distplot(train_data['AvgHumidity'])\n",
  2704.     "plt.subplot(222)\n",
  2705.     "sns.distplot(train_data['Inn 1 Team 1 Max Strike Rate_ALLBatsmen'])\n",
  2706.     "plt.subplot(223)\n",
  2707.     "sns.distplot(train_data['Inn 2 Team 2 Max Strike Rate_ALLBatsmen'])\n",
  2708.     "plt.show()"
  2709.    ]
  2710.   },
  2711.   {
  2712.    "cell_type": "markdown",
  2713.    "metadata": {},
  2714.    "source": [
  2715.     "## Observations :\n",
  2716.     "\n",
  2717.     "1. AvgHumidity plot is <b>left skew</b> implies outliers is present to the left(below(Q1)<br/>\n",
  2718.     "2. 'Inn 1 Team 1 Max Strike Rate_ALLBatsmen' is <b>right skew</b> implies outliers is present to the right(above Q3)<br/>\n",
  2719.     "3. 'Inn 2 Team 2 Max Strike Rate_ALLBatsmen' is neither too left nor too right so we are moving to boxplot which purely show outliers are present or not"
  2720.    ]
  2721.   },
  2722.   {
  2723.    "cell_type": "code",
  2724.    "execution_count": 270,
  2725.    "metadata": {},
  2726.    "outputs": [
  2727.     {
  2728.      "data": {
  2729.       "image/png": "\n",
  2730.       "text/plain": [
  2731.        "<Figure size 936x648 with 3 Axes>"
  2732.       ]
  2733.      },
  2734.      "metadata": {
  2735.       "needs_background": "light"
  2736.      },
  2737.      "output_type": "display_data"
  2738.     }
  2739.    ],
  2740.    "source": [
  2741.     "plt.figure(figsize=(13,9))\n",
  2742.     "plt.subplot(221)\n",
  2743.     "plt.boxplot(train_data['AvgHumidity'])\n",
  2744.     "plt.xlabel('AvgHumidity')\n",
  2745.     "plt.subplot(222)\n",
  2746.     "plt.boxplot(train_data['Inn 1 Team 1 Max Strike Rate_ALLBatsmen'])\n",
  2747.     "plt.xlabel('Inn 1 Team 1 Max Strike Rate_ALLBatsmen')\n",
  2748.     "plt.subplot(223)\n",
  2749.     "plt.boxplot(train_data['Inn 2 Team 2 Max Strike Rate_ALLBatsmen'])\n",
  2750.     "plt.xlabel('Inn 2 Team 2 Max Strike Rate_ALLBatsmen')\n",
  2751.     "plt.show()"
  2752.    ]
  2753.   },
  2754.   {
  2755.    "cell_type": "markdown",
  2756.    "metadata": {},
  2757.    "source": [
  2758.     "### 3.2 Categorical Variables"
  2759.    ]
  2760.   },
  2761.   {
  2762.    "cell_type": "code",
  2763.    "execution_count": 271,
  2764.    "metadata": {},
  2765.    "outputs": [
  2766.     {
  2767.      "data": {
  2768.       "image/png": "\n",
  2769.       "text/plain": [
  2770.        "<Figure size 648x288 with 1 Axes>"
  2771.       ]
  2772.      },
  2773.      "metadata": {
  2774.       "needs_background": "light"
  2775.      },
  2776.      "output_type": "display_data"
  2777.     }
  2778.    ],
  2779.    "source": [
  2780.     "plt.figure(figsize=(9,4))\n",
  2781.     "sns.countplot(y='Team 1', data=train_data)\n",
  2782.     "plt.show()"
  2783.    ]
  2784.   },
  2785.   {
  2786.    "cell_type": "code",
  2787.    "execution_count": 272,
  2788.    "metadata": {},
  2789.    "outputs": [
  2790.     {
  2791.      "data": {
  2792.       "image/png": "\n",
  2793.       "text/plain": [
  2794.        "<Figure size 648x288 with 1 Axes>"
  2795.       ]
  2796.      },
  2797.      "metadata": {
  2798.       "needs_background": "light"
  2799.      },
  2800.      "output_type": "display_data"
  2801.     }
  2802.    ],
  2803.    "source": [
  2804.     "plt.figure(figsize=(9,4))\n",
  2805.     "sns.countplot(y='AvgWindSpeed', data=train_data)\n",
  2806.     "plt.show()"
  2807.    ]
  2808.   },
  2809.   {
  2810.    "cell_type": "markdown",
  2811.    "metadata": {},
  2812.    "source": [
  2813.     "## 4. Bivariate Analysis:"
  2814.    ]
  2815.   },
  2816.   {
  2817.    "cell_type": "markdown",
  2818.    "metadata": {},
  2819.    "source": [
  2820.     "### 4.1 Continuous-Continuous Variables"
  2821.    ]
  2822.   },
  2823.   {
  2824.    "cell_type": "code",
  2825.    "execution_count": 273,
  2826.    "metadata": {},
  2827.    "outputs": [
  2828.     {
  2829.      "data": {
  2830.       "text/html": [
  2831.        "<div>\n",
  2832.        "<style scoped>\n",
  2833.        "    .dataframe tbody tr th:only-of-type {\n",
  2834.        "        vertical-align: middle;\n",
  2835.        "    }\n",
  2836.        "\n",
  2837.        "    .dataframe tbody tr th {\n",
  2838.        "        vertical-align: top;\n",
  2839.        "    }\n",
  2840.        "\n",
  2841.        "    .dataframe thead th {\n",
  2842.        "        text-align: right;\n",
  2843.        "    }\n",
  2844.        "</style>\n",
  2845.        "<table border=\"1\" class=\"dataframe\">\n",
  2846.        "  <thead>\n",
  2847.        "    <tr style=\"text-align: right;\">\n",
  2848.        "      <th></th>\n",
  2849.        "      <th>DayOfWeek</th>\n",
  2850.        "      <th>AvgWindSpeed</th>\n",
  2851.        "      <th>AvgHumidity</th>\n",
  2852.        "      <th>Inn 1 Team 1 NOP R>25,SR>125</th>\n",
  2853.        "      <th>Inn 1 Team 1 NOP R<25, SR>125</th>\n",
  2854.        "      <th>Inn 1 Team 1 Total 4s</th>\n",
  2855.        "      <th>Inn 1 Team 1 Total 6s</th>\n",
  2856.        "      <th>Inn 1 Team 1 Max Strike Rate_ALLBatsmen</th>\n",
  2857.        "      <th>Inn 1 Team 2 NoP fast bowlers</th>\n",
  2858.        "      <th>Inn 1 Team 2 NoP Spinners</th>\n",
  2859.        "      <th>...</th>\n",
  2860.        "      <th>Inn 2 Team 2 NOP R<25, SR>125</th>\n",
  2861.        "      <th>Inn 2 Team 2 Total 4s</th>\n",
  2862.        "      <th>Inn 2 Team 2 Total 6s</th>\n",
  2863.        "      <th>Inn 2 Team 2 Max Strike Rate_ALLBatsmen</th>\n",
  2864.        "      <th>Inn 2 Team 1 NoP fast bowlers</th>\n",
  2865.        "      <th>Inn 2 Team 1 NoP Spinners</th>\n",
  2866.        "      <th>Inn 2 Team 1 wickets taken_catches_runout</th>\n",
  2867.        "      <th>Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping</th>\n",
  2868.        "      <th>Inn 2 Team 1 Extras conceded in_wides_No Balls</th>\n",
  2869.        "      <th>Winner (team 1=1, team 2=0)</th>\n",
  2870.        "    </tr>\n",
  2871.        "  </thead>\n",
  2872.        "  <tbody>\n",
  2873.        "    <tr>\n",
  2874.        "      <th>DayOfWeek</th>\n",
  2875.        "      <td>1.000000</td>\n",
  2876.        "      <td>0.006570</td>\n",
  2877.        "      <td>-0.054770</td>\n",
  2878.        "      <td>0.000275</td>\n",
  2879.        "      <td>-0.003855</td>\n",
  2880.        "      <td>-0.062329</td>\n",
  2881.        "      <td>-0.039985</td>\n",
  2882.        "      <td>-0.097170</td>\n",
  2883.        "      <td>-0.017455</td>\n",
  2884.        "      <td>0.121605</td>\n",
  2885.        "      <td>...</td>\n",
  2886.        "      <td>-0.098304</td>\n",
  2887.        "      <td>0.040173</td>\n",
  2888.        "      <td>0.012040</td>\n",
  2889.        "      <td>0.068158</td>\n",
  2890.        "      <td>-0.013463</td>\n",
  2891.        "      <td>0.126194</td>\n",
  2892.        "      <td>-0.035186</td>\n",
  2893.        "      <td>-0.063250</td>\n",
  2894.        "      <td>0.019833</td>\n",
  2895.        "      <td>-0.107076</td>\n",
  2896.        "    </tr>\n",
  2897.        "    <tr>\n",
  2898.        "      <th>AvgWindSpeed</th>\n",
  2899.        "      <td>0.006570</td>\n",
  2900.        "      <td>1.000000</td>\n",
  2901.        "      <td>-0.432911</td>\n",
  2902.        "      <td>0.001787</td>\n",
  2903.        "      <td>-0.082540</td>\n",
  2904.        "      <td>0.005887</td>\n",
  2905.        "      <td>-0.046758</td>\n",
  2906.        "      <td>-0.006207</td>\n",
  2907.        "      <td>0.031999</td>\n",
  2908.        "      <td>-0.126879</td>\n",
  2909.        "      <td>...</td>\n",
  2910.        "      <td>-0.071657</td>\n",
  2911.        "      <td>-0.124438</td>\n",
  2912.        "      <td>-0.005578</td>\n",
  2913.        "      <td>-0.041836</td>\n",
  2914.        "      <td>0.006913</td>\n",
  2915.        "      <td>-0.106839</td>\n",
  2916.        "      <td>0.045695</td>\n",
  2917.        "      <td>-0.086037</td>\n",
  2918.        "      <td>0.088573</td>\n",
  2919.        "      <td>0.009108</td>\n",
  2920.        "    </tr>\n",
  2921.        "    <tr>\n",
  2922.        "      <th>AvgHumidity</th>\n",
  2923.        "      <td>-0.054770</td>\n",
  2924.        "      <td>-0.432911</td>\n",
  2925.        "      <td>1.000000</td>\n",
  2926.        "      <td>-0.081753</td>\n",
  2927.        "      <td>-0.093937</td>\n",
  2928.        "      <td>-0.218124</td>\n",
  2929.        "      <td>-0.066796</td>\n",
  2930.        "      <td>-0.151057</td>\n",
  2931.        "      <td>-0.109890</td>\n",
  2932.        "      <td>0.103570</td>\n",
  2933.        "      <td>...</td>\n",
  2934.        "      <td>0.007245</td>\n",
  2935.        "      <td>-0.066339</td>\n",
  2936.        "      <td>-0.158611</td>\n",
  2937.        "      <td>-0.031976</td>\n",
  2938.        "      <td>-0.125614</td>\n",
  2939.        "      <td>0.075294</td>\n",
  2940.        "      <td>-0.076673</td>\n",
  2941.        "      <td>0.097053</td>\n",
  2942.        "      <td>-0.042595</td>\n",
  2943.        "      <td>-0.014270</td>\n",
  2944.        "    </tr>\n",
  2945.        "    <tr>\n",
  2946.        "      <th>Inn 1 Team 1 NOP R>25,SR>125</th>\n",
  2947.        "      <td>0.000275</td>\n",
  2948.        "      <td>0.001787</td>\n",
  2949.        "      <td>-0.081753</td>\n",
  2950.        "      <td>1.000000</td>\n",
  2951.        "      <td>-0.027067</td>\n",
  2952.        "      <td>0.557363</td>\n",
  2953.        "      <td>0.569978</td>\n",
  2954.        "      <td>0.289513</td>\n",
  2955.        "      <td>0.196281</td>\n",
  2956.        "      <td>0.067094</td>\n",
  2957.        "      <td>...</td>\n",
  2958.        "      <td>0.262138</td>\n",
  2959.        "      <td>0.286533</td>\n",
  2960.        "      <td>0.380452</td>\n",
  2961.        "      <td>0.295449</td>\n",
  2962.        "      <td>0.139664</td>\n",
  2963.        "      <td>0.102031</td>\n",
  2964.        "      <td>0.384275</td>\n",
  2965.        "      <td>0.207546</td>\n",
  2966.        "      <td>0.005916</td>\n",
  2967.        "      <td>0.365082</td>\n",
  2968.        "    </tr>\n",
  2969.        "    <tr>\n",
  2970.        "      <th>Inn 1 Team 1 NOP R<25, SR>125</th>\n",
  2971.        "      <td>-0.003855</td>\n",
  2972.        "      <td>-0.082540</td>\n",
  2973.        "      <td>-0.093937</td>\n",
  2974.        "      <td>-0.027067</td>\n",
  2975.        "      <td>1.000000</td>\n",
  2976.        "      <td>0.172281</td>\n",
  2977.        "      <td>0.160631</td>\n",
  2978.        "      <td>0.315771</td>\n",
  2979.        "      <td>0.059764</td>\n",
  2980.        "      <td>0.127670</td>\n",
  2981.        "      <td>...</td>\n",
  2982.        "      <td>0.131804</td>\n",
  2983.        "      <td>0.122481</td>\n",
  2984.        "      <td>0.246626</td>\n",
  2985.        "      <td>0.165402</td>\n",
  2986.        "      <td>0.107571</td>\n",
  2987.        "      <td>0.081547</td>\n",
  2988.        "      <td>0.102045</td>\n",
  2989.        "      <td>0.064221</td>\n",
  2990.        "      <td>-0.013489</td>\n",
  2991.        "      <td>0.124055</td>\n",
  2992.        "    </tr>\n",
  2993.        "    <tr>\n",
  2994.        "      <th>Inn 1 Team 1 Total 4s</th>\n",
  2995.        "      <td>-0.062329</td>\n",
  2996.        "      <td>0.005887</td>\n",
  2997.        "      <td>-0.218124</td>\n",
  2998.        "      <td>0.557363</td>\n",
  2999.        "      <td>0.172281</td>\n",
  3000.        "      <td>1.000000</td>\n",
  3001.        "      <td>0.324726</td>\n",
  3002.        "      <td>0.362544</td>\n",
  3003.        "      <td>0.369592</td>\n",
  3004.        "      <td>0.046404</td>\n",
  3005.        "      <td>...</td>\n",
  3006.        "      <td>0.331018</td>\n",
  3007.        "      <td>0.487876</td>\n",
  3008.        "      <td>0.409796</td>\n",
  3009.        "      <td>0.345807</td>\n",
  3010.        "      <td>0.317329</td>\n",
  3011.        "      <td>0.106047</td>\n",
  3012.        "      <td>0.392111</td>\n",
  3013.        "      <td>0.177932</td>\n",
  3014.        "      <td>0.148548</td>\n",
  3015.        "      <td>0.326568</td>\n",
  3016.        "    </tr>\n",
  3017.        "    <tr>\n",
  3018.        "      <th>Inn 1 Team 1 Total 6s</th>\n",
  3019.        "      <td>-0.039985</td>\n",
  3020.        "      <td>-0.046758</td>\n",
  3021.        "      <td>-0.066796</td>\n",
  3022.        "      <td>0.569978</td>\n",
  3023.        "      <td>0.160631</td>\n",
  3024.        "      <td>0.324726</td>\n",
  3025.        "      <td>1.000000</td>\n",
  3026.        "      <td>0.451683</td>\n",
  3027.        "      <td>0.153610</td>\n",
  3028.        "      <td>0.136966</td>\n",
  3029.        "      <td>...</td>\n",
  3030.        "      <td>0.326233</td>\n",
  3031.        "      <td>0.252199</td>\n",
  3032.        "      <td>0.481053</td>\n",
  3033.        "      <td>0.323435</td>\n",
  3034.        "      <td>0.170208</td>\n",
  3035.        "      <td>0.029400</td>\n",
  3036.        "      <td>0.370564</td>\n",
  3037.        "      <td>0.227501</td>\n",
  3038.        "      <td>-0.030781</td>\n",
  3039.        "      <td>0.387725</td>\n",
  3040.        "    </tr>\n",
  3041.        "    <tr>\n",
  3042.        "      <th>Inn 1 Team 1 Max Strike Rate_ALLBatsmen</th>\n",
  3043.        "      <td>-0.097170</td>\n",
  3044.        "      <td>-0.006207</td>\n",
  3045.        "      <td>-0.151057</td>\n",
  3046.        "      <td>0.289513</td>\n",
  3047.        "      <td>0.315771</td>\n",
  3048.        "      <td>0.362544</td>\n",
  3049.        "      <td>0.451683</td>\n",
  3050.        "      <td>1.000000</td>\n",
  3051.        "      <td>0.253472</td>\n",
  3052.        "      <td>0.101793</td>\n",
  3053.        "      <td>...</td>\n",
  3054.        "      <td>0.231103</td>\n",
  3055.        "      <td>0.268043</td>\n",
  3056.        "      <td>0.331854</td>\n",
  3057.        "      <td>0.257099</td>\n",
  3058.        "      <td>0.252695</td>\n",
  3059.        "      <td>0.011742</td>\n",
  3060.        "      <td>0.293498</td>\n",
  3061.        "      <td>0.122148</td>\n",
  3062.        "      <td>0.016467</td>\n",
  3063.        "      <td>0.216820</td>\n",
  3064.        "    </tr>\n",
  3065.        "    <tr>\n",
  3066.        "      <th>Inn 1 Team 2 NoP fast bowlers</th>\n",
  3067.        "      <td>-0.017455</td>\n",
  3068.        "      <td>0.031999</td>\n",
  3069.        "      <td>-0.109890</td>\n",
  3070.        "      <td>0.196281</td>\n",
  3071.        "      <td>0.059764</td>\n",
  3072.        "      <td>0.369592</td>\n",
  3073.        "      <td>0.153610</td>\n",
  3074.        "      <td>0.253472</td>\n",
  3075.        "      <td>1.000000</td>\n",
  3076.        "      <td>-0.404158</td>\n",
  3077.        "      <td>...</td>\n",
  3078.        "      <td>0.121343</td>\n",
  3079.        "      <td>0.289882</td>\n",
  3080.        "      <td>0.169497</td>\n",
  3081.        "      <td>0.263009</td>\n",
  3082.        "      <td>0.355490</td>\n",
  3083.        "      <td>0.052934</td>\n",
  3084.        "      <td>0.208378</td>\n",
  3085.        "      <td>0.080528</td>\n",
  3086.        "      <td>0.242980</td>\n",
  3087.        "      <td>0.090775</td>\n",
  3088.        "    </tr>\n",
  3089.        "    <tr>\n",
  3090.        "      <th>Inn 1 Team 2 NoP Spinners</th>\n",
  3091.        "      <td>0.121605</td>\n",
  3092.        "      <td>-0.126879</td>\n",
  3093.        "      <td>0.103570</td>\n",
  3094.        "      <td>0.067094</td>\n",
  3095.        "      <td>0.127670</td>\n",
  3096.        "      <td>0.046404</td>\n",
  3097.        "      <td>0.136966</td>\n",
  3098.        "      <td>0.101793</td>\n",
  3099.        "      <td>-0.404158</td>\n",
  3100.        "      <td>1.000000</td>\n",
  3101.        "      <td>...</td>\n",
  3102.        "      <td>0.074461</td>\n",
  3103.        "      <td>0.088232</td>\n",
  3104.        "      <td>0.146363</td>\n",
  3105.        "      <td>0.168113</td>\n",
  3106.        "      <td>0.074930</td>\n",
  3107.        "      <td>0.271400</td>\n",
  3108.        "      <td>0.050216</td>\n",
  3109.        "      <td>0.121832</td>\n",
  3110.        "      <td>-0.002422</td>\n",
  3111.        "      <td>0.062736</td>\n",
  3112.        "    </tr>\n",
  3113.        "    <tr>\n",
  3114.        "      <th>Inn 1 Team 2 wickets taken_catches_runout</th>\n",
  3115.        "      <td>0.089845</td>\n",
  3116.        "      <td>-0.067991</td>\n",
  3117.        "      <td>0.041704</td>\n",
  3118.        "      <td>-0.090929</td>\n",
  3119.        "      <td>0.286304</td>\n",
  3120.        "      <td>-0.094074</td>\n",
  3121.        "      <td>-0.084993</td>\n",
  3122.        "      <td>0.033392</td>\n",
  3123.        "      <td>0.201752</td>\n",
  3124.        "      <td>0.051603</td>\n",
  3125.        "      <td>...</td>\n",
  3126.        "      <td>-0.049250</td>\n",
  3127.        "      <td>0.018962</td>\n",
  3128.        "      <td>0.045296</td>\n",
  3129.        "      <td>0.069792</td>\n",
  3130.        "      <td>0.190803</td>\n",
  3131.        "      <td>0.103813</td>\n",
  3132.        "      <td>-0.046018</td>\n",
  3133.        "      <td>-0.044393</td>\n",
  3134.        "      <td>0.145519</td>\n",
  3135.        "      <td>-0.127405</td>\n",
  3136.        "    </tr>\n",
  3137.        "    <tr>\n",
  3138.        "      <th>Inn1 Team 2 wickets taken_ bowled _lbw_caught by keeper_stumping</th>\n",
  3139.        "      <td>0.085253</td>\n",
  3140.        "      <td>0.077526</td>\n",
  3141.        "      <td>-0.150730</td>\n",
  3142.        "      <td>-0.338452</td>\n",
  3143.        "      <td>0.051589</td>\n",
  3144.        "      <td>-0.160736</td>\n",
  3145.        "      <td>-0.318899</td>\n",
  3146.        "      <td>-0.033672</td>\n",
  3147.        "      <td>0.139486</td>\n",
  3148.        "      <td>-0.027483</td>\n",
  3149.        "      <td>...</td>\n",
  3150.        "      <td>-0.097969</td>\n",
  3151.        "      <td>-0.020577</td>\n",
  3152.        "      <td>-0.203386</td>\n",
  3153.        "      <td>-0.036640</td>\n",
  3154.        "      <td>0.157553</td>\n",
  3155.        "      <td>-0.073528</td>\n",
  3156.        "      <td>-0.150670</td>\n",
  3157.        "      <td>-0.049367</td>\n",
  3158.        "      <td>0.060416</td>\n",
  3159.        "      <td>-0.198553</td>\n",
  3160.        "    </tr>\n",
  3161.        "    <tr>\n",
  3162.        "      <th>Inn 1 Team 2 Extras conceded in_wides_No Balls</th>\n",
  3163.        "      <td>0.026258</td>\n",
  3164.        "      <td>0.055039</td>\n",
  3165.        "      <td>-0.042146</td>\n",
  3166.        "      <td>0.073031</td>\n",
  3167.        "      <td>-0.000502</td>\n",
  3168.        "      <td>0.172214</td>\n",
  3169.        "      <td>0.083791</td>\n",
  3170.        "      <td>0.140323</td>\n",
  3171.        "      <td>0.195105</td>\n",
  3172.        "      <td>0.071469</td>\n",
  3173.        "      <td>...</td>\n",
  3174.        "      <td>0.073799</td>\n",
  3175.        "      <td>0.182326</td>\n",
  3176.        "      <td>0.217114</td>\n",
  3177.        "      <td>0.135521</td>\n",
  3178.        "      <td>0.185254</td>\n",
  3179.        "      <td>0.029191</td>\n",
  3180.        "      <td>0.070230</td>\n",
  3181.        "      <td>0.046109</td>\n",
  3182.        "      <td>0.193029</td>\n",
  3183.        "      <td>-0.002472</td>\n",
  3184.        "    </tr>\n",
  3185.        "    <tr>\n",
  3186.        "      <th>Inn 2 Team 2 NOP R>25,SR>125</th>\n",
  3187.        "      <td>0.098442</td>\n",
  3188.        "      <td>-0.007117</td>\n",
  3189.        "      <td>-0.220708</td>\n",
  3190.        "      <td>0.377688</td>\n",
  3191.        "      <td>0.156986</td>\n",
  3192.        "      <td>0.371475</td>\n",
  3193.        "      <td>0.381539</td>\n",
  3194.        "      <td>0.291806</td>\n",
  3195.        "      <td>0.152478</td>\n",
  3196.        "      <td>0.064060</td>\n",
  3197.        "      <td>...</td>\n",
  3198.        "      <td>0.009474</td>\n",
  3199.        "      <td>0.490216</td>\n",
  3200.        "      <td>0.611973</td>\n",
  3201.        "      <td>0.382301</td>\n",
  3202.        "      <td>0.214265</td>\n",
  3203.        "      <td>0.021190</td>\n",
  3204.        "      <td>0.068317</td>\n",
  3205.        "      <td>-0.184564</td>\n",
  3206.        "      <td>-0.041520</td>\n",
  3207.        "      <td>-0.092912</td>\n",
  3208.        "    </tr>\n",
  3209.        "    <tr>\n",
  3210.        "      <th>Inn 2 Team 2 NOP R<25, SR>125</th>\n",
  3211.        "      <td>-0.098304</td>\n",
  3212.        "      <td>-0.071657</td>\n",
  3213.        "      <td>0.007245</td>\n",
  3214.        "      <td>0.262138</td>\n",
  3215.        "      <td>0.131804</td>\n",
  3216.        "      <td>0.331018</td>\n",
  3217.        "      <td>0.326233</td>\n",
  3218.        "      <td>0.231103</td>\n",
  3219.        "      <td>0.121343</td>\n",
  3220.        "      <td>0.074461</td>\n",
  3221.        "      <td>...</td>\n",
  3222.        "      <td>1.000000</td>\n",
  3223.        "      <td>0.224863</td>\n",
  3224.        "      <td>0.199398</td>\n",
  3225.        "      <td>0.355058</td>\n",
  3226.        "      <td>0.058635</td>\n",
  3227.        "      <td>0.079639</td>\n",
  3228.        "      <td>0.398480</td>\n",
  3229.        "      <td>0.308534</td>\n",
  3230.        "      <td>-0.032800</td>\n",
  3231.        "      <td>0.305465</td>\n",
  3232.        "    </tr>\n",
  3233.        "    <tr>\n",
  3234.        "      <th>Inn 2 Team 2 Total 4s</th>\n",
  3235.        "      <td>0.040173</td>\n",
  3236.        "      <td>-0.124438</td>\n",
  3237.        "      <td>-0.066339</td>\n",
  3238.        "      <td>0.286533</td>\n",
  3239.        "      <td>0.122481</td>\n",
  3240.        "      <td>0.487876</td>\n",
  3241.        "      <td>0.252199</td>\n",
  3242.        "      <td>0.268043</td>\n",
  3243.        "      <td>0.289882</td>\n",
  3244.        "      <td>0.088232</td>\n",
  3245.        "      <td>...</td>\n",
  3246.        "      <td>0.224863</td>\n",
  3247.        "      <td>1.000000</td>\n",
  3248.        "      <td>0.266584</td>\n",
  3249.        "      <td>0.476050</td>\n",
  3250.        "      <td>0.302849</td>\n",
  3251.        "      <td>0.148157</td>\n",
  3252.        "      <td>-0.025026</td>\n",
  3253.        "      <td>-0.068548</td>\n",
  3254.        "      <td>0.060870</td>\n",
  3255.        "      <td>-0.145390</td>\n",
  3256.        "    </tr>\n",
  3257.        "    <tr>\n",
  3258.        "      <th>Inn 2 Team 2 Total 6s</th>\n",
  3259.        "      <td>0.012040</td>\n",
  3260.        "      <td>-0.005578</td>\n",
  3261.        "      <td>-0.158611</td>\n",
  3262.        "      <td>0.380452</td>\n",
  3263.        "      <td>0.246626</td>\n",
  3264.        "      <td>0.409796</td>\n",
  3265.        "      <td>0.481053</td>\n",
  3266.        "      <td>0.331854</td>\n",
  3267.        "      <td>0.169497</td>\n",
  3268.        "      <td>0.146363</td>\n",
  3269.        "      <td>...</td>\n",
  3270.        "      <td>0.199398</td>\n",
  3271.        "      <td>0.266584</td>\n",
  3272.        "      <td>1.000000</td>\n",
  3273.        "      <td>0.463410</td>\n",
  3274.        "      <td>0.204528</td>\n",
  3275.        "      <td>0.072018</td>\n",
  3276.        "      <td>0.086858</td>\n",
  3277.        "      <td>-0.092395</td>\n",
  3278.        "      <td>0.034675</td>\n",
  3279.        "      <td>-0.058181</td>\n",
  3280.        "    </tr>\n",
  3281.        "    <tr>\n",
  3282.        "      <th>Inn 2 Team 2 Max Strike Rate_ALLBatsmen</th>\n",
  3283.        "      <td>0.068158</td>\n",
  3284.        "      <td>-0.041836</td>\n",
  3285.        "      <td>-0.031976</td>\n",
  3286.        "      <td>0.295449</td>\n",
  3287.        "      <td>0.165402</td>\n",
  3288.        "      <td>0.345807</td>\n",
  3289.        "      <td>0.323435</td>\n",
  3290.        "      <td>0.257099</td>\n",
  3291.        "      <td>0.263009</td>\n",
  3292.        "      <td>0.168113</td>\n",
  3293.        "      <td>...</td>\n",
  3294.        "      <td>0.355058</td>\n",
  3295.        "      <td>0.476050</td>\n",
  3296.        "      <td>0.463410</td>\n",
  3297.        "      <td>1.000000</td>\n",
  3298.        "      <td>0.165378</td>\n",
  3299.        "      <td>0.172949</td>\n",
  3300.        "      <td>0.168232</td>\n",
  3301.        "      <td>0.034031</td>\n",
  3302.        "      <td>0.079442</td>\n",
  3303.        "      <td>-0.047209</td>\n",
  3304.        "    </tr>\n",
  3305.        "    <tr>\n",
  3306.        "      <th>Inn 2 Team 1 NoP fast bowlers</th>\n",
  3307.        "      <td>-0.013463</td>\n",
  3308.        "      <td>0.006913</td>\n",
  3309.        "      <td>-0.125614</td>\n",
  3310.        "      <td>0.139664</td>\n",
  3311.        "      <td>0.107571</td>\n",
  3312.        "      <td>0.317329</td>\n",
  3313.        "      <td>0.170208</td>\n",
  3314.        "      <td>0.252695</td>\n",
  3315.        "      <td>0.355490</td>\n",
  3316.        "      <td>0.074930</td>\n",
  3317.        "      <td>...</td>\n",
  3318.        "      <td>0.058635</td>\n",
  3319.        "      <td>0.302849</td>\n",
  3320.        "      <td>0.204528</td>\n",
  3321.        "      <td>0.165378</td>\n",
  3322.        "      <td>1.000000</td>\n",
  3323.        "      <td>-0.367085</td>\n",
  3324.        "      <td>0.124852</td>\n",
  3325.        "      <td>0.039211</td>\n",
  3326.        "      <td>0.147322</td>\n",
  3327.        "      <td>0.034196</td>\n",
  3328.        "    </tr>\n",
  3329.        "    <tr>\n",
  3330.        "      <th>Inn 2 Team 1 NoP Spinners</th>\n",
  3331.        "      <td>0.126194</td>\n",
  3332.        "      <td>-0.106839</td>\n",
  3333.        "      <td>0.075294</td>\n",
  3334.        "      <td>0.102031</td>\n",
  3335.        "      <td>0.081547</td>\n",
  3336.        "      <td>0.106047</td>\n",
  3337.        "      <td>0.029400</td>\n",
  3338.        "      <td>0.011742</td>\n",
  3339.        "      <td>0.052934</td>\n",
  3340.        "      <td>0.271400</td>\n",
  3341.        "      <td>...</td>\n",
  3342.        "      <td>0.079639</td>\n",
  3343.        "      <td>0.148157</td>\n",
  3344.        "      <td>0.072018</td>\n",
  3345.        "      <td>0.172949</td>\n",
  3346.        "      <td>-0.367085</td>\n",
  3347.        "      <td>1.000000</td>\n",
  3348.        "      <td>0.100099</td>\n",
  3349.        "      <td>0.048104</td>\n",
  3350.        "      <td>0.059835</td>\n",
  3351.        "      <td>0.056112</td>\n",
  3352.        "    </tr>\n",
  3353.        "    <tr>\n",
  3354.        "      <th>Inn 2 Team 1 wickets taken_catches_runout</th>\n",
  3355.        "      <td>-0.035186</td>\n",
  3356.        "      <td>0.045695</td>\n",
  3357.        "      <td>-0.076673</td>\n",
  3358.        "      <td>0.384275</td>\n",
  3359.        "      <td>0.102045</td>\n",
  3360.        "      <td>0.392111</td>\n",
  3361.        "      <td>0.370564</td>\n",
  3362.        "      <td>0.293498</td>\n",
  3363.        "      <td>0.208378</td>\n",
  3364.        "      <td>0.050216</td>\n",
  3365.        "      <td>...</td>\n",
  3366.        "      <td>0.398480</td>\n",
  3367.        "      <td>-0.025026</td>\n",
  3368.        "      <td>0.086858</td>\n",
  3369.        "      <td>0.168232</td>\n",
  3370.        "      <td>0.124852</td>\n",
  3371.        "      <td>0.100099</td>\n",
  3372.        "      <td>1.000000</td>\n",
  3373.        "      <td>0.243691</td>\n",
  3374.        "      <td>0.044451</td>\n",
  3375.        "      <td>0.686327</td>\n",
  3376.        "    </tr>\n",
  3377.        "    <tr>\n",
  3378.        "      <th>Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping</th>\n",
  3379.        "      <td>-0.063250</td>\n",
  3380.        "      <td>-0.086037</td>\n",
  3381.        "      <td>0.097053</td>\n",
  3382.        "      <td>0.207546</td>\n",
  3383.        "      <td>0.064221</td>\n",
  3384.        "      <td>0.177932</td>\n",
  3385.        "      <td>0.227501</td>\n",
  3386.        "      <td>0.122148</td>\n",
  3387.        "      <td>0.080528</td>\n",
  3388.        "      <td>0.121832</td>\n",
  3389.        "      <td>...</td>\n",
  3390.        "      <td>0.308534</td>\n",
  3391.        "      <td>-0.068548</td>\n",
  3392.        "      <td>-0.092395</td>\n",
  3393.        "      <td>0.034031</td>\n",
  3394.        "      <td>0.039211</td>\n",
  3395.        "      <td>0.048104</td>\n",
  3396.        "      <td>0.243691</td>\n",
  3397.        "      <td>1.000000</td>\n",
  3398.        "      <td>-0.034991</td>\n",
  3399.        "      <td>0.532549</td>\n",
  3400.        "    </tr>\n",
  3401.        "    <tr>\n",
  3402.        "      <th>Inn 2 Team 1 Extras conceded in_wides_No Balls</th>\n",
  3403.        "      <td>0.019833</td>\n",
  3404.        "      <td>0.088573</td>\n",
  3405.        "      <td>-0.042595</td>\n",
  3406.        "      <td>0.005916</td>\n",
  3407.        "      <td>-0.013489</td>\n",
  3408.        "      <td>0.148548</td>\n",
  3409.        "      <td>-0.030781</td>\n",
  3410.        "      <td>0.016467</td>\n",
  3411.        "      <td>0.242980</td>\n",
  3412.        "      <td>-0.002422</td>\n",
  3413.        "      <td>...</td>\n",
  3414.        "      <td>-0.032800</td>\n",
  3415.        "      <td>0.060870</td>\n",
  3416.        "      <td>0.034675</td>\n",
  3417.        "      <td>0.079442</td>\n",
  3418.        "      <td>0.147322</td>\n",
  3419.        "      <td>0.059835</td>\n",
  3420.        "      <td>0.044451</td>\n",
  3421.        "      <td>-0.034991</td>\n",
  3422.        "      <td>1.000000</td>\n",
  3423.        "      <td>-0.083222</td>\n",
  3424.        "    </tr>\n",
  3425.        "    <tr>\n",
  3426.        "      <th>Winner (team 1=1, team 2=0)</th>\n",
  3427.        "      <td>-0.107076</td>\n",
  3428.        "      <td>0.009108</td>\n",
  3429.        "      <td>-0.014270</td>\n",
  3430.        "      <td>0.365082</td>\n",
  3431.        "      <td>0.124055</td>\n",
  3432.        "      <td>0.326568</td>\n",
  3433.        "      <td>0.387725</td>\n",
  3434.        "      <td>0.216820</td>\n",
  3435.        "      <td>0.090775</td>\n",
  3436.        "      <td>0.062736</td>\n",
  3437.        "      <td>...</td>\n",
  3438.        "      <td>0.305465</td>\n",
  3439.        "      <td>-0.145390</td>\n",
  3440.        "      <td>-0.058181</td>\n",
  3441.        "      <td>-0.047209</td>\n",
  3442.        "      <td>0.034196</td>\n",
  3443.        "      <td>0.056112</td>\n",
  3444.        "      <td>0.686327</td>\n",
  3445.        "      <td>0.532549</td>\n",
  3446.        "      <td>-0.083222</td>\n",
  3447.        "      <td>1.000000</td>\n",
  3448.        "    </tr>\n",
  3449.        "  </tbody>\n",
  3450.        "</table>\n",
  3451.        "<p>24 rows × 24 columns</p>\n",
  3452.        "</div>"
  3453.       ],
  3454.       "text/plain": [
  3455.        "                                                    DayOfWeek  AvgWindSpeed  \\\n",
  3456.        "DayOfWeek                                            1.000000      0.006570   \n",
  3457.        "AvgWindSpeed                                         0.006570      1.000000   \n",
  3458.        "AvgHumidity                                         -0.054770     -0.432911   \n",
  3459.        "Inn 1 Team 1 NOP R>25,SR>125                         0.000275      0.001787   \n",
  3460.        "Inn 1 Team 1 NOP R<25, SR>125                       -0.003855     -0.082540   \n",
  3461.        "Inn 1 Team 1 Total 4s                               -0.062329      0.005887   \n",
  3462.        "Inn 1 Team 1 Total 6s                               -0.039985     -0.046758   \n",
  3463.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen             -0.097170     -0.006207   \n",
  3464.        "Inn 1 Team 2 NoP fast bowlers                       -0.017455      0.031999   \n",
  3465.        "Inn 1 Team 2 NoP Spinners                            0.121605     -0.126879   \n",
  3466.        "Inn 1 Team 2 wickets taken_catches_runout            0.089845     -0.067991   \n",
  3467.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...   0.085253      0.077526   \n",
  3468.        "Inn 1 Team 2 Extras conceded in_wides_No Balls       0.026258      0.055039   \n",
  3469.        "Inn 2 Team 2 NOP R>25,SR>125                         0.098442     -0.007117   \n",
  3470.        "Inn 2 Team 2 NOP R<25, SR>125                       -0.098304     -0.071657   \n",
  3471.        "Inn 2 Team 2 Total 4s                                0.040173     -0.124438   \n",
  3472.        "Inn 2 Team 2 Total 6s                                0.012040     -0.005578   \n",
  3473.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen              0.068158     -0.041836   \n",
  3474.        "Inn 2 Team 1 NoP fast bowlers                       -0.013463      0.006913   \n",
  3475.        "Inn 2 Team 1 NoP Spinners                            0.126194     -0.106839   \n",
  3476.        "Inn 2 Team 1 wickets taken_catches_runout           -0.035186      0.045695   \n",
  3477.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...  -0.063250     -0.086037   \n",
  3478.        "Inn 2 Team 1 Extras conceded in_wides_No Balls       0.019833      0.088573   \n",
  3479.        "Winner (team 1=1, team 2=0)                         -0.107076      0.009108   \n",
  3480.        "\n",
  3481.        "                                                    AvgHumidity  \\\n",
  3482.        "DayOfWeek                                             -0.054770   \n",
  3483.        "AvgWindSpeed                                          -0.432911   \n",
  3484.        "AvgHumidity                                            1.000000   \n",
  3485.        "Inn 1 Team 1 NOP R>25,SR>125                          -0.081753   \n",
  3486.        "Inn 1 Team 1 NOP R<25, SR>125                         -0.093937   \n",
  3487.        "Inn 1 Team 1 Total 4s                                 -0.218124   \n",
  3488.        "Inn 1 Team 1 Total 6s                                 -0.066796   \n",
  3489.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen               -0.151057   \n",
  3490.        "Inn 1 Team 2 NoP fast bowlers                         -0.109890   \n",
  3491.        "Inn 1 Team 2 NoP Spinners                              0.103570   \n",
  3492.        "Inn 1 Team 2 wickets taken_catches_runout              0.041704   \n",
  3493.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...    -0.150730   \n",
  3494.        "Inn 1 Team 2 Extras conceded in_wides_No Balls        -0.042146   \n",
  3495.        "Inn 2 Team 2 NOP R>25,SR>125                          -0.220708   \n",
  3496.        "Inn 2 Team 2 NOP R<25, SR>125                          0.007245   \n",
  3497.        "Inn 2 Team 2 Total 4s                                 -0.066339   \n",
  3498.        "Inn 2 Team 2 Total 6s                                 -0.158611   \n",
  3499.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen               -0.031976   \n",
  3500.        "Inn 2 Team 1 NoP fast bowlers                         -0.125614   \n",
  3501.        "Inn 2 Team 1 NoP Spinners                              0.075294   \n",
  3502.        "Inn 2 Team 1 wickets taken_catches_runout             -0.076673   \n",
  3503.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...     0.097053   \n",
  3504.        "Inn 2 Team 1 Extras conceded in_wides_No Balls        -0.042595   \n",
  3505.        "Winner (team 1=1, team 2=0)                           -0.014270   \n",
  3506.        "\n",
  3507.        "                                                    Inn 1 Team 1 NOP R>25,SR>125  \\\n",
  3508.        "DayOfWeek                                                               0.000275   \n",
  3509.        "AvgWindSpeed                                                            0.001787   \n",
  3510.        "AvgHumidity                                                            -0.081753   \n",
  3511.        "Inn 1 Team 1 NOP R>25,SR>125                                            1.000000   \n",
  3512.        "Inn 1 Team 1 NOP R<25, SR>125                                          -0.027067   \n",
  3513.        "Inn 1 Team 1 Total 4s                                                   0.557363   \n",
  3514.        "Inn 1 Team 1 Total 6s                                                   0.569978   \n",
  3515.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                                 0.289513   \n",
  3516.        "Inn 1 Team 2 NoP fast bowlers                                           0.196281   \n",
  3517.        "Inn 1 Team 2 NoP Spinners                                               0.067094   \n",
  3518.        "Inn 1 Team 2 wickets taken_catches_runout                              -0.090929   \n",
  3519.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                     -0.338452   \n",
  3520.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                          0.073031   \n",
  3521.        "Inn 2 Team 2 NOP R>25,SR>125                                            0.377688   \n",
  3522.        "Inn 2 Team 2 NOP R<25, SR>125                                           0.262138   \n",
  3523.        "Inn 2 Team 2 Total 4s                                                   0.286533   \n",
  3524.        "Inn 2 Team 2 Total 6s                                                   0.380452   \n",
  3525.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                                 0.295449   \n",
  3526.        "Inn 2 Team 1 NoP fast bowlers                                           0.139664   \n",
  3527.        "Inn 2 Team 1 NoP Spinners                                               0.102031   \n",
  3528.        "Inn 2 Team 1 wickets taken_catches_runout                               0.384275   \n",
  3529.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                      0.207546   \n",
  3530.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                          0.005916   \n",
  3531.        "Winner (team 1=1, team 2=0)                                             0.365082   \n",
  3532.        "\n",
  3533.        "                                                    Inn 1 Team 1 NOP R<25, SR>125  \\\n",
  3534.        "DayOfWeek                                                               -0.003855   \n",
  3535.        "AvgWindSpeed                                                            -0.082540   \n",
  3536.        "AvgHumidity                                                             -0.093937   \n",
  3537.        "Inn 1 Team 1 NOP R>25,SR>125                                            -0.027067   \n",
  3538.        "Inn 1 Team 1 NOP R<25, SR>125                                            1.000000   \n",
  3539.        "Inn 1 Team 1 Total 4s                                                    0.172281   \n",
  3540.        "Inn 1 Team 1 Total 6s                                                    0.160631   \n",
  3541.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                                  0.315771   \n",
  3542.        "Inn 1 Team 2 NoP fast bowlers                                            0.059764   \n",
  3543.        "Inn 1 Team 2 NoP Spinners                                                0.127670   \n",
  3544.        "Inn 1 Team 2 wickets taken_catches_runout                                0.286304   \n",
  3545.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                       0.051589   \n",
  3546.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                          -0.000502   \n",
  3547.        "Inn 2 Team 2 NOP R>25,SR>125                                             0.156986   \n",
  3548.        "Inn 2 Team 2 NOP R<25, SR>125                                            0.131804   \n",
  3549.        "Inn 2 Team 2 Total 4s                                                    0.122481   \n",
  3550.        "Inn 2 Team 2 Total 6s                                                    0.246626   \n",
  3551.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                                  0.165402   \n",
  3552.        "Inn 2 Team 1 NoP fast bowlers                                            0.107571   \n",
  3553.        "Inn 2 Team 1 NoP Spinners                                                0.081547   \n",
  3554.        "Inn 2 Team 1 wickets taken_catches_runout                                0.102045   \n",
  3555.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                       0.064221   \n",
  3556.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                          -0.013489   \n",
  3557.        "Winner (team 1=1, team 2=0)                                              0.124055   \n",
  3558.        "\n",
  3559.        "                                                    Inn 1 Team 1 Total 4s  \\\n",
  3560.        "DayOfWeek                                                       -0.062329   \n",
  3561.        "AvgWindSpeed                                                     0.005887   \n",
  3562.        "AvgHumidity                                                     -0.218124   \n",
  3563.        "Inn 1 Team 1 NOP R>25,SR>125                                     0.557363   \n",
  3564.        "Inn 1 Team 1 NOP R<25, SR>125                                    0.172281   \n",
  3565.        "Inn 1 Team 1 Total 4s                                            1.000000   \n",
  3566.        "Inn 1 Team 1 Total 6s                                            0.324726   \n",
  3567.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                          0.362544   \n",
  3568.        "Inn 1 Team 2 NoP fast bowlers                                    0.369592   \n",
  3569.        "Inn 1 Team 2 NoP Spinners                                        0.046404   \n",
  3570.        "Inn 1 Team 2 wickets taken_catches_runout                       -0.094074   \n",
  3571.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...              -0.160736   \n",
  3572.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                   0.172214   \n",
  3573.        "Inn 2 Team 2 NOP R>25,SR>125                                     0.371475   \n",
  3574.        "Inn 2 Team 2 NOP R<25, SR>125                                    0.331018   \n",
  3575.        "Inn 2 Team 2 Total 4s                                            0.487876   \n",
  3576.        "Inn 2 Team 2 Total 6s                                            0.409796   \n",
  3577.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                          0.345807   \n",
  3578.        "Inn 2 Team 1 NoP fast bowlers                                    0.317329   \n",
  3579.        "Inn 2 Team 1 NoP Spinners                                        0.106047   \n",
  3580.        "Inn 2 Team 1 wickets taken_catches_runout                        0.392111   \n",
  3581.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...               0.177932   \n",
  3582.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                   0.148548   \n",
  3583.        "Winner (team 1=1, team 2=0)                                      0.326568   \n",
  3584.        "\n",
  3585.        "                                                    Inn 1 Team 1 Total 6s  \\\n",
  3586.        "DayOfWeek                                                       -0.039985   \n",
  3587.        "AvgWindSpeed                                                    -0.046758   \n",
  3588.        "AvgHumidity                                                     -0.066796   \n",
  3589.        "Inn 1 Team 1 NOP R>25,SR>125                                     0.569978   \n",
  3590.        "Inn 1 Team 1 NOP R<25, SR>125                                    0.160631   \n",
  3591.        "Inn 1 Team 1 Total 4s                                            0.324726   \n",
  3592.        "Inn 1 Team 1 Total 6s                                            1.000000   \n",
  3593.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                          0.451683   \n",
  3594.        "Inn 1 Team 2 NoP fast bowlers                                    0.153610   \n",
  3595.        "Inn 1 Team 2 NoP Spinners                                        0.136966   \n",
  3596.        "Inn 1 Team 2 wickets taken_catches_runout                       -0.084993   \n",
  3597.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...              -0.318899   \n",
  3598.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                   0.083791   \n",
  3599.        "Inn 2 Team 2 NOP R>25,SR>125                                     0.381539   \n",
  3600.        "Inn 2 Team 2 NOP R<25, SR>125                                    0.326233   \n",
  3601.        "Inn 2 Team 2 Total 4s                                            0.252199   \n",
  3602.        "Inn 2 Team 2 Total 6s                                            0.481053   \n",
  3603.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                          0.323435   \n",
  3604.        "Inn 2 Team 1 NoP fast bowlers                                    0.170208   \n",
  3605.        "Inn 2 Team 1 NoP Spinners                                        0.029400   \n",
  3606.        "Inn 2 Team 1 wickets taken_catches_runout                        0.370564   \n",
  3607.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...               0.227501   \n",
  3608.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                  -0.030781   \n",
  3609.        "Winner (team 1=1, team 2=0)                                      0.387725   \n",
  3610.        "\n",
  3611.        "                                                    Inn 1 Team 1 Max Strike Rate_ALLBatsmen  \\\n",
  3612.        "DayOfWeek                                                                         -0.097170   \n",
  3613.        "AvgWindSpeed                                                                      -0.006207   \n",
  3614.        "AvgHumidity                                                                       -0.151057   \n",
  3615.        "Inn 1 Team 1 NOP R>25,SR>125                                                       0.289513   \n",
  3616.        "Inn 1 Team 1 NOP R<25, SR>125                                                      0.315771   \n",
  3617.        "Inn 1 Team 1 Total 4s                                                              0.362544   \n",
  3618.        "Inn 1 Team 1 Total 6s                                                              0.451683   \n",
  3619.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                                            1.000000   \n",
  3620.        "Inn 1 Team 2 NoP fast bowlers                                                      0.253472   \n",
  3621.        "Inn 1 Team 2 NoP Spinners                                                          0.101793   \n",
  3622.        "Inn 1 Team 2 wickets taken_catches_runout                                          0.033392   \n",
  3623.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                                -0.033672   \n",
  3624.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                                     0.140323   \n",
  3625.        "Inn 2 Team 2 NOP R>25,SR>125                                                       0.291806   \n",
  3626.        "Inn 2 Team 2 NOP R<25, SR>125                                                      0.231103   \n",
  3627.        "Inn 2 Team 2 Total 4s                                                              0.268043   \n",
  3628.        "Inn 2 Team 2 Total 6s                                                              0.331854   \n",
  3629.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                                            0.257099   \n",
  3630.        "Inn 2 Team 1 NoP fast bowlers                                                      0.252695   \n",
  3631.        "Inn 2 Team 1 NoP Spinners                                                          0.011742   \n",
  3632.        "Inn 2 Team 1 wickets taken_catches_runout                                          0.293498   \n",
  3633.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                                 0.122148   \n",
  3634.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                                     0.016467   \n",
  3635.        "Winner (team 1=1, team 2=0)                                                        0.216820   \n",
  3636.        "\n",
  3637.        "                                                    Inn 1 Team 2 NoP fast bowlers  \\\n",
  3638.        "DayOfWeek                                                               -0.017455   \n",
  3639.        "AvgWindSpeed                                                             0.031999   \n",
  3640.        "AvgHumidity                                                             -0.109890   \n",
  3641.        "Inn 1 Team 1 NOP R>25,SR>125                                             0.196281   \n",
  3642.        "Inn 1 Team 1 NOP R<25, SR>125                                            0.059764   \n",
  3643.        "Inn 1 Team 1 Total 4s                                                    0.369592   \n",
  3644.        "Inn 1 Team 1 Total 6s                                                    0.153610   \n",
  3645.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                                  0.253472   \n",
  3646.        "Inn 1 Team 2 NoP fast bowlers                                            1.000000   \n",
  3647.        "Inn 1 Team 2 NoP Spinners                                               -0.404158   \n",
  3648.        "Inn 1 Team 2 wickets taken_catches_runout                                0.201752   \n",
  3649.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                       0.139486   \n",
  3650.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                           0.195105   \n",
  3651.        "Inn 2 Team 2 NOP R>25,SR>125                                             0.152478   \n",
  3652.        "Inn 2 Team 2 NOP R<25, SR>125                                            0.121343   \n",
  3653.        "Inn 2 Team 2 Total 4s                                                    0.289882   \n",
  3654.        "Inn 2 Team 2 Total 6s                                                    0.169497   \n",
  3655.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                                  0.263009   \n",
  3656.        "Inn 2 Team 1 NoP fast bowlers                                            0.355490   \n",
  3657.        "Inn 2 Team 1 NoP Spinners                                                0.052934   \n",
  3658.        "Inn 2 Team 1 wickets taken_catches_runout                                0.208378   \n",
  3659.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                       0.080528   \n",
  3660.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                           0.242980   \n",
  3661.        "Winner (team 1=1, team 2=0)                                              0.090775   \n",
  3662.        "\n",
  3663.        "                                                    Inn 1 Team 2 NoP Spinners  \\\n",
  3664.        "DayOfWeek                                                            0.121605   \n",
  3665.        "AvgWindSpeed                                                        -0.126879   \n",
  3666.        "AvgHumidity                                                          0.103570   \n",
  3667.        "Inn 1 Team 1 NOP R>25,SR>125                                         0.067094   \n",
  3668.        "Inn 1 Team 1 NOP R<25, SR>125                                        0.127670   \n",
  3669.        "Inn 1 Team 1 Total 4s                                                0.046404   \n",
  3670.        "Inn 1 Team 1 Total 6s                                                0.136966   \n",
  3671.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                              0.101793   \n",
  3672.        "Inn 1 Team 2 NoP fast bowlers                                       -0.404158   \n",
  3673.        "Inn 1 Team 2 NoP Spinners                                            1.000000   \n",
  3674.        "Inn 1 Team 2 wickets taken_catches_runout                            0.051603   \n",
  3675.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                  -0.027483   \n",
  3676.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                       0.071469   \n",
  3677.        "Inn 2 Team 2 NOP R>25,SR>125                                         0.064060   \n",
  3678.        "Inn 2 Team 2 NOP R<25, SR>125                                        0.074461   \n",
  3679.        "Inn 2 Team 2 Total 4s                                                0.088232   \n",
  3680.        "Inn 2 Team 2 Total 6s                                                0.146363   \n",
  3681.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                              0.168113   \n",
  3682.        "Inn 2 Team 1 NoP fast bowlers                                        0.074930   \n",
  3683.        "Inn 2 Team 1 NoP Spinners                                            0.271400   \n",
  3684.        "Inn 2 Team 1 wickets taken_catches_runout                            0.050216   \n",
  3685.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                   0.121832   \n",
  3686.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                      -0.002422   \n",
  3687.        "Winner (team 1=1, team 2=0)                                          0.062736   \n",
  3688.        "\n",
  3689.        "                                                    ...  \\\n",
  3690.        "DayOfWeek                                           ...   \n",
  3691.        "AvgWindSpeed                                        ...   \n",
  3692.        "AvgHumidity                                         ...   \n",
  3693.        "Inn 1 Team 1 NOP R>25,SR>125                        ...   \n",
  3694.        "Inn 1 Team 1 NOP R<25, SR>125                       ...   \n",
  3695.        "Inn 1 Team 1 Total 4s                               ...   \n",
  3696.        "Inn 1 Team 1 Total 6s                               ...   \n",
  3697.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen             ...   \n",
  3698.        "Inn 1 Team 2 NoP fast bowlers                       ...   \n",
  3699.        "Inn 1 Team 2 NoP Spinners                           ...   \n",
  3700.        "Inn 1 Team 2 wickets taken_catches_runout           ...   \n",
  3701.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...  ...   \n",
  3702.        "Inn 1 Team 2 Extras conceded in_wides_No Balls      ...   \n",
  3703.        "Inn 2 Team 2 NOP R>25,SR>125                        ...   \n",
  3704.        "Inn 2 Team 2 NOP R<25, SR>125                       ...   \n",
  3705.        "Inn 2 Team 2 Total 4s                               ...   \n",
  3706.        "Inn 2 Team 2 Total 6s                               ...   \n",
  3707.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen             ...   \n",
  3708.        "Inn 2 Team 1 NoP fast bowlers                       ...   \n",
  3709.        "Inn 2 Team 1 NoP Spinners                           ...   \n",
  3710.        "Inn 2 Team 1 wickets taken_catches_runout           ...   \n",
  3711.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...  ...   \n",
  3712.        "Inn 2 Team 1 Extras conceded in_wides_No Balls      ...   \n",
  3713.        "Winner (team 1=1, team 2=0)                         ...   \n",
  3714.        "\n",
  3715.        "                                                    Inn 2 Team 2 NOP R<25, SR>125  \\\n",
  3716.        "DayOfWeek                                                               -0.098304   \n",
  3717.        "AvgWindSpeed                                                            -0.071657   \n",
  3718.        "AvgHumidity                                                              0.007245   \n",
  3719.        "Inn 1 Team 1 NOP R>25,SR>125                                             0.262138   \n",
  3720.        "Inn 1 Team 1 NOP R<25, SR>125                                            0.131804   \n",
  3721.        "Inn 1 Team 1 Total 4s                                                    0.331018   \n",
  3722.        "Inn 1 Team 1 Total 6s                                                    0.326233   \n",
  3723.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                                  0.231103   \n",
  3724.        "Inn 1 Team 2 NoP fast bowlers                                            0.121343   \n",
  3725.        "Inn 1 Team 2 NoP Spinners                                                0.074461   \n",
  3726.        "Inn 1 Team 2 wickets taken_catches_runout                               -0.049250   \n",
  3727.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                      -0.097969   \n",
  3728.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                           0.073799   \n",
  3729.        "Inn 2 Team 2 NOP R>25,SR>125                                             0.009474   \n",
  3730.        "Inn 2 Team 2 NOP R<25, SR>125                                            1.000000   \n",
  3731.        "Inn 2 Team 2 Total 4s                                                    0.224863   \n",
  3732.        "Inn 2 Team 2 Total 6s                                                    0.199398   \n",
  3733.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                                  0.355058   \n",
  3734.        "Inn 2 Team 1 NoP fast bowlers                                            0.058635   \n",
  3735.        "Inn 2 Team 1 NoP Spinners                                                0.079639   \n",
  3736.        "Inn 2 Team 1 wickets taken_catches_runout                                0.398480   \n",
  3737.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                       0.308534   \n",
  3738.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                          -0.032800   \n",
  3739.        "Winner (team 1=1, team 2=0)                                              0.305465   \n",
  3740.        "\n",
  3741.        "                                                    Inn 2 Team 2 Total 4s  \\\n",
  3742.        "DayOfWeek                                                        0.040173   \n",
  3743.        "AvgWindSpeed                                                    -0.124438   \n",
  3744.        "AvgHumidity                                                     -0.066339   \n",
  3745.        "Inn 1 Team 1 NOP R>25,SR>125                                     0.286533   \n",
  3746.        "Inn 1 Team 1 NOP R<25, SR>125                                    0.122481   \n",
  3747.        "Inn 1 Team 1 Total 4s                                            0.487876   \n",
  3748.        "Inn 1 Team 1 Total 6s                                            0.252199   \n",
  3749.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                          0.268043   \n",
  3750.        "Inn 1 Team 2 NoP fast bowlers                                    0.289882   \n",
  3751.        "Inn 1 Team 2 NoP Spinners                                        0.088232   \n",
  3752.        "Inn 1 Team 2 wickets taken_catches_runout                        0.018962   \n",
  3753.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...              -0.020577   \n",
  3754.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                   0.182326   \n",
  3755.        "Inn 2 Team 2 NOP R>25,SR>125                                     0.490216   \n",
  3756.        "Inn 2 Team 2 NOP R<25, SR>125                                    0.224863   \n",
  3757.        "Inn 2 Team 2 Total 4s                                            1.000000   \n",
  3758.        "Inn 2 Team 2 Total 6s                                            0.266584   \n",
  3759.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                          0.476050   \n",
  3760.        "Inn 2 Team 1 NoP fast bowlers                                    0.302849   \n",
  3761.        "Inn 2 Team 1 NoP Spinners                                        0.148157   \n",
  3762.        "Inn 2 Team 1 wickets taken_catches_runout                       -0.025026   \n",
  3763.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...              -0.068548   \n",
  3764.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                   0.060870   \n",
  3765.        "Winner (team 1=1, team 2=0)                                     -0.145390   \n",
  3766.        "\n",
  3767.        "                                                    Inn 2 Team 2 Total 6s  \\\n",
  3768.        "DayOfWeek                                                        0.012040   \n",
  3769.        "AvgWindSpeed                                                    -0.005578   \n",
  3770.        "AvgHumidity                                                     -0.158611   \n",
  3771.        "Inn 1 Team 1 NOP R>25,SR>125                                     0.380452   \n",
  3772.        "Inn 1 Team 1 NOP R<25, SR>125                                    0.246626   \n",
  3773.        "Inn 1 Team 1 Total 4s                                            0.409796   \n",
  3774.        "Inn 1 Team 1 Total 6s                                            0.481053   \n",
  3775.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                          0.331854   \n",
  3776.        "Inn 1 Team 2 NoP fast bowlers                                    0.169497   \n",
  3777.        "Inn 1 Team 2 NoP Spinners                                        0.146363   \n",
  3778.        "Inn 1 Team 2 wickets taken_catches_runout                        0.045296   \n",
  3779.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...              -0.203386   \n",
  3780.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                   0.217114   \n",
  3781.        "Inn 2 Team 2 NOP R>25,SR>125                                     0.611973   \n",
  3782.        "Inn 2 Team 2 NOP R<25, SR>125                                    0.199398   \n",
  3783.        "Inn 2 Team 2 Total 4s                                            0.266584   \n",
  3784.        "Inn 2 Team 2 Total 6s                                            1.000000   \n",
  3785.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                          0.463410   \n",
  3786.        "Inn 2 Team 1 NoP fast bowlers                                    0.204528   \n",
  3787.        "Inn 2 Team 1 NoP Spinners                                        0.072018   \n",
  3788.        "Inn 2 Team 1 wickets taken_catches_runout                        0.086858   \n",
  3789.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...              -0.092395   \n",
  3790.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                   0.034675   \n",
  3791.        "Winner (team 1=1, team 2=0)                                     -0.058181   \n",
  3792.        "\n",
  3793.        "                                                    Inn 2 Team 2 Max Strike Rate_ALLBatsmen  \\\n",
  3794.        "DayOfWeek                                                                          0.068158   \n",
  3795.        "AvgWindSpeed                                                                      -0.041836   \n",
  3796.        "AvgHumidity                                                                       -0.031976   \n",
  3797.        "Inn 1 Team 1 NOP R>25,SR>125                                                       0.295449   \n",
  3798.        "Inn 1 Team 1 NOP R<25, SR>125                                                      0.165402   \n",
  3799.        "Inn 1 Team 1 Total 4s                                                              0.345807   \n",
  3800.        "Inn 1 Team 1 Total 6s                                                              0.323435   \n",
  3801.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                                            0.257099   \n",
  3802.        "Inn 1 Team 2 NoP fast bowlers                                                      0.263009   \n",
  3803.        "Inn 1 Team 2 NoP Spinners                                                          0.168113   \n",
  3804.        "Inn 1 Team 2 wickets taken_catches_runout                                          0.069792   \n",
  3805.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                                -0.036640   \n",
  3806.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                                     0.135521   \n",
  3807.        "Inn 2 Team 2 NOP R>25,SR>125                                                       0.382301   \n",
  3808.        "Inn 2 Team 2 NOP R<25, SR>125                                                      0.355058   \n",
  3809.        "Inn 2 Team 2 Total 4s                                                              0.476050   \n",
  3810.        "Inn 2 Team 2 Total 6s                                                              0.463410   \n",
  3811.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                                            1.000000   \n",
  3812.        "Inn 2 Team 1 NoP fast bowlers                                                      0.165378   \n",
  3813.        "Inn 2 Team 1 NoP Spinners                                                          0.172949   \n",
  3814.        "Inn 2 Team 1 wickets taken_catches_runout                                          0.168232   \n",
  3815.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                                 0.034031   \n",
  3816.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                                     0.079442   \n",
  3817.        "Winner (team 1=1, team 2=0)                                                       -0.047209   \n",
  3818.        "\n",
  3819.        "                                                    Inn 2 Team 1 NoP fast bowlers  \\\n",
  3820.        "DayOfWeek                                                               -0.013463   \n",
  3821.        "AvgWindSpeed                                                             0.006913   \n",
  3822.        "AvgHumidity                                                             -0.125614   \n",
  3823.        "Inn 1 Team 1 NOP R>25,SR>125                                             0.139664   \n",
  3824.        "Inn 1 Team 1 NOP R<25, SR>125                                            0.107571   \n",
  3825.        "Inn 1 Team 1 Total 4s                                                    0.317329   \n",
  3826.        "Inn 1 Team 1 Total 6s                                                    0.170208   \n",
  3827.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                                  0.252695   \n",
  3828.        "Inn 1 Team 2 NoP fast bowlers                                            0.355490   \n",
  3829.        "Inn 1 Team 2 NoP Spinners                                                0.074930   \n",
  3830.        "Inn 1 Team 2 wickets taken_catches_runout                                0.190803   \n",
  3831.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                       0.157553   \n",
  3832.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                           0.185254   \n",
  3833.        "Inn 2 Team 2 NOP R>25,SR>125                                             0.214265   \n",
  3834.        "Inn 2 Team 2 NOP R<25, SR>125                                            0.058635   \n",
  3835.        "Inn 2 Team 2 Total 4s                                                    0.302849   \n",
  3836.        "Inn 2 Team 2 Total 6s                                                    0.204528   \n",
  3837.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                                  0.165378   \n",
  3838.        "Inn 2 Team 1 NoP fast bowlers                                            1.000000   \n",
  3839.        "Inn 2 Team 1 NoP Spinners                                               -0.367085   \n",
  3840.        "Inn 2 Team 1 wickets taken_catches_runout                                0.124852   \n",
  3841.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                       0.039211   \n",
  3842.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                           0.147322   \n",
  3843.        "Winner (team 1=1, team 2=0)                                              0.034196   \n",
  3844.        "\n",
  3845.        "                                                    Inn 2 Team 1 NoP Spinners  \\\n",
  3846.        "DayOfWeek                                                            0.126194   \n",
  3847.        "AvgWindSpeed                                                        -0.106839   \n",
  3848.        "AvgHumidity                                                          0.075294   \n",
  3849.        "Inn 1 Team 1 NOP R>25,SR>125                                         0.102031   \n",
  3850.        "Inn 1 Team 1 NOP R<25, SR>125                                        0.081547   \n",
  3851.        "Inn 1 Team 1 Total 4s                                                0.106047   \n",
  3852.        "Inn 1 Team 1 Total 6s                                                0.029400   \n",
  3853.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                              0.011742   \n",
  3854.        "Inn 1 Team 2 NoP fast bowlers                                        0.052934   \n",
  3855.        "Inn 1 Team 2 NoP Spinners                                            0.271400   \n",
  3856.        "Inn 1 Team 2 wickets taken_catches_runout                            0.103813   \n",
  3857.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                  -0.073528   \n",
  3858.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                       0.029191   \n",
  3859.        "Inn 2 Team 2 NOP R>25,SR>125                                         0.021190   \n",
  3860.        "Inn 2 Team 2 NOP R<25, SR>125                                        0.079639   \n",
  3861.        "Inn 2 Team 2 Total 4s                                                0.148157   \n",
  3862.        "Inn 2 Team 2 Total 6s                                                0.072018   \n",
  3863.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                              0.172949   \n",
  3864.        "Inn 2 Team 1 NoP fast bowlers                                       -0.367085   \n",
  3865.        "Inn 2 Team 1 NoP Spinners                                            1.000000   \n",
  3866.        "Inn 2 Team 1 wickets taken_catches_runout                            0.100099   \n",
  3867.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                   0.048104   \n",
  3868.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                       0.059835   \n",
  3869.        "Winner (team 1=1, team 2=0)                                          0.056112   \n",
  3870.        "\n",
  3871.        "                                                    Inn 2 Team 1 wickets taken_catches_runout  \\\n",
  3872.        "DayOfWeek                                                                           -0.035186   \n",
  3873.        "AvgWindSpeed                                                                         0.045695   \n",
  3874.        "AvgHumidity                                                                         -0.076673   \n",
  3875.        "Inn 1 Team 1 NOP R>25,SR>125                                                         0.384275   \n",
  3876.        "Inn 1 Team 1 NOP R<25, SR>125                                                        0.102045   \n",
  3877.        "Inn 1 Team 1 Total 4s                                                                0.392111   \n",
  3878.        "Inn 1 Team 1 Total 6s                                                                0.370564   \n",
  3879.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                                              0.293498   \n",
  3880.        "Inn 1 Team 2 NoP fast bowlers                                                        0.208378   \n",
  3881.        "Inn 1 Team 2 NoP Spinners                                                            0.050216   \n",
  3882.        "Inn 1 Team 2 wickets taken_catches_runout                                           -0.046018   \n",
  3883.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                                  -0.150670   \n",
  3884.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                                       0.070230   \n",
  3885.        "Inn 2 Team 2 NOP R>25,SR>125                                                         0.068317   \n",
  3886.        "Inn 2 Team 2 NOP R<25, SR>125                                                        0.398480   \n",
  3887.        "Inn 2 Team 2 Total 4s                                                               -0.025026   \n",
  3888.        "Inn 2 Team 2 Total 6s                                                                0.086858   \n",
  3889.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                                              0.168232   \n",
  3890.        "Inn 2 Team 1 NoP fast bowlers                                                        0.124852   \n",
  3891.        "Inn 2 Team 1 NoP Spinners                                                            0.100099   \n",
  3892.        "Inn 2 Team 1 wickets taken_catches_runout                                            1.000000   \n",
  3893.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                                   0.243691   \n",
  3894.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                                       0.044451   \n",
  3895.        "Winner (team 1=1, team 2=0)                                                          0.686327   \n",
  3896.        "\n",
  3897.        "                                                    Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping  \\\n",
  3898.        "DayOfWeek                                                                                   -0.063250                  \n",
  3899.        "AvgWindSpeed                                                                                -0.086037                  \n",
  3900.        "AvgHumidity                                                                                  0.097053                  \n",
  3901.        "Inn 1 Team 1 NOP R>25,SR>125                                                                 0.207546                  \n",
  3902.        "Inn 1 Team 1 NOP R<25, SR>125                                                                0.064221                  \n",
  3903.        "Inn 1 Team 1 Total 4s                                                                        0.177932                  \n",
  3904.        "Inn 1 Team 1 Total 6s                                                                        0.227501                  \n",
  3905.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                                                      0.122148                  \n",
  3906.        "Inn 1 Team 2 NoP fast bowlers                                                                0.080528                  \n",
  3907.        "Inn 1 Team 2 NoP Spinners                                                                    0.121832                  \n",
  3908.        "Inn 1 Team 2 wickets taken_catches_runout                                                   -0.044393                  \n",
  3909.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                                          -0.049367                  \n",
  3910.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                                               0.046109                  \n",
  3911.        "Inn 2 Team 2 NOP R>25,SR>125                                                                -0.184564                  \n",
  3912.        "Inn 2 Team 2 NOP R<25, SR>125                                                                0.308534                  \n",
  3913.        "Inn 2 Team 2 Total 4s                                                                       -0.068548                  \n",
  3914.        "Inn 2 Team 2 Total 6s                                                                       -0.092395                  \n",
  3915.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                                                      0.034031                  \n",
  3916.        "Inn 2 Team 1 NoP fast bowlers                                                                0.039211                  \n",
  3917.        "Inn 2 Team 1 NoP Spinners                                                                    0.048104                  \n",
  3918.        "Inn 2 Team 1 wickets taken_catches_runout                                                    0.243691                  \n",
  3919.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                                           1.000000                  \n",
  3920.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                                              -0.034991                  \n",
  3921.        "Winner (team 1=1, team 2=0)                                                                  0.532549                  \n",
  3922.        "\n",
  3923.        "                                                    Inn 2 Team 1 Extras conceded in_wides_No Balls  \\\n",
  3924.        "DayOfWeek                                                                                 0.019833   \n",
  3925.        "AvgWindSpeed                                                                              0.088573   \n",
  3926.        "AvgHumidity                                                                              -0.042595   \n",
  3927.        "Inn 1 Team 1 NOP R>25,SR>125                                                              0.005916   \n",
  3928.        "Inn 1 Team 1 NOP R<25, SR>125                                                            -0.013489   \n",
  3929.        "Inn 1 Team 1 Total 4s                                                                     0.148548   \n",
  3930.        "Inn 1 Team 1 Total 6s                                                                    -0.030781   \n",
  3931.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                                                   0.016467   \n",
  3932.        "Inn 1 Team 2 NoP fast bowlers                                                             0.242980   \n",
  3933.        "Inn 1 Team 2 NoP Spinners                                                                -0.002422   \n",
  3934.        "Inn 1 Team 2 wickets taken_catches_runout                                                 0.145519   \n",
  3935.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                                        0.060416   \n",
  3936.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                                            0.193029   \n",
  3937.        "Inn 2 Team 2 NOP R>25,SR>125                                                             -0.041520   \n",
  3938.        "Inn 2 Team 2 NOP R<25, SR>125                                                            -0.032800   \n",
  3939.        "Inn 2 Team 2 Total 4s                                                                     0.060870   \n",
  3940.        "Inn 2 Team 2 Total 6s                                                                     0.034675   \n",
  3941.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                                                   0.079442   \n",
  3942.        "Inn 2 Team 1 NoP fast bowlers                                                             0.147322   \n",
  3943.        "Inn 2 Team 1 NoP Spinners                                                                 0.059835   \n",
  3944.        "Inn 2 Team 1 wickets taken_catches_runout                                                 0.044451   \n",
  3945.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                                       -0.034991   \n",
  3946.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                                            1.000000   \n",
  3947.        "Winner (team 1=1, team 2=0)                                                              -0.083222   \n",
  3948.        "\n",
  3949.        "                                                    Winner (team 1=1, team 2=0)  \n",
  3950.        "DayOfWeek                                                             -0.107076  \n",
  3951.        "AvgWindSpeed                                                           0.009108  \n",
  3952.        "AvgHumidity                                                           -0.014270  \n",
  3953.        "Inn 1 Team 1 NOP R>25,SR>125                                           0.365082  \n",
  3954.        "Inn 1 Team 1 NOP R<25, SR>125                                          0.124055  \n",
  3955.        "Inn 1 Team 1 Total 4s                                                  0.326568  \n",
  3956.        "Inn 1 Team 1 Total 6s                                                  0.387725  \n",
  3957.        "Inn 1 Team 1 Max Strike Rate_ALLBatsmen                                0.216820  \n",
  3958.        "Inn 1 Team 2 NoP fast bowlers                                          0.090775  \n",
  3959.        "Inn 1 Team 2 NoP Spinners                                              0.062736  \n",
  3960.        "Inn 1 Team 2 wickets taken_catches_runout                             -0.127405  \n",
  3961.        "Inn1 Team 2 wickets taken_ bowled _lbw_caught b...                    -0.198553  \n",
  3962.        "Inn 1 Team 2 Extras conceded in_wides_No Balls                        -0.002472  \n",
  3963.        "Inn 2 Team 2 NOP R>25,SR>125                                          -0.092912  \n",
  3964.        "Inn 2 Team 2 NOP R<25, SR>125                                          0.305465  \n",
  3965.        "Inn 2 Team 2 Total 4s                                                 -0.145390  \n",
  3966.        "Inn 2 Team 2 Total 6s                                                 -0.058181  \n",
  3967.        "Inn 2 Team 2 Max Strike Rate_ALLBatsmen                               -0.047209  \n",
  3968.        "Inn 2 Team 1 NoP fast bowlers                                          0.034196  \n",
  3969.        "Inn 2 Team 1 NoP Spinners                                              0.056112  \n",
  3970.        "Inn 2 Team 1 wickets taken_catches_runout                              0.686327  \n",
  3971.        "Inn2 Team 1 wickets taken_ bowled _lbw_caught b...                     0.532549  \n",
  3972.        "Inn 2 Team 1 Extras conceded in_wides_No Balls                        -0.083222  \n",
  3973.        "Winner (team 1=1, team 2=0)                                            1.000000  \n",
  3974.        "\n",
  3975.        "[24 rows x 24 columns]"
  3976.       ]
  3977.      },
  3978.      "execution_count": 273,
  3979.      "metadata": {},
  3980.      "output_type": "execute_result"
  3981.     }
  3982.    ],
  3983.    "source": [
  3984.     "train_data.corr()"
  3985.    ]
  3986.   },
  3987.   {
  3988.    "cell_type": "markdown",
  3989.    "metadata": {},
  3990.    "source": [
  3991.     "# Observations :\n",
  3992.     "we can't able to remove any variables because correlation is low"
  3993.    ]
  3994.   },
  3995.   {
  3996.    "cell_type": "markdown",
  3997.    "metadata": {},
  3998.    "source": [
  3999.     "### 4.2 Categorical-continuous variables:"
  4000.    ]
  4001.   },
  4002.   {
  4003.    "cell_type": "code",
  4004.    "execution_count": 274,
  4005.    "metadata": {},
  4006.    "outputs": [
  4007.     {
  4008.      "data": {
  4009.       "text/plain": [
  4010.        "Winner (team 1=1, team 2=0)\n",
  4011.        "0    0.634863\n",
  4012.        "1    0.631379\n",
  4013.        "Name: AvgHumidity, dtype: float64"
  4014.       ]
  4015.      },
  4016.      "execution_count": 274,
  4017.      "metadata": {},
  4018.      "output_type": "execute_result"
  4019.     }
  4020.    ],
  4021.    "source": [
  4022.     "train_data.groupby('Winner (team 1=1, team 2=0)')['AvgHumidity'].mean()"
  4023.    ]
  4024.   },
  4025.   {
  4026.    "cell_type": "code",
  4027.    "execution_count": 275,
  4028.    "metadata": {},
  4029.    "outputs": [
  4030.     {
  4031.      "data": {
  4032.       "text/plain": [
  4033.        "Winner (team 1=1, team 2=0)\n",
  4034.        "0    185.347486\n",
  4035.        "1    217.026897\n",
  4036.        "Name: Inn 1 Team 1 Max Strike Rate_ALLBatsmen, dtype: float64"
  4037.       ]
  4038.      },
  4039.      "execution_count": 275,
  4040.      "metadata": {},
  4041.      "output_type": "execute_result"
  4042.     }
  4043.    ],
  4044.    "source": [
  4045.     "train_data.groupby('Winner (team 1=1, team 2=0)')['Inn 1 Team 1 Max Strike Rate_ALLBatsmen'].mean()"
  4046.    ]
  4047.   },
  4048.   {
  4049.    "cell_type": "code",
  4050.    "execution_count": 276,
  4051.    "metadata": {},
  4052.    "outputs": [
  4053.     {
  4054.      "data": {
  4055.       "text/plain": [
  4056.        "Winner (team 1=1, team 2=0)\n",
  4057.        "0    191.858907\n",
  4058.        "1    186.096690\n",
  4059.        "Name: Inn 2 Team 2 Max Strike Rate_ALLBatsmen, dtype: float64"
  4060.       ]
  4061.      },
  4062.      "execution_count": 276,
  4063.      "metadata": {},
  4064.      "output_type": "execute_result"
  4065.     }
  4066.    ],
  4067.    "source": [
  4068.     "train_data.groupby('Winner (team 1=1, team 2=0)')['Inn 2 Team 2 Max Strike Rate_ALLBatsmen'].mean()"
  4069.    ]
  4070.   },
  4071.   {
  4072.    "cell_type": "markdown",
  4073.    "metadata": {},
  4074.    "source": [
  4075.     "# Observations:\n",
  4076.     "From last three rows,I can observe that how closely these three continuous independent variables are related with target variable"
  4077.    ]
  4078.   },
  4079.   {
  4080.    "cell_type": "markdown",
  4081.    "metadata": {},
  4082.    "source": [
  4083.     "### 4.3 Categorical-Categorical Variables"
  4084.    ]
  4085.   },
  4086.   {
  4087.    "cell_type": "code",
  4088.    "execution_count": 277,
  4089.    "metadata": {},
  4090.    "outputs": [
  4091.     {
  4092.      "data": {
  4093.       "text/html": [
  4094.        "<div>\n",
  4095.        "<style scoped>\n",
  4096.        "    .dataframe tbody tr th:only-of-type {\n",
  4097.        "        vertical-align: middle;\n",
  4098.        "    }\n",
  4099.        "\n",
  4100.        "    .dataframe tbody tr th {\n",
  4101.        "        vertical-align: top;\n",
  4102.        "    }\n",
  4103.        "\n",
  4104.        "    .dataframe thead th {\n",
  4105.        "        text-align: right;\n",
  4106.        "    }\n",
  4107.        "</style>\n",
  4108.        "<table border=\"1\" class=\"dataframe\">\n",
  4109.        "  <thead>\n",
  4110.        "    <tr style=\"text-align: right;\">\n",
  4111.        "      <th>Team 1</th>\n",
  4112.        "      <th>Airport Flyers</th>\n",
  4113.        "      <th>Bellandur Froth Fighters</th>\n",
  4114.        "      <th>Electronic City Power Savers</th>\n",
  4115.        "      <th>Forum Fans</th>\n",
  4116.        "      <th>HSR High Rent Payers</th>\n",
  4117.        "      <th>Indranagar Pub Watchers</th>\n",
  4118.        "      <th>Koramangala Traffic Jammers</th>\n",
  4119.        "      <th>Marathalli Chokers</th>\n",
  4120.        "      <th>Sarjapur Water Tankers</th>\n",
  4121.        "      <th>Silkboard Slow Movers</th>\n",
  4122.        "      <th>Whitefield Water Loggers</th>\n",
  4123.        "    </tr>\n",
  4124.        "    <tr>\n",
  4125.        "      <th>Winner (team 1=1, team 2=0)</th>\n",
  4126.        "      <th></th>\n",
  4127.        "      <th></th>\n",
  4128.        "      <th></th>\n",
  4129.        "      <th></th>\n",
  4130.        "      <th></th>\n",
  4131.        "      <th></th>\n",
  4132.        "      <th></th>\n",
  4133.        "      <th></th>\n",
  4134.        "      <th></th>\n",
  4135.        "      <th></th>\n",
  4136.        "      <th></th>\n",
  4137.        "    </tr>\n",
  4138.        "  </thead>\n",
  4139.        "  <tbody>\n",
  4140.        "    <tr>\n",
  4141.        "      <th>0</th>\n",
  4142.        "      <td>5</td>\n",
  4143.        "      <td>26</td>\n",
  4144.        "      <td>24</td>\n",
  4145.        "      <td>6</td>\n",
  4146.        "      <td>4</td>\n",
  4147.        "      <td>22</td>\n",
  4148.        "      <td>24</td>\n",
  4149.        "      <td>17</td>\n",
  4150.        "      <td>17</td>\n",
  4151.        "      <td>22</td>\n",
  4152.        "      <td>16</td>\n",
  4153.        "    </tr>\n",
  4154.        "    <tr>\n",
  4155.        "      <th>1</th>\n",
  4156.        "      <td>2</td>\n",
  4157.        "      <td>18</td>\n",
  4158.        "      <td>28</td>\n",
  4159.        "      <td>0</td>\n",
  4160.        "      <td>3</td>\n",
  4161.        "      <td>15</td>\n",
  4162.        "      <td>17</td>\n",
  4163.        "      <td>22</td>\n",
  4164.        "      <td>13</td>\n",
  4165.        "      <td>14</td>\n",
  4166.        "      <td>13</td>\n",
  4167.        "    </tr>\n",
  4168.        "  </tbody>\n",
  4169.        "</table>\n",
  4170.        "</div>"
  4171.       ],
  4172.       "text/plain": [
  4173.        "Team 1                       Airport Flyers  Bellandur Froth Fighters  \\\n",
  4174.        "Winner (team 1=1, team 2=0)                                             \n",
  4175.        "0                                         5                        26   \n",
  4176.        "1                                         2                        18   \n",
  4177.        "\n",
  4178.        "Team 1                       Electronic City Power Savers  Forum Fans  \\\n",
  4179.        "Winner (team 1=1, team 2=0)                                             \n",
  4180.        "0                                                      24           6   \n",
  4181.        "1                                                      28           0   \n",
  4182.        "\n",
  4183.        "Team 1                       HSR High Rent Payers  Indranagar Pub Watchers  \\\n",
  4184.        "Winner (team 1=1, team 2=0)                                                  \n",
  4185.        "0                                               4                       22   \n",
  4186.        "1                                               3                       15   \n",
  4187.        "\n",
  4188.        "Team 1                       Koramangala Traffic Jammers  Marathalli Chokers   \\\n",
  4189.        "Winner (team 1=1, team 2=0)                                                     \n",
  4190.        "0                                                     24                   17   \n",
  4191.        "1                                                     17                   22   \n",
  4192.        "\n",
  4193.        "Team 1                       Sarjapur Water Tankers  Silkboard Slow Movers  \\\n",
  4194.        "Winner (team 1=1, team 2=0)                                                  \n",
  4195.        "0                                                17                     22   \n",
  4196.        "1                                                13                     14   \n",
  4197.        "\n",
  4198.        "Team 1                       Whitefield Water Loggers   \n",
  4199.        "Winner (team 1=1, team 2=0)                             \n",
  4200.        "0                                                   16  \n",
  4201.        "1                                                   13  "
  4202.       ]
  4203.      },
  4204.      "execution_count": 277,
  4205.      "metadata": {},
  4206.      "output_type": "execute_result"
  4207.     }
  4208.    ],
  4209.    "source": [
  4210.     "crosstab = pd.crosstab(index=train_data['Winner (team 1=1, team 2=0)'], columns=train_data['Team 1'])\n",
  4211.     "crosstab"
  4212.    ]
  4213.   },
  4214.   {
  4215.    "cell_type": "code",
  4216.    "execution_count": 278,
  4217.    "metadata": {},
  4218.    "outputs": [
  4219.     {
  4220.      "data": {
  4221.       "text/html": [
  4222.        "<div>\n",
  4223.        "<style scoped>\n",
  4224.        "    .dataframe tbody tr th:only-of-type {\n",
  4225.        "        vertical-align: middle;\n",
  4226.        "    }\n",
  4227.        "\n",
  4228.        "    .dataframe tbody tr th {\n",
  4229.        "        vertical-align: top;\n",
  4230.        "    }\n",
  4231.        "\n",
  4232.        "    .dataframe thead th {\n",
  4233.        "        text-align: right;\n",
  4234.        "    }\n",
  4235.        "</style>\n",
  4236.        "<table border=\"1\" class=\"dataframe\">\n",
  4237.        "  <thead>\n",
  4238.        "    <tr style=\"text-align: right;\">\n",
  4239.        "      <th>Team 2</th>\n",
  4240.        "      <th>Airport Flyers</th>\n",
  4241.        "      <th>Bellandur Froth Fighters</th>\n",
  4242.        "      <th>Electronic City Power Savers</th>\n",
  4243.        "      <th>Forum Fans</th>\n",
  4244.        "      <th>HSR High Rent Payers</th>\n",
  4245.        "      <th>Indranagar Pub Watchers</th>\n",
  4246.        "      <th>Koramangala Traffic Jammers</th>\n",
  4247.        "      <th>Marathalli Chokers</th>\n",
  4248.        "      <th>Sarjapur Water Tankers</th>\n",
  4249.        "      <th>Silkboard Slow Movers</th>\n",
  4250.        "      <th>Whitefield Water Loggers</th>\n",
  4251.        "    </tr>\n",
  4252.        "    <tr>\n",
  4253.        "      <th>Winner (team 1=1, team 2=0)</th>\n",
  4254.        "      <th></th>\n",
  4255.        "      <th></th>\n",
  4256.        "      <th></th>\n",
  4257.        "      <th></th>\n",
  4258.        "      <th></th>\n",
  4259.        "      <th></th>\n",
  4260.        "      <th></th>\n",
  4261.        "      <th></th>\n",
  4262.        "      <th></th>\n",
  4263.        "      <th></th>\n",
  4264.        "      <th></th>\n",
  4265.        "    </tr>\n",
  4266.        "  </thead>\n",
  4267.        "  <tbody>\n",
  4268.        "    <tr>\n",
  4269.        "      <th>0</th>\n",
  4270.        "      <td>4</td>\n",
  4271.        "      <td>11</td>\n",
  4272.        "      <td>21</td>\n",
  4273.        "      <td>5</td>\n",
  4274.        "      <td>1</td>\n",
  4275.        "      <td>22</td>\n",
  4276.        "      <td>21</td>\n",
  4277.        "      <td>22</td>\n",
  4278.        "      <td>27</td>\n",
  4279.        "      <td>21</td>\n",
  4280.        "      <td>28</td>\n",
  4281.        "    </tr>\n",
  4282.        "    <tr>\n",
  4283.        "      <th>1</th>\n",
  4284.        "      <td>3</td>\n",
  4285.        "      <td>21</td>\n",
  4286.        "      <td>9</td>\n",
  4287.        "      <td>3</td>\n",
  4288.        "      <td>8</td>\n",
  4289.        "      <td>15</td>\n",
  4290.        "      <td>13</td>\n",
  4291.        "      <td>16</td>\n",
  4292.        "      <td>19</td>\n",
  4293.        "      <td>16</td>\n",
  4294.        "      <td>22</td>\n",
  4295.        "    </tr>\n",
  4296.        "  </tbody>\n",
  4297.        "</table>\n",
  4298.        "</div>"
  4299.       ],
  4300.       "text/plain": [
  4301.        "Team 2                       Airport Flyers  Bellandur Froth Fighters  \\\n",
  4302.        "Winner (team 1=1, team 2=0)                                             \n",
  4303.        "0                                         4                        11   \n",
  4304.        "1                                         3                        21   \n",
  4305.        "\n",
  4306.        "Team 2                       Electronic City Power Savers  Forum Fans  \\\n",
  4307.        "Winner (team 1=1, team 2=0)                                             \n",
  4308.        "0                                                      21           5   \n",
  4309.        "1                                                       9           3   \n",
  4310.        "\n",
  4311.        "Team 2                       HSR High Rent Payers  Indranagar Pub Watchers  \\\n",
  4312.        "Winner (team 1=1, team 2=0)                                                  \n",
  4313.        "0                                               1                       22   \n",
  4314.        "1                                               8                       15   \n",
  4315.        "\n",
  4316.        "Team 2                       Koramangala Traffic Jammers  Marathalli Chokers   \\\n",
  4317.        "Winner (team 1=1, team 2=0)                                                     \n",
  4318.        "0                                                     21                   22   \n",
  4319.        "1                                                     13                   16   \n",
  4320.        "\n",
  4321.        "Team 2                       Sarjapur Water Tankers  Silkboard Slow Movers  \\\n",
  4322.        "Winner (team 1=1, team 2=0)                                                  \n",
  4323.        "0                                                27                     21   \n",
  4324.        "1                                                19                     16   \n",
  4325.        "\n",
  4326.        "Team 2                       Whitefield Water Loggers   \n",
  4327.        "Winner (team 1=1, team 2=0)                             \n",
  4328.        "0                                                   28  \n",
  4329.        "1                                                   22  "
  4330.       ]
  4331.      },
  4332.      "execution_count": 278,
  4333.      "metadata": {},
  4334.      "output_type": "execute_result"
  4335.     }
  4336.    ],
  4337.    "source": [
  4338.     "crosstab = pd.crosstab(index=train_data['Winner (team 1=1, team 2=0)'], columns=train_data['Team 2'])\n",
  4339.     "crosstab"
  4340.    ]
  4341.   },
  4342.   {
  4343.    "cell_type": "markdown",
  4344.    "metadata": {},
  4345.    "source": [
  4346.     "## 5. Missing Value Treatment :\n",
  4347.     "\n",
  4348.     "There is <b>no missing values</b> in train or test datasets so this step is <b>not required</b>"
  4349.    ]
  4350.   },
  4351.   {
  4352.    "cell_type": "markdown",
  4353.    "metadata": {},
  4354.    "source": [
  4355.     "## 6. Outlier Treatment:\n",
  4356.     "\n",
  4357.     "i am using formula to remove outliers from top and bottom of box plot<br/>\n",
  4358.     "<b>from top : Q3+1.5*(Q3-Q1)</b><br/>\n",
  4359.     "<b>from bottom : Q1-1.5*(Q3-Q1)</b>"
  4360.    ]
  4361.   },
  4362.   {
  4363.    "cell_type": "code",
  4364.    "execution_count": 279,
  4365.    "metadata": {},
  4366.    "outputs": [
  4367.     {
  4368.      "data": {
  4369.       "image/png": "\n",
  4370.       "text/plain": [
  4371.        "<Figure size 936x648 with 2 Axes>"
  4372.       ]
  4373.      },
  4374.      "metadata": {
  4375.       "needs_background": "light"
  4376.      },
  4377.      "output_type": "display_data"
  4378.     }
  4379.    ],
  4380.    "source": [
  4381.     "\n",
  4382.     "plt.figure(figsize=(13,9))\n",
  4383.     "plt.subplot(221)\n",
  4384.     "plt.title('with outliers')\n",
  4385.     "plt.boxplot(train_data['AvgHumidity'])\n",
  4386.     "plt.xlabel('AvgHumidity')\n",
  4387.     "train_data.loc[(train_data['AvgHumidity']<3.0),'AvgHumidity']=train_data['AvgHumidity'].median()\n",
  4388.     "plt.subplot(222)\n",
  4389.     "plt.title('without outliers')\n",
  4390.     "plt.boxplot(train_data['AvgHumidity'])\n",
  4391.     "plt.xlabel('AvgHumidity')\n",
  4392.     "plt.show()"
  4393.    ]
  4394.   },
  4395.   {
  4396.    "cell_type": "code",
  4397.    "execution_count": 280,
  4398.    "metadata": {},
  4399.    "outputs": [
  4400.     {
  4401.      "data": {
  4402.       "image/png": "iVBORw0KGgoAAAANSUhEUgAAAwEAAAEcCAYAAACfyLh5AAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADl0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uIDMuMC4zLCBodHRwOi8vbWF0cGxvdGxpYi5vcmcvnQurowAAIABJREFUeJzt3XuYXmV97//3pwGSCioEwkECxra0jqSKNFWsaSVqW2C3Yru1Eq0gRNi07Pyk2oKatsrvMlZof1jsQTYaKlaMUg8VWyqyNWBnV7ABOYXxkFqQcEw5ibATAb+/P5574EmYSSbJzDwzed6v61rXs9a97rXW95lM1j3fte57rVQVkiRJkvrHT/Q6AEmSJEmTyyRAkiRJ6jMmAZIkSVKfMQmQJEmS+oxJgCRJktRnTAIkSZKkPmMSoGklyQ+T/NQW1t+a5NWTGVPXsa9M8tY2/6YkX+5FHJK0s5rKbcB4SjIvSSXZpS3/S5ITeh2Xdi4mAZpWqmqPqvoeQJKPJXlfL+JI8t4knxhtfVVdXFW/NpkxSdLOrldtQJK3JBmcwP1vMXmpqqOr6qKJOr76k0mANMUkmdHrGCRJ09/wnQRpJCYB6rkkJyb5Ytfy2iSXdC3fnuSwNl9JfibJKcCbgDPa7eEvdu3ysCQ3JnkoyaeTzBrluD+R5I+T3Jbk3iQfT/Lstu7IJOs2q39rklcnOQp4N/CGduwbRtj3JleNkjw/yRVJ7k/y7SS/07XuY0k+nOSyJI8Ai5Ick+SWJA8nuSPJH27bT1WSpofJbAOSnNz2f3+SS5M8p5Vv0v2mlV2Z5K1JBoDzgZe1Yz04yvd4Ttvn/e0YJ3et2+SuRXcbk+TvgYOBL7b9nzHCvp/sbtqWT0oylOSBJJcneW7XukpyWpLvAt9NxwdbO/dQ+9nM39K/ifqDSYCmgquAX25/lB8A7Aq8HCCdvp97ADd2b1BVFwAXA+e028O/2bX6d4CjgOcBLwTeMspx39KmRcDwcf56a8FW1ZeA9wOfbsd+0ZbqJ9kduAL4JLAvsBj42ySHdlV7I7AceCYwCKwA/kdVPROYD3x1a3FJ0jQ1KW1AklcCf9bWHwDcBnxqa8FV1RBwKvD1dqw9R6m6ElgHPAd4HfD+JK8aw/7fDHwf+M22/3O2VD/Ja+lciPptYA7wr+3Y3V4LvBR4AfBrwK8APwvsCbwBuG9rcWnnZxKgnmv9Ox8GDgNeAVwO3JHk+W35X6vqx9uwyw9V1Z1VdT/wxbbfkbwJOLeqvldVPwTeBRw3AbdPfwO4tar+rqoer6rrgM/SaSSGfaGq/k9V/biqNgCPAS9I8qyqeqBtI0k7nUlsA94EXFhV11XVRjrn/Jclmbej3yHJQcBC4Myq2lBV1wMfBd68o/sewf8A/qyqhqrqcToXpQ7rvhvQ1t9fVf+XTnvyTOD5QNp2d01AXJpmTAI0VVwFHEnnasVVwJV0Tv6vaMvb4u6u+UfpXEUayXPoXAkadhuwC7DfNh5va54LvDTJg8MTncZo/646t2+2zX8HjgFuS3JVkpeNc0ySNJVMRhuwyTm/Xfy5DzhwewLezHOA+6vq4a6y28Zp35t7LnBeV3tyP5DNjvVkm1JVX6Vzl/tvgHuSXJDkWRMQl6YZkwBNFcMNwC+3+avYegNQO3jMO+mcTIcdDDwO3AM8AjxjeEU6g3XnbOexbweuqqo9u6Y9qur3RttfVf17VR1Lp/vQPwKXIEk7r8loAzY557eumnsDd9A550PXeZ9NL9Rs7Vh3ArOTPLOr7OC2b9isTdls32PZf7fb6XQX7W5TfrKq/m20/VXVh6rqF4BD6XQL+qNtOJ52UiYBmiquotM3/yerah2dPo5H0TlBf3OUbe6h05d/e60E/iDJ85LswVP9/B8HvgPMSvLfkuwK/DEwc7Njz0sylv9D/wT8bJI3J9m1Tb/YBps9TZLd0nnPwLOr6jHgB8ATO/A9JWmqm4w24JPAiUkOSzKTzjn/mqq6tarW0/mD/XeTzEhyEvDTmx1rbpLdRtpxVd0O/BvwZ0lmJXkhsITOuAWA64FjksxOsj9w+g58l/OBdw2PK0vy7CSvH61ya29e2tqyR4AN2KYIkwBNEVX1HeCHdE78VNUPgO8B/6eqRjtZraDTb/7BJP+4HYe9EPh74GvAf9I5MS5tx38I+H06fTqHrxJ1Py3oH9rnfUm22F+/3R7+NeA4OleL7gbOZtOkYnNvBm5N8gM6A9J+d1u+mCRNJ5PRBlTVV4A/oTMm6y46f+Qf11XlZDpXyO+jc8W8+8r6V4E1wN1J/muUQywG5tE5z38eeE9VXdHW/T1wA3Ar8GXg05tt+2fAH7fvssWnwVXV5+m0IZ9qbcTNwNFb2ORZwEeAB+h0UboP+IstHUP9IVU72qNCkiRJ0nTinQBJkiSpz5gESJIkSX3GJECSJEnqMyYBkiRJUp8xCZAkSZL6zC69DgBgn332qXnz5vU6DEmasq699tr/qqo5W6+5c7O9kKTRbUtbMSWSgHnz5rF69epehyFJU1aS23odw1RgeyFJo9uWtsLuQJIkSVKfMQmQJEmS+oxJgCRJktRnTAIkSZKkPjOmJCDJnkk+k+RbSYaSvCzJ7CRXJPlu+9yr1U2SDyVZm+TGJIdP7FeQJEmStC3GeifgPOBLVfV84EXAEPBO4CtVdQjwlbYMcDRwSJtOAT48rhFLE2jp0qXMmjWLJMyaNYulS5f2OiRJkqRxt9UkIMmzgF8BVgBU1Y+q6kHgWOCiVu0i4LVt/ljg49VxNbBnkgPGPXJpnC1dupTzzz+f97///TzyyCO8//3v5/zzzzcRkCRJO52x3An4KWA98HdJvpnko0l2B/arqrsA2ue+rf6BwO1d269rZdKU9pGPfISzzz6bt7/97TzjGc/g7W9/O2effTYf+chHeh2aJEnSuBpLErALcDjw4ap6MfAIT3X9GUlGKKunVUpOSbI6yer169ePKVhpIm3cuJFTTz11k7JTTz2VjRs39igiSdJkSjIpkzQVjCUJWAesq6pr2vJn6CQF9wx382mf93bVP6hr+7nAnZvvtKouqKoFVbVgzpwxvd1YmlAzZ87k/PPP36Ts/PPPZ+bMmT2KSJI0mapqm6ft2U6aCraaBFTV3cDtSX6uFb0KuAW4FDihlZ0AfKHNXwoc354SdATw0HC3IWkqO/nkkznzzDM599xzefTRRzn33HM588wzOfnkk3sdmiRJ0rjaZYz1lgIXJ9kN+B5wIp0E4pIkS4DvA69vdS8DjgHWAo+2utKU91d/9VcAvPvd7+Yd73gHM2fO5NRTT32yXJIkaWeRqXBbasGCBbV69epehyFJU1aSa6tqQa/j6DXbC001SezioyljW9oK3xgsSZIk9RmTAEmSJKnPmARIkiRJfcYkQJIkSeozJgGSJElSnzEJkCRJkvqMSYAkaVwkOSjJqiRDSdYkedtm6/8wSSXZpy0nyYeSrE1yY5LDexO5JPWfsb4sTJKkrXkceEdVXZfkmcC1Sa6oqluSHAT8Kp2XSw47GjikTS8FPtw+JUkTzDsBkqRxUVV3VdV1bf5hYAg4sK3+IHAG0P1WpWOBj1fH1cCeSQ6YzJglqV+ZBEiSxl2SecCLgWuSvAa4o6pu2KzagcDtXcvreCppkCRNILsDSZLGVZI9gM8Cp9PpIrQM+LWRqo5QVk+rlJwCnAJw8MEHj1+gktTHvBMgSRo3SXalkwBcXFWfA34aeB5wQ5JbgbnAdUn2p3Pl/6CuzecCd26+z6q6oKoWVNWCOXPmTPRXkKS+YBIgSRoXSQKsAIaq6lyAqrqpqvatqnlVNY/OH/6HV9XdwKXA8e0pQUcAD1XVXb2KX5L6id2BJEnj5eXAm4Gbklzfyt5dVZeNUv8y4BhgLfAocOLEhyhJApMASdI4qapBRu7n311nXtd8AadNcFiSpBHYHUiSJEnqMyYBkiRJUp8xCZAkSZL6jEmAJEmS1GdMAiRJkqQ+YxIgSZIk9RmTAEmSJKnPmARIkiRJfcYkQJIkSeozJgGSJElSnxlTEpDk1iQ3Jbk+yepWNjvJFUm+2z73auVJ8qEka5PcmOTwifwCkiRJkrbNttwJWFRVh1XVgrb8TuArVXUI8JW2DHA0cEibTgE+PF7BSpIkSdpxO9Id6FjgojZ/EfDarvKPV8fVwJ5JDtiB40iSJEkaR2NNAgr4cpJrk5zSyvarqrsA2ue+rfxA4Paubde1sk0kOSXJ6iSr169fv33RS5IkSdpmu4yx3sur6s4k+wJXJPnWFupmhLJ6WkHVBcAFAAsWLHjaekmSJEkTY0x3AqrqzvZ5L/B54CXAPcPdfNrnva36OuCgrs3nAneOV8CSJEmSdsxWk4Akuyd55vA88GvAzcClwAmt2gnAF9r8pcDx7SlBRwAPDXcbkiRJktR7Y+kOtB/w+STD9T9ZVV9K8u/AJUmWAN8HXt/qXwYcA6wFHgVOHPeoJUmSJG23rSYBVfU94EUjlN8HvGqE8gJOG5foJEmSJI073xgsSZIk9RmTAEmSJKnPmARIknZYkoOSrEoylGRNkre18j9P8q0kNyb5fJI9u7Z5V5K1Sb6d5Nd7F70k9R+TAKnLypUrmT9/PjNmzGD+/PmsXLmy1yFJ08XjwDuqagA4AjgtyQuAK4D5VfVC4DvAuwDauuOAQ4GjgL9NMqMnkUtSHxrry8Kknd7KlStZtmwZK1asYOHChQwODrJkyRIAFi9e3OPopKmtPQp6+C3yDycZAg6sqi93VbsaeF2bPxb4VFVtBP4zyVo676D5+iSGLUl9yzsBUrN8+XJWrFjBokWL2HXXXVm0aBErVqxg+fLlvQ5NmlaSzANeDFyz2aqTgH9p8wcCt3etW9fKRtrfKUlWJ1m9fv368Q1WkvqUSYDUDA0NsXDhwk3KFi5cyNDQUI8ikqafJHsAnwVOr6ofdJUvo9Nl6OLhohE2r5H2WVUXVNWCqlowZ86c8Q5ZkvqSSYDUDAwMMDg4uEnZ4OAgAwMDPYpIml6S7EonAbi4qj7XVX4C8BvAm9q7ZKBz5f+grs3nAndOVqyS1O9MAqRm2bJlLFmyhFWrVvHYY4+xatUqlixZwrJly3odmjTlpfNa+RXAUFWd21V+FHAm8JqqerRrk0uB45LMTPI84BDgG5MZsyT1MwcGS83w4N+lS5cyNDTEwMAAy5cvd1CwNDYvB94M3JTk+lb2buBDwEzgik6ewNVVdWpVrUlyCXALnW5Cp1XVEz2IW5L6Up66M9s7CxYsqNWrV/c6DEmaspJcW1ULeh1Hr9leaKpJwlT4W0qCbWsr7A4kSZIk9RmTAEmSJKnPmARIkiRJfcYkQOqycuVK5s+fz4wZM5g/fz4rV67sdUiSJEnjzqcDSc3KlStZtmwZK1asYOHChQwODrJkyRIAnxAkSZJ2Kt4JkJrly5ezYsUKFi1axK677sqiRYtYsWIFy5cv73VokiRJ48okQGqGhoZYuHDhJmULFy5kaGioRxFJkiRNDJMAqRkYGGBwcHCTssHBQQYGBnoUkSRJ0sQwCZCaZcuWsWTJElatWsVjjz3GqlWrWLJkCcuWLet1aJIkSePKgcFSMzz4d+nSpQwNDTEwMMDy5csdFCxJknY6JgFSl8WLF/tHvyRJ2unZHUiSJEnqMyYBkiRJUp8xCZAkSZL6zJiTgCQzknwzyT+15ecluSbJd5N8OslurXxmW17b1s+bmNCl8Tdr1iySPDnNmjWr1yFJkiSNu225E/A2oPutSWcDH6yqQ4AHgCWtfAnwQFX9DPDBVk+a8mbNmsXGjRvZb7/9GBoaYr/99mPjxo0mApIkaaczpiQgyVzgvwEfbcsBXgl8plW5CHhtmz+2LdPWv6rVl6a04QTg7rvv5vnPfz533333k4mAJEnSzmSsdwL+EjgD+HFb3ht4sKoeb8vrgAPb/IHA7QBt/UOt/iaSnJJkdZLV69ev387wpfF15ZVXbnFZkiRpZ7DVJCDJbwD3VtW13cUjVK0xrHuqoOqCqlpQVQvmzJkzpmCliXbkkUducVmSJGlnMJY7AS8HXpPkVuBTdLoB/SWwZ5Lhl43NBe5s8+uAgwDa+mcD949jzNKEmDlzJvfccw/7778/3/rWt9h///255557mDlzZq9DkyRJGldbTQKq6l1VNbeq5gHHAV+tqjcBq4DXtWonAF9o85e2Zdr6r1bV0+4ESFPNhg0bnkwEBgYGnkwANmzY0OvQJEmSxtWOvCfgTODtSdbS6fO/opWvAPZu5W8H3rljIUqTZ8OGDVTVk5MJgDR2SQ5KsirJUJI1Sd7WymcnuaI9UvqKJHu18iT5UHuk9I1JDu/tN5Ck/rHL1qs8paquBK5s898DXjJCnQ3A68chNknS9PI48I6qui7JM4Frk1wBvAX4SlV9IMk76VwcOhM4GjikTS8FPtw+JUkTzDcGS5LGRVXdVVXXtfmH6bxb5kA2fXT05o+U/nh1XE1nrNkBkxy2JPUlkwBJ0rhrb4t/MXANsF9V3QWdRAHYt1V78pHSTffjprv35SOltV1mz569yVvgJ2ICJnT/s2fP7vFPUTsrkwCpy8qVK5k/fz4zZsxg/vz5rFy5stchSdNOkj2AzwKnV9UPtlR1hDIfKa1x88ADD2wyzms6Tg888ECvf4zaSW3TmABpZ7Zy5UqWLVvGihUrWLhwIYODgyxZsgSAxYsX9zg6aXpIsiudBODiqvpcK74nyQFVdVfr7nNvK3/ykdJN9+OmJUkTyDsBUrN8+XJWrFjBokWL2HXXXVm0aBErVqxg+fLlvQ5NmhbS6RuxAhiqqnO7VnU/OnrzR0of354SdATw0HC3IUnSxPJOgNQMDQ2xcOHCTcoWLlzI0NBQjyKSpp2XA28GbkpyfSt7N/AB4JIkS4Dv89QT5C4DjgHWAo8CJ05uuJLUv0wCpGZgYIDBwUEWLVr0ZNng4CADAwM9jEqaPqpqkJH7+QO8aoT6BZw2oUFJkkZkdyCpWbZsGUuWLGHVqlU89thjrFq1iiVLlrBs2bJehyZJkjSuvBMgNcODf5cuXcrQ0BADAwMsX77cQcGSJGmn450ASZIkqc94J0BqfESoJEnqF94JkBofESpJkvqFSYDU+IhQSZLUL0wCpGZgYICzzjqL+fPnM2PGDObPn89ZZ53lI0IlSdJOxyRAahYtWsTZZ5/NSSedxMMPP8xJJ53E2Wefvcl7AyRJknYGJgFSs2rVKs4880wuvPBCnvnMZ3LhhRdy5plnsmrVql6HJkmSNK7SeWFjby1YsKBWr17d6zDU52bMmMGGDRvYddddnyx77LHHmDVrFk888UQPI5MgybVVtaDXcfSa7YW2RRKmwt85O2Jn+A6aPNvSVngnQGoGBgYYHBzcpGxwcNAxAZIkaafjewKkZtmyZbzhDW9g991357bbbuO5z30ujzzyCOedd16vQ5MkSRpXJgFSlw0bNvDggw9SVdxxxx3MmjWr1yFJkiSNO7sDSc0ZZ5zBHnvsweWXX86PfvQjLr/8cvbYYw/OOOOMXocmSZI0rkwCpGbdunVcdNFFm7wx+KKLLmLdunW9Dk2SJGlc2R1IkiTtlOo9z4L3PrvXYeyQes+zeh2CdlImAVIzd+5cjj/+eD75yU+ycOFCBgcHOf7445k7d26vQ5MkbYec9YNp/3jNJNR7ex2FdkZb7Q6UZFaSbyS5IcmaJGe18ucluSbJd5N8OslurXxmW17b1s+b2K8gjY9zzjmHJ554gpNOOomZM2dy0kkn8cQTT3DOOef0OjRJkqRxNZYxARuBV1bVi4DDgKOSHAGcDXywqg4BHgCWtPpLgAeq6meAD7Z60pS3ePFizjvvPHbffXeSsPvuu3PeeeexePHiXocmSZI0rraaBFTHD9virm0q4JXAZ1r5RcBr2/yxbZm2/lVJMm4RS9shyZimN77xjaxZs4Yf//jHrFmzhje+8Y1j3laSJGm6GNPTgZLMSHI9cC9wBfAfwINV9Xirsg44sM0fCNwO0NY/BOw9nkFL26qqtmna3m0kSZKmgzElAVX1RFUdBswFXgIMjFStfY50SfRpfyElOSXJ6iSr169fP9Z4JUlTVJILk9yb5OaussOSXJ3k+nbOf0krT5IPtfFjNyY5vHeRS1L/2ab3BFTVg8CVwBHAnkmGny40F7izza8DDgJo658N3D/Cvi6oqgVVtWDOnDnbF70kaSr5GHDUZmXnAGe1C0l/2pYBjgYOadMpwIcnKUZJEmN7OtCcJHu2+Z8EXg0MAauA17VqJwBfaPOXtmXa+q+WfSUkaadXVV/j6Rd9Chh+0PmzeeqC0bHAx9u4s6vpXFg6YHIilSSN5T0BBwAXJZlBJ2m4pKr+KcktwKeSvA/4JrCi1V8B/H2StXQag+MmIG5J0vRwOnB5kr+g04b8Uit/cvxYMzy27K7Nd5DkFDp3Czj44IMnNFhJ6hdbTQKq6kbgxSOUf4/O+IDNyzcArx+X6CRJ093vAX9QVZ9N8jt0LhS9mjGOH4NO91HgAoAFCxZ4Z1mSxsE2jQmQJGkbnQB8rs3/A09dPHpy/FjTPbZMkjTBTAIkSRPpTuAVbf6VwHfb/KXA8e0pQUcAD1XV07oCSZImxljGBEiStFVJVgJHAvskWQe8BzgZOK89LW4DrW8/cBlwDLAWeBQ4cdIDlqQ+ZhIgSRoXVbV4lFW/MELdAk6b2IgkSaOxO5AkSZLUZ0wCJEmSpD5jEiBJkiT1GZMASZIkqc+YBEiSJEl9xiRAkiRJ6jMmAZIkSVKfMQmQJEmS+oxJgCRJktRnTAIkSZKkPmMSIEmSJPUZkwBJkiSpz5gESJIkSX3GJECSJEnqMyYBkiRJUp8xCZAkSZL6jEmAJEmS1Gd26XUA0raaPXs2DzzwwIQfJ8mE7n+vvfbi/vvvn9BjSFK/m+hz+UTba6+9eh2CdlImAZp2HnjgAaqq12HssOneMEnSVDcZbUWSnaJNUv+xO5AkSZLUZ0wCJEnjIsmFSe5NcvNm5UuTfDvJmiTndJW/K8natu7XJz9iSepfW00CkhyUZFWSoXYCf1srn53kiiTfbZ97tfIk+VA7sd+Y5PCJ/hKSpCnhY8BR3QVJFgHHAi+sqkOBv2jlLwCOAw5t2/xtkhmTGq0k9bGx3Al4HHhHVQ0ARwCntZP3O4GvVNUhwFfaMsDRwCFtOgX48LhHLUmacqrqa8Dmo91/D/hAVW1sde5t5ccCn6qqjVX1n8Ba4CWTFqwk9bmtJgFVdVdVXdfmHwaGgAPpnMAvatUuAl7b5o8FPl4dVwN7Jjlg3COXJE0HPwv8cpJrklyV5Bdb+YHA7V311rUySdIk2KYxAUnmAS8GrgH2q6q7oJMoAPu2amM6sSc5JcnqJKvXr1+/7ZFLkqaDXYC96NxJ/iPgknQejTXS47FGfMSK7YUkjb8xJwFJ9gA+C5xeVT/YUtURyp52Yq+qC6pqQVUtmDNnzljDkCRNL+uAz7W7w98Afgzs08oP6qo3F7hzpB3YXkjS+BtTEpBkVzoJwMVV9blWfM9wN5/2OdzPc8wndknSTu8fgVcCJPlZYDfgv4BLgeOSzEzyPDrjyL7Rsyglqc+M5elAAVYAQ1V1bteqS4ET2vwJwBe6yo9vTwk6AnhouNuQJGnnlWQl8HXg55KsS7IEuBD4qfbY0E8BJ7S7AmuAS4BbgC8Bp1XVE72KXZL6zVjeGPxy4M3ATUmub2XvBj5Ap2/nEuD7wOvbusuAY+g86eFR4MRxjViSNCVV1eJRVv3uKPWXA8snLiJJ0mi2mgRU1SAj9/MHeNUI9Qs4bQfjkkZV73kWvPfZvQ5jh9V7ntXrECRJUp8ay50AaUrJWT+gk2tOb0mo9/Y6CkmS1I+26RGhkiRJkqY/kwBJkiSpz5gESJIkSX3GJECSJEnqMyYBkiRJUp8xCZAkSZL6jEmAJEmS1Gd8T4CmpWS099dNH3vttVevQ5AkSX3KJEDTzmS8KCzJTvFCMkmSpJHYHUiSJEnqMyYBkiRJUp8xCZAkSZL6jEmAJEmS1GdMAiRJkqQ+YxIgSZIk9RmTAEmSJKnPmARIkiRJfcYkQJIkSeozJgGSJElSnzEJkCSNiyQXJrk3yc0jrPvDJJVkn7acJB9KsjbJjUkOn/yIJal/mQRIksbLx4CjNi9MchDwq8D3u4qPBg5p0ynAhychPklSYxIgSRoXVfU14P4RVn0QOAOorrJjgY9Xx9XAnkkOmIQwJUmYBEiSJlCS1wB3VNUNm606ELi9a3ldKxtpH6ckWZ1k9fr16ycoUknqLyYBkqQJkeQZwDLgT0daPUJZjVBGVV1QVQuqasGcOXPGM0RJ6ltbTQJGGuiVZHaSK5J8t33u1cod6CVJGvbTwPOAG5LcCswFrkuyP50r/wd11Z0L3DnpEUpSnxrLnYCP8fSBXu8EvlJVhwBfacvgQC9JUlNVN1XVvlU1r6rm0fnD//Cquhu4FDi+XTw6Anioqu7qZbyS1E+2mgSMMtDrWOCiNn8R8Nqucgd6acpJsk3T9m4j9bMkK4GvAz+XZF2SJVuofhnwPWAt8BHg9ychRElSs8t2brff8BWbqroryb6tfLSBXk+7upPkFDp3Czj44IO3MwxpbKpG7GosaRxV1eKtrJ/XNV/AaRMdkyRpZOM9MNiBXpIkSdIUt71JwD3D3Xza572t3IFekiRJ0hS3vUnApcAJbf4E4Atd5Q70kiRJkqawrY4JaAO9jgT2SbIOeA/wAeCSNujr+8DrW/XLgGPoDPR6FDhxAmKWJEmStAO2mgRsYaDXq0ao60AvSZIkaYrzjcGSJElSnzEJkCRJkvqMSYAkSZLUZ0wCJEmSpD5jEiBJkiT1GZMASZIkqc+YBEiSJEl9xiRAkiRJ6jMmAZIkSVKfMQmQJEmS+oxJgCRJktRnTAIkSZKkPmMSIEmSJPUZkwBJkiSpz5gESJIkSX3GJECSJEnqMyYBkqRxkeTCJPcmubmr7M+TfCvJjUk+n2TPrnXvSrI2ybeT/Hpvopak/mQSIEkaLx8Djtqs7ApgflW9EPgO8C6AJC8AjgMObdv8bZIZkxeqJPU3kwBJ0rioqq8B929W9uWqerwtXg3MbfPHAp+qqo1QOce/AAAK0UlEQVRV9Z/AWuAlkxasJPU5kwBJ0mQ5CfiXNn8gcHvXunWt7GmSnJJkdZLV69evn+AQJak/mARIkiZckmXA48DFw0UjVKuRtq2qC6pqQVUtmDNnzkSFKEl9ZZdeByBJ2rklOQH4DeBVVTX8h/464KCuanOBOyc7NknqV94JkCRNmCRHAWcCr6mqR7tWXQocl2RmkucBhwDf6EWMktSPvBMgSRoXSVYCRwL7JFkHvIfO04BmAlckAbi6qk6tqjVJLgFuodNN6LSqeqI3kUtS/5mQJKBd+TkPmAF8tKo+MBHHkSRNHVW1eITiFVuovxxYPnERSZJGM+7dgdpznv8GOBp4AbC4PQ9amvL23ntvkjw57b333r0OSZIkadxNxJiAlwBrq+p7VfUj4FN0ngctTWl77703999/P4ceeii33XYbhx56KPfff7+JgCRJ2ulMRBIw5mc/S1PJcAJw8803c/DBB3PzzTc/mQhIkiTtTCYiCRjTs599+Yumossuu2yLy5KknVd3d9CxTtuznTQVTEQSMKZnP/vyF01FxxxzzBaXJUk7r6qalEmaCiYiCfh34JAkz0uyG3AcnedBS1Pa7NmzWbNmDfPnz+f73/8+8+fPZ82aNcyePbvXoUmSJI2rcX9EaFU9nuR/ApfTeUTohVW1ZryPI423++67j7333ps1a9bw3Oc+F+gkBvfdd1+PI5MkSRpfE/KegKq6DLAztaYd/+CXJEn9YCK6A0mSJEmawkwCJEmSpD5jEiBJkiT1GZMASZIkqc+YBEiSJEl9JlPhpRVJ1gO39ToOqcs+wH/1Ogipy3Orqu/frGh7oSnI9kJTyZjbiimRBEhTTZLVVbWg13FIkqY22wtNV3YHkiRJkvqMSYAkSZLUZ0wCpJFd0OsAJEnTgu2FpiXHBEiSJEl9xjsBkiRJUp8xCZAkSZL6jEmA1CXJhUnuTXJzr2ORJE1dthea7kwCpE19DDiq10FIkqa8j2F7oWnMJEDqUlVfA+7vdRySpKnN9kLTnUmAJEmS1GdMAiRJkqQ+YxIgSZIk9RmTAEmSJKnPmARIXZKsBL4O/FySdUmW9DomSdLUY3uh6S5V1esYJEmSJE0i7wRIkiRJfcYkQJIkSeozJgGSJElSnzEJkCRJkvqMSYAkSZLUZ0wCJlmSH47TfvZOsirJD5P89Sh1Pp/k+iRrkzzU5q9P8kvjEcMYYnxbkv9IUkn2HKXOq9v6E7rKfrGVnT4OMQwkuap976EkH27lhyc5agvbvTTJB9v8+7Y3liRvTbK+Hf9bSf6fMWzzyiRHbM/xuvbxz0n+dbOyp32PJLskeXCE7d+X5I6un9vfJNni+SLJbyd5/o7ELanDtuJpdWwrnr6NbYV2iEnA9LUB+BPgD0erUFW/VVWHAW8F/rWqDmvTv01SjF8DXgncsZV6NwHHdS0fB9wwTjH8NXBO+zm8APjbVn44MOKJPckuVXVNVf3BOMVwcTv+LwPvTXLAVuq/EtjuE3uSvYGfB/ZLcvD27gf48xb3fOAXgJdvpf5vA57YpanFtmJsbCu2n23FNGUS0CNJjkxyZZLPtKz/4iRp625NclaS65LcNFLGXFWPVNUgnRP89hz/F9tVj2uT/EuS/Vr5qUn+PckNSf4hyU+28k+0DH9Vu2LzK0kuarGvGOkYVfXNqrptDOF8D3hWkn3az+BXgcu7Yh0tpn9O8sY2f1qSi0bY9wHAuhZPVdVNbfs/Bd7Url68rl3N+F9JrgD+rl11+scRfm6/1447K8khSS5vP8OvJfnZLX3JqlrfvusBbV/HJrkmyTeTfDnJvkl+mk5D/EfDV+KS7Jfkc0lWJ/nGGK78vA74R+DTwBu2UncsdgNmAg+2uJ/275Hkl4FjgA+2uOcl+YMkt7R6n2jbvi/Jx9r3vTXJa5P8f0lubj/XXVq90X4/B5N8oP0cvp1JulIp9YptxSZsK2wrbCvGU1U5TeIE/LB9Hgk8BMylk4x9HVjY1t0KLG3zvw98dAv7ewvw11s55pHAP3UtzwT+DdinLb8JuKDN791V7wPA77X5TwCfaPP/vcX+ghb79cD8LRx/HbDnKOteTeck9HbgVOAVwEeA9wGnbyWmA4C1dK6afHukY9A5ST4EXAacDjy7q/wvu+q9D/gGMKs7rq51p7fp88BurXwV8NNt/uXAl0c5/l+2+XnAN7u234unXth3KnB29/G69vFp4Iiufdy8lX/vK4GXtX+f6zb7jqdvVncX4MER9vE+OlflrgceAD7etW5LvyOv7Vp3V9d33bNrv1e14/4C8Cjwq23dF4HfYMu/n4NdP6fXAF/q9f9pJ6eJmLCt2HydbUXZVrR1thXjNO2CeukbVbUOIMn1dP7TDrZ1n2uf19K5dTaeBoBDgf/dLijNoF0BAV6Y5P8F9gSeCfxT13ZfbJ83AXdW1S0t9lta7DfvQEyfBv4e+A6wks5tzmEjxlRVd7XyVcBvVtXT+itW1UeT/Avw68BvAackOWyUGL5QVaNdLTsRuA347ap6PJ1+q0cAn20/Q2DU/09vSvKrwM8BJ1bVj1r5wcAlSfanczL7zijbv5rOa+mHl/dK8pNV9X83r5jkwLbfq6uqksxI8vyq+tYo+96SP6+qv0yyG/D5JK+rqs+w5d+RbmuATyT5Ap3Ge9hl7Wd4E0BVXdHKb6Lze7Sl30/Y9P/GvO34XtJ0Y1vxFNsK2wrbinFid6De2tg1/wSbnhg2jlI+HgLcWE/1+/z5qjq6rfs4nWz95+lk4rNGiOnHm8X+4x2NsaruaHG9gs7ViW5biunngfuA52xp31V1YVX9Jp3f+YFRqj6yhRBvAn4KOLAtB/ivrp/hYVU1f5RtL66qQ+lcZTsvyb6t/G+AD7bv9fubfa9uAV7SdZwDRzqpN28A9gb+M8mtdE7yx41Sd0xaQ/Ql4Fda0Zb+Pbr9OnA+8BJgdZIZrbz79+hHXfWHf4+29PvZvf1E/N+QpiLbisa2wrYC24pxYxLQn24BDkzyEoAkuyU5tK3bHbg7ya7AGyc5rj8BzqyqH29WPmJMSV4GvIrOwK13ZYSBTUmO6uo7+Bw6t1XvBB6mc2VirFYDpwFfTLJ/VT0A3JXkt9q+fyLJi7a0g+r0y10JLG1FzwbuSOcSxgldVTeP7X+3Yw9/p9GuTgEsBl5dVfOqah6dk+riMXy/UbX4fgn4j1Y02u/Ik3G3k/jcqvoq8EfAHOAZYzzkln4/JU0e2wrbijGzrZh+TAKmsZa9nwu8Jcm6JC8Yy3ZVtZHOgKBzk9xAp+/hS9vqP6XT3/EKOv/BdiS+tydZB+wPrEnyv7YS12BVXTrCqqfFlM6ArQvo3DK9AzgDuDBd90Gbo9uxb6D19azOoKuvAi9KZ6DV68byfarqKuCdwD8nmU3nqsmpbd9r6PRR3JoPAG9NsjvwXjr9Rq8C7umq8wXgd1psv0TnpP7yJDe22+knj7TjdAaK7U+nERqO+bvAxiS/0Ire235X1rXfH+gMtFvXNQ0/mu6PWteDm+lcSRn+9xvtd2Ql8O62zc8An0xyI3Adnb6ZD4/h57O1309J28i2wraim22Fhg0PNJEkSZLUJ7wTIEmSJPUZB0pI01CStwL/c7Pir1XVVt8yKUnqD7YV2hK7A0mSJEl9xu5AkiRJUp8xCZAkSZL6jEmAJEmS1GdMAiRJkqQ+YxIgSZIk9Zn/Hwfqz//i19OJAAAAAElFTkSuQmCC\n",
  4403.       "text/plain": [
  4404.        "<Figure size 936x648 with 2 Axes>"
  4405.       ]
  4406.      },
  4407.      "metadata": {
  4408.       "needs_background": "light"
  4409.      },
  4410.      "output_type": "display_data"
  4411.     }
  4412.    ],
  4413.    "source": [
  4414.     "plt.figure(figsize=(13,9))\n",
  4415.     "plt.subplot(221)\n",
  4416.     "plt.title('with outliers')\n",
  4417.     "plt.boxplot(train_data['Inn 1 Team 1 Max Strike Rate_ALLBatsmen'])\n",
  4418.     "plt.xlabel('Inn 1 Team 1 Max Strike Rate_ALLBatsmen')\n",
  4419.     "train_data.loc[(train_data['Inn 1 Team 1 Max Strike Rate_ALLBatsmen']>250.0) | (train_data['Inn 1 Team 1 Max Strike Rate_ALLBatsmen']<112.775) ,'Inn 1 Team 1 Max Strike Rate_ALLBatsmen']=train_data['Inn 1 Team 1 Max Strike Rate_ALLBatsmen'].median()\n",
  4420.     "plt.subplot(222)\n",
  4421.     "plt.title('without outliers')\n",
  4422.     "plt.boxplot(train_data['Inn 1 Team 1 Max Strike Rate_ALLBatsmen'])\n",
  4423.     "plt.xlabel('Inn 1 Team 1 Max Strike Rate_ALLBatsmen')\n",
  4424.     "plt.show()"
  4425.    ]
  4426.   },
  4427.   {
  4428.    "cell_type": "code",
  4429.    "execution_count": 281,
  4430.    "metadata": {},
  4431.    "outputs": [
  4432.     {
  4433.      "data": {
  4434.       "image/png": "\n",
  4435.       "text/plain": [
  4436.        "<Figure size 936x648 with 2 Axes>"
  4437.       ]
  4438.      },
  4439.      "metadata": {
  4440.       "needs_background": "light"
  4441.      },
  4442.      "output_type": "display_data"
  4443.     }
  4444.    ],
  4445.    "source": [
  4446.     "plt.figure(figsize=(13,9))\n",
  4447.     "plt.subplot(221)\n",
  4448.     "plt.title('with outliers')\n",
  4449.     "plt.boxplot(train_data['Inn 2 Team 2 Max Strike Rate_ALLBatsmen'])\n",
  4450.     "plt.xlabel('Inn 2 Team 2 Max Strike Rate_ALLBatsmen')\n",
  4451.     "train_data.loc[(train_data['Inn 2 Team 2 Max Strike Rate_ALLBatsmen']>315.0) | (train_data['Inn 2 Team 2 Max Strike Rate_ALLBatsmen']<10.0) ,'Inn 2 Team 2 Max Strike Rate_ALLBatsmen']=train_data['Inn 2 Team 2 Max Strike Rate_ALLBatsmen'].median()\n",
  4452.     "plt.subplot(222)\n",
  4453.     "plt.title('without outliers')\n",
  4454.     "plt.boxplot(train_data['Inn 2 Team 2 Max Strike Rate_ALLBatsmen'])\n",
  4455.     "plt.xlabel('Inn 2 Team 2 Max Strike Rate_ALLBatsmen')\n",
  4456.     "plt.show()"
  4457.    ]
  4458.   },
  4459.   {
  4460.    "cell_type": "markdown",
  4461.    "metadata": {},
  4462.    "source": [
  4463.     "## 7. Transformation:"
  4464.    ]
  4465.   },
  4466.   {
  4467.    "cell_type": "code",
  4468.    "execution_count": 282,
  4469.    "metadata": {},
  4470.    "outputs": [],
  4471.    "source": [
  4472.     "# converting 'object' type into 'int' type\n",
  4473.     "\n",
  4474.     "from sklearn.preprocessing import LabelEncoder\n",
  4475.     "\n",
  4476.     "col=['Team 1', 'Team 2','City','TimeOfGame']\n",
  4477.     "\n",
  4478.     "le=LabelEncoder()\n",
  4479.     "\n",
  4480.     "for i in col:\n",
  4481.     "    train_data[i]=le.fit_transform(train_data[i]).astype(np.int)"
  4482.    ]
  4483.   },
  4484.   {
  4485.    "cell_type": "code",
  4486.    "execution_count": 283,
  4487.    "metadata": {},
  4488.    "outputs": [
  4489.     {
  4490.      "data": {
  4491.       "text/html": [
  4492.        "<div>\n",
  4493.        "<style scoped>\n",
  4494.        "    .dataframe tbody tr th:only-of-type {\n",
  4495.        "        vertical-align: middle;\n",
  4496.        "    }\n",
  4497.        "\n",
  4498.        "    .dataframe tbody tr th {\n",
  4499.        "        vertical-align: top;\n",
  4500.        "    }\n",
  4501.        "\n",
  4502.        "    .dataframe thead th {\n",
  4503.        "        text-align: right;\n",
  4504.        "    }\n",
  4505.        "</style>\n",
  4506.        "<table border=\"1\" class=\"dataframe\">\n",
  4507.        "  <thead>\n",
  4508.        "    <tr style=\"text-align: right;\">\n",
  4509.        "      <th></th>\n",
  4510.        "      <th>Team 1</th>\n",
  4511.        "      <th>Team 2</th>\n",
  4512.        "      <th>City</th>\n",
  4513.        "      <th>DayOfWeek</th>\n",
  4514.        "      <th>TimeOfGame</th>\n",
  4515.        "      <th>AvgWindSpeed</th>\n",
  4516.        "      <th>AvgHumidity</th>\n",
  4517.        "      <th>Inn 1 Team 1 NOP R>25,SR>125</th>\n",
  4518.        "      <th>Inn 1 Team 1 NOP R<25, SR>125</th>\n",
  4519.        "      <th>Inn 1 Team 1 Total 4s</th>\n",
  4520.        "      <th>...</th>\n",
  4521.        "      <th>Inn 2 Team 2 NOP R<25, SR>125</th>\n",
  4522.        "      <th>Inn 2 Team 2 Total 4s</th>\n",
  4523.        "      <th>Inn 2 Team 2 Total 6s</th>\n",
  4524.        "      <th>Inn 2 Team 2 Max Strike Rate_ALLBatsmen</th>\n",
  4525.        "      <th>Inn 2 Team 1 NoP fast bowlers</th>\n",
  4526.        "      <th>Inn 2 Team 1 NoP Spinners</th>\n",
  4527.        "      <th>Inn 2 Team 1 wickets taken_catches_runout</th>\n",
  4528.        "      <th>Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping</th>\n",
  4529.        "      <th>Inn 2 Team 1 Extras conceded in_wides_No Balls</th>\n",
  4530.        "      <th>Winner (team 1=1, team 2=0)</th>\n",
  4531.        "    </tr>\n",
  4532.        "  </thead>\n",
  4533.        "  <tbody>\n",
  4534.        "    <tr>\n",
  4535.        "      <th>0</th>\n",
  4536.        "      <td>6</td>\n",
  4537.        "      <td>10</td>\n",
  4538.        "      <td>8</td>\n",
  4539.        "      <td>1</td>\n",
  4540.        "      <td>8</td>\n",
  4541.        "      <td>6</td>\n",
  4542.        "      <td>0.66</td>\n",
  4543.        "      <td>1</td>\n",
  4544.        "      <td>1</td>\n",
  4545.        "      <td>15</td>\n",
  4546.        "      <td>...</td>\n",
  4547.        "      <td>0</td>\n",
  4548.        "      <td>3</td>\n",
  4549.        "      <td>3</td>\n",
  4550.        "      <td>120.00</td>\n",
  4551.        "      <td>5</td>\n",
  4552.        "      <td>0</td>\n",
  4553.        "      <td>6</td>\n",
  4554.        "      <td>4</td>\n",
  4555.        "      <td>11</td>\n",
  4556.        "      <td>1</td>\n",
  4557.        "    </tr>\n",
  4558.        "    <tr>\n",
  4559.        "      <th>1</th>\n",
  4560.        "      <td>2</td>\n",
  4561.        "      <td>9</td>\n",
  4562.        "      <td>7</td>\n",
  4563.        "      <td>2</td>\n",
  4564.        "      <td>5</td>\n",
  4565.        "      <td>7</td>\n",
  4566.        "      <td>0.66</td>\n",
  4567.        "      <td>3</td>\n",
  4568.        "      <td>2</td>\n",
  4569.        "      <td>20</td>\n",
  4570.        "      <td>...</td>\n",
  4571.        "      <td>2</td>\n",
  4572.        "      <td>18</td>\n",
  4573.        "      <td>9</td>\n",
  4574.        "      <td>215.15</td>\n",
  4575.        "      <td>4</td>\n",
  4576.        "      <td>1</td>\n",
  4577.        "      <td>4</td>\n",
  4578.        "      <td>0</td>\n",
  4579.        "      <td>5</td>\n",
  4580.        "      <td>1</td>\n",
  4581.        "    </tr>\n",
  4582.        "    <tr>\n",
  4583.        "      <th>2</th>\n",
  4584.        "      <td>5</td>\n",
  4585.        "      <td>8</td>\n",
  4586.        "      <td>6</td>\n",
  4587.        "      <td>3</td>\n",
  4588.        "      <td>10</td>\n",
  4589.        "      <td>11</td>\n",
  4590.        "      <td>0.66</td>\n",
  4591.        "      <td>2</td>\n",
  4592.        "      <td>2</td>\n",
  4593.        "      <td>13</td>\n",
  4594.        "      <td>...</td>\n",
  4595.        "      <td>1</td>\n",
  4596.        "      <td>18</td>\n",
  4597.        "      <td>1</td>\n",
  4598.        "      <td>300.00</td>\n",
  4599.        "      <td>3</td>\n",
  4600.        "      <td>3</td>\n",
  4601.        "      <td>0</td>\n",
  4602.        "      <td>1</td>\n",
  4603.        "      <td>10</td>\n",
  4604.        "      <td>0</td>\n",
  4605.        "    </tr>\n",
  4606.        "  </tbody>\n",
  4607.        "</table>\n",
  4608.        "<p>3 rows × 28 columns</p>\n",
  4609.        "</div>"
  4610.       ],
  4611.       "text/plain": [
  4612.        "   Team 1  Team 2  City  DayOfWeek  TimeOfGame  AvgWindSpeed  AvgHumidity  \\\n",
  4613.        "0       6      10     8          1           8             6         0.66   \n",
  4614.        "1       2       9     7          2           5             7         0.66   \n",
  4615.        "2       5       8     6          3          10            11         0.66   \n",
  4616.        "\n",
  4617.        "   Inn 1 Team 1 NOP R>25,SR>125  Inn 1 Team 1 NOP R<25, SR>125  \\\n",
  4618.        "0                             1                              1   \n",
  4619.        "1                             3                              2   \n",
  4620.        "2                             2                              2   \n",
  4621.        "\n",
  4622.        "   Inn 1 Team 1 Total 4s  ...  Inn 2 Team 2 NOP R<25, SR>125  \\\n",
  4623.        "0                     15  ...                              0   \n",
  4624.        "1                     20  ...                              2   \n",
  4625.        "2                     13  ...                              1   \n",
  4626.        "\n",
  4627.        "   Inn 2 Team 2 Total 4s  Inn 2 Team 2 Total 6s  \\\n",
  4628.        "0                      3                      3   \n",
  4629.        "1                     18                      9   \n",
  4630.        "2                     18                      1   \n",
  4631.        "\n",
  4632.        "   Inn 2 Team 2 Max Strike Rate_ALLBatsmen  Inn 2 Team 1 NoP fast bowlers  \\\n",
  4633.        "0                                   120.00                              5   \n",
  4634.        "1                                   215.15                              4   \n",
  4635.        "2                                   300.00                              3   \n",
  4636.        "\n",
  4637.        "   Inn 2 Team 1 NoP Spinners  Inn 2 Team 1 wickets taken_catches_runout  \\\n",
  4638.        "0                          0                                          6   \n",
  4639.        "1                          1                                          4   \n",
  4640.        "2                          3                                          0   \n",
  4641.        "\n",
  4642.        "   Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping  \\\n",
  4643.        "0                                                  4                  \n",
  4644.        "1                                                  0                  \n",
  4645.        "2                                                  1                  \n",
  4646.        "\n",
  4647.        "   Inn 2 Team 1 Extras conceded in_wides_No Balls  Winner (team 1=1, team 2=0)  \n",
  4648.        "0                                              11                            1  \n",
  4649.        "1                                               5                            1  \n",
  4650.        "2                                              10                            0  \n",
  4651.        "\n",
  4652.        "[3 rows x 28 columns]"
  4653.       ]
  4654.      },
  4655.      "execution_count": 283,
  4656.      "metadata": {},
  4657.      "output_type": "execute_result"
  4658.     }
  4659.    ],
  4660.    "source": [
  4661.     "train_data.head(3)"
  4662.    ]
  4663.   },
  4664.   {
  4665.    "cell_type": "markdown",
  4666.    "metadata": {},
  4667.    "source": [
  4668.     "# 8. Modeling :"
  4669.    ]
  4670.   },
  4671.   {
  4672.    "cell_type": "code",
  4673.    "execution_count": 284,
  4674.    "metadata": {},
  4675.    "outputs": [],
  4676.    "source": [
  4677.     "# now separating train and test dataset\n",
  4678.     "\n",
  4679.     "training=train_data[:252]\n",
  4680.     "testing=train_data[252:]"
  4681.    ]
  4682.   },
  4683.   {
  4684.    "cell_type": "code",
  4685.    "execution_count": 285,
  4686.    "metadata": {},
  4687.    "outputs": [],
  4688.    "source": [
  4689.     "# separating independent and dependent variables\n",
  4690.     "\n",
  4691.     "x1 = training.iloc[:, :-1].values\n",
  4692.     "y1 = training[\"Winner (team 1=1, team 2=0)\"].values"
  4693.    ]
  4694.   },
  4695.   {
  4696.    "cell_type": "code",
  4697.    "execution_count": 286,
  4698.    "metadata": {},
  4699.    "outputs": [],
  4700.    "source": [
  4701.     "x2 = testing.iloc[:, :-1].values\n",
  4702.     "y2 = testing[\"Winner (team 1=1, team 2=0)\"].values"
  4703.    ]
  4704.   },
  4705.   {
  4706.    "cell_type": "code",
  4707.    "execution_count": 287,
  4708.    "metadata": {},
  4709.    "outputs": [
  4710.     {
  4711.      "data": {
  4712.       "text/plain": [
  4713.        "(0.44047619047619047, 0.5595238095238095)"
  4714.       ]
  4715.      },
  4716.      "execution_count": 287,
  4717.      "metadata": {},
  4718.      "output_type": "execute_result"
  4719.     }
  4720.    ],
  4721.    "source": [
  4722.     "np.mean(y1), np.mean(1-y1)"
  4723.    ]
  4724.   },
  4725.   {
  4726.    "cell_type": "code",
  4727.    "execution_count": 288,
  4728.    "metadata": {},
  4729.    "outputs": [
  4730.     {
  4731.      "data": {
  4732.       "text/plain": [
  4733.        "(0.4473684210526316, 0.5526315789473685)"
  4734.       ]
  4735.      },
  4736.      "execution_count": 288,
  4737.      "metadata": {},
  4738.      "output_type": "execute_result"
  4739.     }
  4740.    ],
  4741.    "source": [
  4742.     "np.mean(y2), np.mean(1-y2)"
  4743.    ]
  4744.   },
  4745.   {
  4746.    "cell_type": "markdown",
  4747.    "metadata": {},
  4748.    "source": [
  4749.     "## Applying Bagging and Boosting techniques as well as traditional technique (Logistic Regression)"
  4750.    ]
  4751.   },
  4752.   {
  4753.    "cell_type": "code",
  4754.    "execution_count": 289,
  4755.    "metadata": {},
  4756.    "outputs": [],
  4757.    "source": [
  4758.     "from sklearn.ensemble import RandomForestClassifier\n",
  4759.     "from sklearn.metrics import accuracy_score,roc_auc_score"
  4760.    ]
  4761.   },
  4762.   {
  4763.    "cell_type": "code",
  4764.    "execution_count": 290,
  4765.    "metadata": {},
  4766.    "outputs": [
  4767.     {
  4768.      "data": {
  4769.       "text/plain": [
  4770.        "RandomForestClassifier(bootstrap=True, class_weight=None, criterion='gini',\n",
  4771.        "            max_depth=None, max_features='auto', max_leaf_nodes=None,\n",
  4772.        "            min_impurity_decrease=0.0, min_impurity_split=None,\n",
  4773.        "            min_samples_leaf=1, min_samples_split=2,\n",
  4774.        "            min_weight_fraction_leaf=0.0, n_estimators=200, n_jobs=None,\n",
  4775.        "            oob_score=False, random_state=None, verbose=0,\n",
  4776.        "            warm_start=False)"
  4777.       ]
  4778.      },
  4779.      "execution_count": 290,
  4780.      "metadata": {},
  4781.      "output_type": "execute_result"
  4782.     }
  4783.    ],
  4784.    "source": [
  4785.     "# training the RF Model\n",
  4786.     "\n",
  4787.     "rf_model = RandomForestClassifier(n_estimators=200)\n",
  4788.     "rf_model.fit(x1, y1)"
  4789.    ]
  4790.   },
  4791.   {
  4792.    "cell_type": "code",
  4793.    "execution_count": 291,
  4794.    "metadata": {},
  4795.    "outputs": [
  4796.     {
  4797.      "name": "stdout",
  4798.      "output_type": "stream",
  4799.      "text": [
  4800.       "accuracy is 0.855\n",
  4801.       "roc-auc is 0.940\n"
  4802.      ]
  4803.     }
  4804.    ],
  4805.    "source": [
  4806.     "# make predictions on the test set - both \"hard\" predictions, and the scores \n",
  4807.     "\n",
  4808.     "y_pred_class_rf = rf_model.predict(x2)\n",
  4809.     "y_pred_prob_rf = rf_model.predict_proba(x2)\n",
  4810.     "\n",
  4811.     "\n",
  4812.     "print('accuracy is {:.3f}'.format(accuracy_score(y2,y_pred_class_rf)))\n",
  4813.     "print('roc-auc is {:.3f}'.format(roc_auc_score(y2,y_pred_prob_rf[:,1])))"
  4814.    ]
  4815.   },
  4816.   {
  4817.    "cell_type": "code",
  4818.    "execution_count": 292,
  4819.    "metadata": {},
  4820.    "outputs": [
  4821.     {
  4822.      "data": {
  4823.       "text/plain": [
  4824.        "(array([0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0,\n",
  4825.        "        0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0,\n",
  4826.        "        1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0,\n",
  4827.        "        1, 0, 0, 1, 1, 0, 1, 1, 1, 0]),\n",
  4828.        " array([0, 0, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0,\n",
  4829.        "        0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0,\n",
  4830.        "        0, 1, 1, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0,\n",
  4831.        "        1, 0, 0, 1, 1, 0, 1, 1, 1, 1]))"
  4832.       ]
  4833.      },
  4834.      "execution_count": 292,
  4835.      "metadata": {},
  4836.      "output_type": "execute_result"
  4837.     }
  4838.    ],
  4839.    "source": [
  4840.     "y2,y_pred_class_rf"
  4841.    ]
  4842.   },
  4843.   {
  4844.    "cell_type": "code",
  4845.    "execution_count": 293,
  4846.    "metadata": {},
  4847.    "outputs": [
  4848.     {
  4849.      "data": {
  4850.       "text/plain": [
  4851.        "array([0.085, 0.11 , 0.435, 0.795, 0.67 , 0.835, 0.85 , 0.71 , 0.255,\n",
  4852.        "       0.865, 0.04 , 0.845, 0.565, 0.045, 0.22 , 0.085, 0.555, 0.865,\n",
  4853.        "       0.135, 0.52 , 0.295, 0.025, 0.375, 0.765, 0.285, 0.09 , 0.835,\n",
  4854.        "       0.14 , 0.33 , 0.815, 0.08 , 0.035, 0.555, 0.015, 0.765, 0.895,\n",
  4855.        "       0.745, 0.66 , 0.125, 0.32 , 0.27 , 0.43 , 0.045, 0.425, 0.405,\n",
  4856.        "       0.585, 0.72 , 0.905, 0.675, 0.35 , 0.155, 0.06 , 0.87 , 0.08 ,\n",
  4857.        "       0.31 , 0.505, 0.625, 0.285, 0.06 , 0.875, 0.485, 0.45 , 0.39 ,\n",
  4858.        "       0.305, 0.61 , 0.31 , 0.67 , 0.36 , 0.09 , 0.795, 0.71 , 0.09 ,\n",
  4859.        "       0.94 , 0.91 , 0.915, 0.695])"
  4860.       ]
  4861.      },
  4862.      "execution_count": 293,
  4863.      "metadata": {},
  4864.      "output_type": "execute_result"
  4865.     }
  4866.    ],
  4867.    "source": [
  4868.     "y_pred_prob_rf[:,1]"
  4869.    ]
  4870.   },
  4871.   {
  4872.    "cell_type": "code",
  4873.    "execution_count": 294,
  4874.    "metadata": {},
  4875.    "outputs": [
  4876.     {
  4877.      "data": {
  4878.       "text/html": [
  4879.        "<div>\n",
  4880.        "<style scoped>\n",
  4881.        "    .dataframe tbody tr th:only-of-type {\n",
  4882.        "        vertical-align: middle;\n",
  4883.        "    }\n",
  4884.        "\n",
  4885.        "    .dataframe tbody tr th {\n",
  4886.        "        vertical-align: top;\n",
  4887.        "    }\n",
  4888.        "\n",
  4889.        "    .dataframe thead th {\n",
  4890.        "        text-align: right;\n",
  4891.        "    }\n",
  4892.        "</style>\n",
  4893.        "<table border=\"1\" class=\"dataframe\">\n",
  4894.        "  <thead>\n",
  4895.        "    <tr style=\"text-align: right;\">\n",
  4896.        "      <th></th>\n",
  4897.        "      <th>accuracy</th>\n",
  4898.        "    </tr>\n",
  4899.        "  </thead>\n",
  4900.        "  <tbody>\n",
  4901.        "    <tr>\n",
  4902.        "      <th>LogisticRegression</th>\n",
  4903.        "      <td>0.934211</td>\n",
  4904.        "    </tr>\n",
  4905.        "    <tr>\n",
  4906.        "      <th>GBC</th>\n",
  4907.        "      <td>0.907895</td>\n",
  4908.        "    </tr>\n",
  4909.        "    <tr>\n",
  4910.        "      <th>ABC</th>\n",
  4911.        "      <td>0.776316</td>\n",
  4912.        "    </tr>\n",
  4913.        "  </tbody>\n",
  4914.        "</table>\n",
  4915.        "</div>"
  4916.       ],
  4917.       "text/plain": [
  4918.        "                    accuracy\n",
  4919.        "LogisticRegression  0.934211\n",
  4920.        "GBC                 0.907895\n",
  4921.        "ABC                 0.776316"
  4922.       ]
  4923.      },
  4924.      "execution_count": 294,
  4925.      "metadata": {},
  4926.      "output_type": "execute_result"
  4927.     }
  4928.    ],
  4929.    "source": [
  4930.     "from sklearn.ensemble import GradientBoostingClassifier,AdaBoostClassifier\n",
  4931.     "\n",
  4932.     "from sklearn.linear_model import LogisticRegression\n",
  4933.     "\n",
  4934.     "Classifiers=['LogisticRegression','GBC','ABC']\n",
  4935.     "\n",
  4936.     "models=[LogisticRegression(),GradientBoostingClassifier(n_estimators=250,max_depth=3,learning_rate=0.01),\n",
  4937.     "        AdaBoostClassifier(n_estimators=250,learning_rate=0.01)]\n",
  4938.     "\n",
  4939.     "accuracy=[]\n",
  4940.     "roc=[]\n",
  4941.     "\n",
  4942.     "for i in models:\n",
  4943.     "    mod=i\n",
  4944.     "    fit=mod.fit(x1,y1)\n",
  4945.     "    predict=fit.predict(x2)\n",
  4946.     "    predict_proba=fit.predict_proba(x2)\n",
  4947.     "    accuracy.append(accuracy_score(y2,predict))\n",
  4948.     "    roc.append(roc_auc_score(y2,predict_proba[:,1]))\n",
  4949.     "    \n",
  4950.     "pd.DataFrame(accuracy,index=Classifiers,columns=['accuracy'])"
  4951.    ]
  4952.   },
  4953.   {
  4954.    "cell_type": "code",
  4955.    "execution_count": 295,
  4956.    "metadata": {},
  4957.    "outputs": [
  4958.     {
  4959.      "data": {
  4960.       "text/html": [
  4961.        "<div>\n",
  4962.        "<style scoped>\n",
  4963.        "    .dataframe tbody tr th:only-of-type {\n",
  4964.        "        vertical-align: middle;\n",
  4965.        "    }\n",
  4966.        "\n",
  4967.        "    .dataframe tbody tr th {\n",
  4968.        "        vertical-align: top;\n",
  4969.        "    }\n",
  4970.        "\n",
  4971.        "    .dataframe thead th {\n",
  4972.        "        text-align: right;\n",
  4973.        "    }\n",
  4974.        "</style>\n",
  4975.        "<table border=\"1\" class=\"dataframe\">\n",
  4976.        "  <thead>\n",
  4977.        "    <tr style=\"text-align: right;\">\n",
  4978.        "      <th></th>\n",
  4979.        "      <th>roc</th>\n",
  4980.        "    </tr>\n",
  4981.        "  </thead>\n",
  4982.        "  <tbody>\n",
  4983.        "    <tr>\n",
  4984.        "      <th>LogisticRegression</th>\n",
  4985.        "      <td>0.979692</td>\n",
  4986.        "    </tr>\n",
  4987.        "    <tr>\n",
  4988.        "      <th>GBC</th>\n",
  4989.        "      <td>0.934174</td>\n",
  4990.        "    </tr>\n",
  4991.        "    <tr>\n",
  4992.        "      <th>ABC</th>\n",
  4993.        "      <td>0.911415</td>\n",
  4994.        "    </tr>\n",
  4995.        "  </tbody>\n",
  4996.        "</table>\n",
  4997.        "</div>"
  4998.       ],
  4999.       "text/plain": [
  5000.        "                         roc\n",
  5001.        "LogisticRegression  0.979692\n",
  5002.        "GBC                 0.934174\n",
  5003.        "ABC                 0.911415"
  5004.       ]
  5005.      },
  5006.      "execution_count": 295,
  5007.      "metadata": {},
  5008.      "output_type": "execute_result"
  5009.     }
  5010.    ],
  5011.    "source": [
  5012.     "pd.DataFrame(roc,index=Classifiers,columns=['roc'])"
  5013.    ]
  5014.   },
  5015.   {
  5016.    "cell_type": "code",
  5017.    "execution_count": 296,
  5018.    "metadata": {},
  5019.    "outputs": [
  5020.     {
  5021.      "name": "stdout",
  5022.      "output_type": "stream",
  5023.      "text": [
  5024.       "accuracy is 0.934\n",
  5025.       "roc-auc is 0.980\n"
  5026.      ]
  5027.     }
  5028.    ],
  5029.    "source": [
  5030.     "lg=LogisticRegression()\n",
  5031.     "lg.fit(x1,y1)\n",
  5032.     "y_pred_class = lg.predict(x2)\n",
  5033.     "y_pred_prob=lg.predict_proba(x2)\n",
  5034.     "\n",
  5035.     "\n",
  5036.     "print('accuracy is {:.3f}'.format(accuracy_score(y2,y_pred_class)))\n",
  5037.     "print('roc-auc is {:.3f}'.format(roc_auc_score(y2,y_pred_prob[:,1])))"
  5038.    ]
  5039.   },
  5040.   {
  5041.    "cell_type": "code",
  5042.    "execution_count": 297,
  5043.    "metadata": {},
  5044.    "outputs": [
  5045.     {
  5046.      "data": {
  5047.       "text/plain": [
  5048.        "(array([0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0,\n",
  5049.        "        0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0,\n",
  5050.        "        1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0,\n",
  5051.        "        1, 0, 0, 1, 1, 0, 1, 1, 1, 0]),\n",
  5052.        " array([0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0,\n",
  5053.        "        0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 1, 1, 1, 0, 0, 1, 0, 0,\n",
  5054.        "        0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0,\n",
  5055.        "        1, 0, 0, 1, 1, 0, 1, 1, 1, 0]))"
  5056.       ]
  5057.      },
  5058.      "execution_count": 297,
  5059.      "metadata": {},
  5060.      "output_type": "execute_result"
  5061.     }
  5062.    ],
  5063.    "source": [
  5064.     "y2,y_pred_class"
  5065.    ]
  5066.   },
  5067.   {
  5068.    "cell_type": "code",
  5069.    "execution_count": 298,
  5070.    "metadata": {},
  5071.    "outputs": [
  5072.     {
  5073.      "data": {
  5074.       "text/plain": [
  5075.        "array([3.40483743e-07, 3.03274601e-03, 9.93964035e-01, 9.99988149e-01,\n",
  5076.        "       9.98937407e-01, 9.99998073e-01, 9.99881475e-01, 9.86895835e-01,\n",
  5077.        "       4.53882552e-02, 9.99992056e-01, 2.87620188e-04, 9.99959355e-01,\n",
  5078.        "       7.79730740e-01, 2.16710345e-03, 5.73821706e-02, 6.70463952e-04,\n",
  5079.        "       9.85809832e-01, 9.99999972e-01, 4.65158232e-02, 1.48981503e-01,\n",
  5080.        "       2.72798487e-04, 5.96832421e-05, 5.87572367e-04, 9.93350127e-01,\n",
  5081.        "       9.11166428e-03, 3.31698706e-01, 9.86698093e-01, 4.66122665e-02,\n",
  5082.        "       7.77048117e-04, 9.99922692e-01, 6.95461422e-04, 3.77596738e-03,\n",
  5083.        "       7.11761288e-01, 2.74741028e-03, 4.62106335e-01, 9.99985758e-01,\n",
  5084.        "       9.79152103e-01, 9.98808014e-01, 6.10339992e-01, 4.02401264e-03,\n",
  5085.        "       9.73911149e-04, 5.05842486e-01, 5.67609146e-03, 1.84856105e-01,\n",
  5086.        "       4.50354181e-02, 8.22950339e-02, 9.46822317e-01, 9.99727577e-01,\n",
  5087.        "       4.31286933e-01, 4.38681050e-02, 1.39928968e-01, 9.20476706e-05,\n",
  5088.        "       9.99863662e-01, 6.65918387e-06, 4.24013742e-04, 1.06447751e-03,\n",
  5089.        "       9.99958256e-01, 9.59562012e-01, 1.53679981e-05, 9.99999451e-01,\n",
  5090.        "       4.72179643e-03, 1.14455356e-01, 1.69064354e-01, 6.81891018e-02,\n",
  5091.        "       9.99286957e-01, 2.90742266e-02, 9.99997082e-01, 3.22585430e-03,\n",
  5092.        "       8.66524237e-04, 9.99725912e-01, 8.45765771e-01, 1.46543986e-06,\n",
  5093.        "       9.97580113e-01, 9.99916805e-01, 9.99999990e-01, 4.32658519e-02])"
  5094.       ]
  5095.      },
  5096.      "execution_count": 298,
  5097.      "metadata": {},
  5098.      "output_type": "execute_result"
  5099.     }
  5100.    ],
  5101.    "source": [
  5102.     "y_pred_prob[:,1]"
  5103.    ]
  5104.   },
  5105.   {
  5106.    "cell_type": "markdown",
  5107.    "metadata": {},
  5108.    "source": [
  5109.     "## Applying Neural Network technique:"
  5110.    ]
  5111.   },
  5112.   {
  5113.    "cell_type": "code",
  5114.    "execution_count": 299,
  5115.    "metadata": {},
  5116.    "outputs": [],
  5117.    "source": [
  5118.     "# importing Keras objects for Deep Learning\n",
  5119.     "\n",
  5120.     "from keras.models  import Sequential\n",
  5121.     "from keras.layers import Input, Dense,Dropout\n",
  5122.     "from keras.optimizers import RMSprop"
  5123.    ]
  5124.   },
  5125.   {
  5126.    "cell_type": "code",
  5127.    "execution_count": 300,
  5128.    "metadata": {},
  5129.    "outputs": [],
  5130.    "source": [
  5131.     "# i will build a model with two hidden layers of size 512\n",
  5132.     "# Fully connected inputs at each layer\n",
  5133.     "# i will use dropout of .2 to help regularize\n",
  5134.     "\n",
  5135.     "model_1 = Sequential()\n",
  5136.     "model_1.add(Dense(64, activation='relu', input_shape=(27,)))\n",
  5137.     "model_1.add(Dropout(0.2))\n",
  5138.     "model_1.add(Dense(64, activation='relu'))\n",
  5139.     "model_1.add(Dropout(0.2))\n",
  5140.     "model_1.add(Dense(1, activation=\"sigmoid\"))"
  5141.    ]
  5142.   },
  5143.   {
  5144.    "cell_type": "code",
  5145.    "execution_count": 301,
  5146.    "metadata": {},
  5147.    "outputs": [
  5148.     {
  5149.      "name": "stdout",
  5150.      "output_type": "stream",
  5151.      "text": [
  5152.       "_________________________________________________________________\n",
  5153.       "Layer (type)                 Output Shape              Param #   \n",
  5154.       "=================================================================\n",
  5155.       "dense_16 (Dense)             (None, 64)                1792      \n",
  5156.       "_________________________________________________________________\n",
  5157.       "dropout_11 (Dropout)         (None, 64)                0         \n",
  5158.       "_________________________________________________________________\n",
  5159.       "dense_17 (Dense)             (None, 64)                4160      \n",
  5160.       "_________________________________________________________________\n",
  5161.       "dropout_12 (Dropout)         (None, 64)                0         \n",
  5162.       "_________________________________________________________________\n",
  5163.       "dense_18 (Dense)             (None, 1)                 65        \n",
  5164.       "=================================================================\n",
  5165.       "Total params: 6,017\n",
  5166.       "Trainable params: 6,017\n",
  5167.       "Non-trainable params: 0\n",
  5168.       "_________________________________________________________________\n"
  5169.      ]
  5170.     }
  5171.    ],
  5172.    "source": [
  5173.     "model_1.summary()"
  5174.    ]
  5175.   },
  5176.   {
  5177.    "cell_type": "code",
  5178.    "execution_count": 302,
  5179.    "metadata": {},
  5180.    "outputs": [],
  5181.    "source": [
  5182.     "# now compiling the model\n",
  5183.     "\n",
  5184.     "learning_rate = .001\n",
  5185.     "model_1.compile(loss='binary_crossentropy',\n",
  5186.     "              optimizer=RMSprop(lr=learning_rate),\n",
  5187.     "              metrics=['accuracy'])"
  5188.    ]
  5189.   },
  5190.   {
  5191.    "cell_type": "code",
  5192.    "execution_count": 303,
  5193.    "metadata": {},
  5194.    "outputs": [
  5195.     {
  5196.      "name": "stdout",
  5197.      "output_type": "stream",
  5198.      "text": [
  5199.       "Train on 252 samples, validate on 76 samples\n",
  5200.       "Epoch 1/150\n",
  5201.       "252/252 [==============================] - 1s 2ms/step - loss: 6.9613 - acc: 0.5595 - val_loss: 7.2107 - val_acc: 0.5526\n",
  5202.       "Epoch 2/150\n",
  5203.       "252/252 [==============================] - 0s 75us/step - loss: 7.0973 - acc: 0.5595 - val_loss: 7.2107 - val_acc: 0.5526\n",
  5204.       "Epoch 3/150\n",
  5205.       "252/252 [==============================] - 0s 72us/step - loss: 7.0165 - acc: 0.5595 - val_loss: 7.2107 - val_acc: 0.5526\n",
  5206.       "Epoch 4/150\n",
  5207.       "252/252 [==============================] - 0s 88us/step - loss: 6.8399 - acc: 0.5516 - val_loss: 7.2107 - val_acc: 0.5526\n",
  5208.       "Epoch 5/150\n",
  5209.       "252/252 [==============================] - 0s 41us/step - loss: 6.9069 - acc: 0.5317 - val_loss: 7.2107 - val_acc: 0.5526\n",
  5210.       "Epoch 6/150\n",
  5211.       "252/252 [==============================] - 0s 81us/step - loss: 6.6908 - acc: 0.5278 - val_loss: 7.2107 - val_acc: 0.5526\n",
  5212.       "Epoch 7/150\n",
  5213.       "252/252 [==============================] - 0s 77us/step - loss: 6.0762 - acc: 0.5397 - val_loss: 3.0008 - val_acc: 0.5658\n",
  5214.       "Epoch 8/150\n",
  5215.       "252/252 [==============================] - 0s 82us/step - loss: 5.5813 - acc: 0.5238 - val_loss: 1.3634 - val_acc: 0.5526\n",
  5216.       "Epoch 9/150\n",
  5217.       "252/252 [==============================] - 0s 79us/step - loss: 5.0466 - acc: 0.5317 - val_loss: 0.9255 - val_acc: 0.4868\n",
  5218.       "Epoch 10/150\n",
  5219.       "252/252 [==============================] - 0s 56us/step - loss: 5.4292 - acc: 0.4802 - val_loss: 2.0214 - val_acc: 0.5526\n",
  5220.       "Epoch 11/150\n",
  5221.       "252/252 [==============================] - 0s 37us/step - loss: 5.3716 - acc: 0.4881 - val_loss: 0.9769 - val_acc: 0.5132\n",
  5222.       "Epoch 12/150\n",
  5223.       "252/252 [==============================] - 0s 100us/step - loss: 4.9477 - acc: 0.4881 - val_loss: 0.9533 - val_acc: 0.5789\n",
  5224.       "Epoch 13/150\n",
  5225.       "252/252 [==============================] - 0s 73us/step - loss: 4.5824 - acc: 0.5238 - val_loss: 2.5210 - val_acc: 0.4737\n",
  5226.       "Epoch 14/150\n",
  5227.       "252/252 [==============================] - 0s 35us/step - loss: 4.6289 - acc: 0.5278 - val_loss: 0.8645 - val_acc: 0.5921\n",
  5228.       "Epoch 15/150\n",
  5229.       "252/252 [==============================] - 0s 36us/step - loss: 4.4709 - acc: 0.5516 - val_loss: 1.0121 - val_acc: 0.6316\n",
  5230.       "Epoch 16/150\n",
  5231.       "252/252 [==============================] - 0s 100us/step - loss: 4.4986 - acc: 0.5357 - val_loss: 1.1343 - val_acc: 0.5789\n",
  5232.       "Epoch 17/150\n",
  5233.       "252/252 [==============================] - 0s 58us/step - loss: 3.9190 - acc: 0.5992 - val_loss: 1.0397 - val_acc: 0.6316\n",
  5234.       "Epoch 18/150\n",
  5235.       "252/252 [==============================] - 0s 44us/step - loss: 4.7588 - acc: 0.4960 - val_loss: 1.0317 - val_acc: 0.5658\n",
  5236.       "Epoch 19/150\n",
  5237.       "252/252 [==============================] - 0s 89us/step - loss: 3.8100 - acc: 0.5556 - val_loss: 0.7782 - val_acc: 0.6447\n",
  5238.       "Epoch 20/150\n",
  5239.       "252/252 [==============================] - 0s 38us/step - loss: 4.1435 - acc: 0.5317 - val_loss: 0.6667 - val_acc: 0.6579\n",
  5240.       "Epoch 21/150\n",
  5241.       "252/252 [==============================] - 0s 39us/step - loss: 3.6260 - acc: 0.6071 - val_loss: 2.2773 - val_acc: 0.5132\n",
  5242.       "Epoch 22/150\n",
  5243.       "252/252 [==============================] - 0s 77us/step - loss: 4.1852 - acc: 0.5437 - val_loss: 2.0804 - val_acc: 0.5000\n",
  5244.       "Epoch 23/150\n",
  5245.       "252/252 [==============================] - 0s 56us/step - loss: 3.2150 - acc: 0.5476 - val_loss: 2.3391 - val_acc: 0.4737\n",
  5246.       "Epoch 24/150\n",
  5247.       "252/252 [==============================] - 0s 47us/step - loss: 3.1800 - acc: 0.5635 - val_loss: 2.4375 - val_acc: 0.4737\n",
  5248.       "Epoch 25/150\n",
  5249.       "252/252 [==============================] - 0s 41us/step - loss: 3.7439 - acc: 0.5357 - val_loss: 0.6821 - val_acc: 0.6447\n",
  5250.       "Epoch 26/150\n",
  5251.       "252/252 [==============================] - 0s 59us/step - loss: 3.4848 - acc: 0.5556 - val_loss: 0.7963 - val_acc: 0.6316\n",
  5252.       "Epoch 27/150\n",
  5253.       "252/252 [==============================] - 0s 43us/step - loss: 2.9464 - acc: 0.5675 - val_loss: 0.9939 - val_acc: 0.6184\n",
  5254.       "Epoch 28/150\n",
  5255.       "252/252 [==============================] - 0s 85us/step - loss: 3.0968 - acc: 0.5437 - val_loss: 1.0572 - val_acc: 0.5789\n",
  5256.       "Epoch 29/150\n",
  5257.       "252/252 [==============================] - 0s 41us/step - loss: 2.8950 - acc: 0.5635 - val_loss: 0.6111 - val_acc: 0.6711\n",
  5258.       "Epoch 30/150\n",
  5259.       "252/252 [==============================] - 0s 57us/step - loss: 3.1858 - acc: 0.5437 - val_loss: 0.7311 - val_acc: 0.6184\n",
  5260.       "Epoch 31/150\n",
  5261.       "252/252 [==============================] - 0s 42us/step - loss: 2.8878 - acc: 0.5397 - val_loss: 0.7806 - val_acc: 0.6184\n",
  5262.       "Epoch 32/150\n",
  5263.       "252/252 [==============================] - 0s 42us/step - loss: 2.5863 - acc: 0.5635 - val_loss: 1.1858 - val_acc: 0.5789\n",
  5264.       "Epoch 33/150\n",
  5265.       "252/252 [==============================] - 0s 40us/step - loss: 2.2358 - acc: 0.6032 - val_loss: 1.0832 - val_acc: 0.5789\n",
  5266.       "Epoch 34/150\n",
  5267.       "252/252 [==============================] - 0s 61us/step - loss: 2.2834 - acc: 0.6032 - val_loss: 0.6424 - val_acc: 0.6842\n",
  5268.       "Epoch 35/150\n",
  5269.       "252/252 [==============================] - 0s 94us/step - loss: 2.1172 - acc: 0.5476 - val_loss: 0.5189 - val_acc: 0.7105\n",
  5270.       "Epoch 36/150\n",
  5271.       "252/252 [==============================] - 0s 96us/step - loss: 2.0956 - acc: 0.5675 - val_loss: 0.6763 - val_acc: 0.6447\n",
  5272.       "Epoch 37/150\n",
  5273.       "252/252 [==============================] - 0s 59us/step - loss: 2.0578 - acc: 0.5794 - val_loss: 0.7708 - val_acc: 0.5921\n",
  5274.       "Epoch 38/150\n",
  5275.       "252/252 [==============================] - 0s 64us/step - loss: 2.2519 - acc: 0.5476 - val_loss: 0.5393 - val_acc: 0.7500\n",
  5276.       "Epoch 39/150\n",
  5277.       "252/252 [==============================] - 0s 41us/step - loss: 2.1048 - acc: 0.5873 - val_loss: 0.6771 - val_acc: 0.6579\n",
  5278.       "Epoch 40/150\n",
  5279.       "252/252 [==============================] - 0s 64us/step - loss: 1.6489 - acc: 0.6310 - val_loss: 0.6094 - val_acc: 0.6447\n",
  5280.       "Epoch 41/150\n",
  5281.       "252/252 [==============================] - 0s 85us/step - loss: 1.9634 - acc: 0.5595 - val_loss: 0.7260 - val_acc: 0.5658\n",
  5282.       "Epoch 42/150\n",
  5283.       "252/252 [==============================] - 0s 34us/step - loss: 1.6733 - acc: 0.6111 - val_loss: 0.5984 - val_acc: 0.6316\n",
  5284.       "Epoch 43/150\n",
  5285.       "252/252 [==============================] - 0s 40us/step - loss: 1.7568 - acc: 0.5556 - val_loss: 0.5476 - val_acc: 0.7105\n",
  5286.       "Epoch 44/150\n",
  5287.       "252/252 [==============================] - 0s 54us/step - loss: 1.7179 - acc: 0.5278 - val_loss: 0.5730 - val_acc: 0.6974\n",
  5288.       "Epoch 45/150\n",
  5289.       "252/252 [==============================] - 0s 104us/step - loss: 1.4594 - acc: 0.6151 - val_loss: 0.5418 - val_acc: 0.7368\n",
  5290.       "Epoch 46/150\n",
  5291.       "252/252 [==============================] - 0s 45us/step - loss: 1.5521 - acc: 0.5913 - val_loss: 0.5764 - val_acc: 0.6711\n",
  5292.       "Epoch 47/150\n",
  5293.       "252/252 [==============================] - 0s 75us/step - loss: 1.3250 - acc: 0.5635 - val_loss: 0.5462 - val_acc: 0.7500\n",
  5294.       "Epoch 48/150\n",
  5295.       "252/252 [==============================] - 0s 141us/step - loss: 1.3410 - acc: 0.5833 - val_loss: 0.5754 - val_acc: 0.6842\n",
  5296.       "Epoch 49/150\n",
  5297.       "252/252 [==============================] - 0s 68us/step - loss: 1.0250 - acc: 0.6151 - val_loss: 0.6550 - val_acc: 0.5526\n",
  5298.       "Epoch 50/150\n",
  5299.       "252/252 [==============================] - 0s 74us/step - loss: 1.3762 - acc: 0.5397 - val_loss: 0.5850 - val_acc: 0.7105\n",
  5300.       "Epoch 51/150\n",
  5301.       "252/252 [==============================] - 0s 39us/step - loss: 1.5653 - acc: 0.5397 - val_loss: 0.5915 - val_acc: 0.7105\n",
  5302.       "Epoch 52/150\n",
  5303.       "252/252 [==============================] - 0s 34us/step - loss: 1.1430 - acc: 0.5873 - val_loss: 0.6567 - val_acc: 0.6053\n",
  5304.       "Epoch 53/150\n",
  5305.       "252/252 [==============================] - 0s 118us/step - loss: 1.4155 - acc: 0.5397 - val_loss: 0.6150 - val_acc: 0.6711\n",
  5306.       "Epoch 54/150\n",
  5307.       "252/252 [==============================] - 0s 39us/step - loss: 1.1519 - acc: 0.5754 - val_loss: 0.6088 - val_acc: 0.6711\n",
  5308.       "Epoch 55/150\n",
  5309.       "252/252 [==============================] - 0s 37us/step - loss: 1.0338 - acc: 0.5754 - val_loss: 0.6058 - val_acc: 0.6842\n",
  5310.       "Epoch 56/150\n",
  5311.       "252/252 [==============================] - 0s 80us/step - loss: 1.1220 - acc: 0.5635 - val_loss: 0.6033 - val_acc: 0.7237\n",
  5312.       "Epoch 57/150\n",
  5313.       "252/252 [==============================] - 0s 44us/step - loss: 1.1087 - acc: 0.5556 - val_loss: 0.6252 - val_acc: 0.6447\n",
  5314.       "Epoch 58/150\n",
  5315.       "252/252 [==============================] - 0s 65us/step - loss: 0.9753 - acc: 0.5833 - val_loss: 0.6342 - val_acc: 0.6316\n",
  5316.       "Epoch 59/150\n",
  5317.       "252/252 [==============================] - 0s 41us/step - loss: 0.9100 - acc: 0.6151 - val_loss: 0.6339 - val_acc: 0.6579\n",
  5318.       "Epoch 60/150\n",
  5319.       "252/252 [==============================] - 0s 46us/step - loss: 1.1550 - acc: 0.4921 - val_loss: 0.6357 - val_acc: 0.6053\n",
  5320.       "Epoch 61/150\n",
  5321.       "252/252 [==============================] - 0s 50us/step - loss: 0.9439 - acc: 0.6190 - val_loss: 0.6379 - val_acc: 0.6842\n",
  5322.       "Epoch 62/150\n",
  5323.       "252/252 [==============================] - 0s 46us/step - loss: 0.9031 - acc: 0.5833 - val_loss: 0.6247 - val_acc: 0.5921\n",
  5324.       "Epoch 63/150\n",
  5325.       "252/252 [==============================] - 0s 38us/step - loss: 0.9493 - acc: 0.5714 - val_loss: 0.6215 - val_acc: 0.6184\n",
  5326.       "Epoch 64/150\n",
  5327.       "252/252 [==============================] - 0s 38us/step - loss: 0.7862 - acc: 0.6468 - val_loss: 0.6229 - val_acc: 0.6974\n",
  5328.       "Epoch 65/150\n",
  5329.       "252/252 [==============================] - 0s 47us/step - loss: 0.8136 - acc: 0.5833 - val_loss: 0.6229 - val_acc: 0.7237\n",
  5330.       "Epoch 66/150\n",
  5331.       "252/252 [==============================] - 0s 103us/step - loss: 0.8665 - acc: 0.5437 - val_loss: 0.6448 - val_acc: 0.5526\n",
  5332.       "Epoch 67/150\n",
  5333.       "252/252 [==============================] - 0s 58us/step - loss: 0.8324 - acc: 0.6151 - val_loss: 0.6294 - val_acc: 0.6447\n",
  5334.       "Epoch 68/150\n",
  5335.       "252/252 [==============================] - 0s 86us/step - loss: 0.8515 - acc: 0.6111 - val_loss: 0.6431 - val_acc: 0.6579\n",
  5336.       "Epoch 69/150\n",
  5337.       "252/252 [==============================] - 0s 92us/step - loss: 0.8734 - acc: 0.5714 - val_loss: 0.6375 - val_acc: 0.7895\n",
  5338.       "Epoch 70/150\n",
  5339.       "252/252 [==============================] - 0s 49us/step - loss: 0.7698 - acc: 0.6190 - val_loss: 0.6156 - val_acc: 0.7237\n",
  5340.       "Epoch 71/150\n",
  5341.       "252/252 [==============================] - 0s 87us/step - loss: 0.9139 - acc: 0.5476 - val_loss: 0.6275 - val_acc: 0.5921\n",
  5342.       "Epoch 72/150\n",
  5343.       "252/252 [==============================] - 0s 75us/step - loss: 0.8369 - acc: 0.6270 - val_loss: 0.6228 - val_acc: 0.7500\n",
  5344.       "Epoch 73/150\n",
  5345.       "252/252 [==============================] - 0s 42us/step - loss: 0.7770 - acc: 0.6190 - val_loss: 0.6259 - val_acc: 0.6316\n",
  5346.       "Epoch 74/150\n",
  5347.       "252/252 [==============================] - 0s 106us/step - loss: 0.7126 - acc: 0.6151 - val_loss: 0.6096 - val_acc: 0.6842\n",
  5348.       "Epoch 75/150\n",
  5349.       "252/252 [==============================] - 0s 36us/step - loss: 0.7686 - acc: 0.6230 - val_loss: 0.6155 - val_acc: 0.7895\n",
  5350.       "Epoch 76/150\n",
  5351.       "252/252 [==============================] - 0s 32us/step - loss: 0.7445 - acc: 0.6032 - val_loss: 0.6246 - val_acc: 0.7105\n",
  5352.       "Epoch 77/150\n",
  5353.       "252/252 [==============================] - 0s 39us/step - loss: 0.7536 - acc: 0.6032 - val_loss: 0.6407 - val_acc: 0.6316\n",
  5354.       "Epoch 78/150\n",
  5355.       "252/252 [==============================] - 0s 56us/step - loss: 0.6960 - acc: 0.5992 - val_loss: 0.6407 - val_acc: 0.7105\n",
  5356.       "Epoch 79/150\n",
  5357.       "252/252 [==============================] - 0s 49us/step - loss: 0.6648 - acc: 0.6865 - val_loss: 0.6388 - val_acc: 0.6316\n",
  5358.       "Epoch 80/150\n",
  5359.       "252/252 [==============================] - 0s 35us/step - loss: 0.6990 - acc: 0.6032 - val_loss: 0.6268 - val_acc: 0.6711\n",
  5360.       "Epoch 81/150\n",
  5361.       "252/252 [==============================] - 0s 54us/step - loss: 0.7754 - acc: 0.5714 - val_loss: 0.6341 - val_acc: 0.7632\n",
  5362.       "Epoch 82/150\n",
  5363.       "252/252 [==============================] - 0s 35us/step - loss: 0.7079 - acc: 0.5873 - val_loss: 0.6339 - val_acc: 0.8158\n",
  5364.       "Epoch 83/150\n",
  5365.       "252/252 [==============================] - 0s 80us/step - loss: 0.6539 - acc: 0.6468 - val_loss: 0.6178 - val_acc: 0.8026\n",
  5366.       "Epoch 84/150\n",
  5367.       "252/252 [==============================] - 0s 47us/step - loss: 0.6619 - acc: 0.6508 - val_loss: 0.6118 - val_acc: 0.6974\n",
  5368.       "Epoch 85/150\n",
  5369.       "252/252 [==============================] - 0s 40us/step - loss: 0.7295 - acc: 0.6587 - val_loss: 0.6149 - val_acc: 0.7632\n",
  5370.       "Epoch 86/150\n",
  5371.       "252/252 [==============================] - 0s 38us/step - loss: 0.6609 - acc: 0.6071 - val_loss: 0.5964 - val_acc: 0.8158\n",
  5372.       "Epoch 87/150\n",
  5373.       "252/252 [==============================] - 0s 37us/step - loss: 0.6277 - acc: 0.6349 - val_loss: 0.6082 - val_acc: 0.6316\n",
  5374.       "Epoch 88/150\n",
  5375.       "252/252 [==============================] - 0s 73us/step - loss: 0.6354 - acc: 0.6746 - val_loss: 0.6148 - val_acc: 0.6184\n",
  5376.       "Epoch 89/150\n",
  5377.       "252/252 [==============================] - 0s 38us/step - loss: 0.7100 - acc: 0.6310 - val_loss: 0.6125 - val_acc: 0.7763\n",
  5378.       "Epoch 90/150\n",
  5379.       "252/252 [==============================] - 0s 32us/step - loss: 0.6774 - acc: 0.6389 - val_loss: 0.6116 - val_acc: 0.6974\n",
  5380.       "Epoch 91/150\n",
  5381.       "252/252 [==============================] - 0s 34us/step - loss: 0.6433 - acc: 0.6825 - val_loss: 0.6223 - val_acc: 0.7237\n",
  5382.       "Epoch 92/150\n",
  5383.       "252/252 [==============================] - 0s 70us/step - loss: 0.6724 - acc: 0.6349 - val_loss: 0.5994 - val_acc: 0.8289\n",
  5384.       "Epoch 93/150\n",
  5385.       "252/252 [==============================] - 0s 33us/step - loss: 0.6759 - acc: 0.6667 - val_loss: 0.6137 - val_acc: 0.6316\n",
  5386.       "Epoch 94/150\n",
  5387.       "252/252 [==============================] - 0s 71us/step - loss: 0.6441 - acc: 0.6905 - val_loss: 0.6243 - val_acc: 0.6579\n",
  5388.       "Epoch 95/150\n",
  5389.       "252/252 [==============================] - 0s 97us/step - loss: 0.7153 - acc: 0.6270 - val_loss: 0.5872 - val_acc: 0.8158\n",
  5390.       "Epoch 96/150\n",
  5391.       "252/252 [==============================] - 0s 60us/step - loss: 0.6536 - acc: 0.6627 - val_loss: 0.5837 - val_acc: 0.8026\n",
  5392.       "Epoch 97/150\n",
  5393.       "252/252 [==============================] - 0s 75us/step - loss: 0.6450 - acc: 0.6587 - val_loss: 0.5669 - val_acc: 0.7895\n",
  5394.       "Epoch 98/150\n",
  5395.       "252/252 [==============================] - 0s 153us/step - loss: 0.6079 - acc: 0.6587 - val_loss: 0.5582 - val_acc: 0.7895\n",
  5396.       "Epoch 99/150\n",
  5397.       "252/252 [==============================] - 0s 151us/step - loss: 0.6114 - acc: 0.6825 - val_loss: 0.5570 - val_acc: 0.8026\n",
  5398.       "Epoch 100/150\n",
  5399.       "252/252 [==============================] - 0s 46us/step - loss: 0.6566 - acc: 0.6667 - val_loss: 0.5603 - val_acc: 0.8026\n",
  5400.       "Epoch 101/150\n",
  5401.       "252/252 [==============================] - 0s 72us/step - loss: 0.6188 - acc: 0.6310 - val_loss: 0.5606 - val_acc: 0.7237\n",
  5402.       "Epoch 102/150\n",
  5403.       "252/252 [==============================] - 0s 120us/step - loss: 0.6386 - acc: 0.6270 - val_loss: 0.5558 - val_acc: 0.8158\n",
  5404.       "Epoch 103/150\n",
  5405.       "252/252 [==============================] - 0s 75us/step - loss: 0.6659 - acc: 0.6627 - val_loss: 0.5698 - val_acc: 0.8289\n",
  5406.       "Epoch 104/150\n",
  5407.       "252/252 [==============================] - 0s 53us/step - loss: 0.6350 - acc: 0.6468 - val_loss: 0.5708 - val_acc: 0.7500\n",
  5408.       "Epoch 105/150\n",
  5409.       "252/252 [==============================] - 0s 98us/step - loss: 0.6030 - acc: 0.6627 - val_loss: 0.5388 - val_acc: 0.7895\n",
  5410.       "Epoch 106/150\n",
  5411.       "252/252 [==============================] - 0s 48us/step - loss: 0.6216 - acc: 0.6746 - val_loss: 0.5353 - val_acc: 0.8553\n",
  5412.       "Epoch 107/150\n",
  5413.       "252/252 [==============================] - 0s 111us/step - loss: 0.5624 - acc: 0.7063 - val_loss: 0.5235 - val_acc: 0.8158\n",
  5414.       "Epoch 108/150\n",
  5415.       "252/252 [==============================] - 0s 43us/step - loss: 0.5606 - acc: 0.7341 - val_loss: 0.5194 - val_acc: 0.8289\n",
  5416.       "Epoch 109/150\n",
  5417.       "252/252 [==============================] - 0s 41us/step - loss: 0.6544 - acc: 0.6786 - val_loss: 0.5108 - val_acc: 0.7895\n",
  5418.       "Epoch 110/150\n",
  5419.       "252/252 [==============================] - 0s 43us/step - loss: 0.5783 - acc: 0.7063 - val_loss: 0.5268 - val_acc: 0.7500\n",
  5420.       "Epoch 111/150\n",
  5421.       "252/252 [==============================] - 0s 44us/step - loss: 0.5963 - acc: 0.7024 - val_loss: 0.5141 - val_acc: 0.7632\n",
  5422.       "Epoch 112/150\n",
  5423.       "252/252 [==============================] - 0s 96us/step - loss: 0.5876 - acc: 0.7183 - val_loss: 0.4892 - val_acc: 0.8158\n",
  5424.       "Epoch 113/150\n",
  5425.       "252/252 [==============================] - 0s 48us/step - loss: 0.5961 - acc: 0.6944 - val_loss: 0.4954 - val_acc: 0.8289\n",
  5426.       "Epoch 114/150\n",
  5427.       "252/252 [==============================] - 0s 84us/step - loss: 0.4928 - acc: 0.7619 - val_loss: 0.4872 - val_acc: 0.7500\n",
  5428.       "Epoch 115/150\n",
  5429.       "252/252 [==============================] - 0s 90us/step - loss: 0.5670 - acc: 0.7341 - val_loss: 0.4910 - val_acc: 0.7763\n",
  5430.       "Epoch 116/150\n",
  5431.       "252/252 [==============================] - 0s 143us/step - loss: 0.5497 - acc: 0.7143 - val_loss: 0.4890 - val_acc: 0.7763\n",
  5432.       "Epoch 117/150\n",
  5433.       "252/252 [==============================] - 0s 45us/step - loss: 0.5312 - acc: 0.7341 - val_loss: 0.5049 - val_acc: 0.7763\n",
  5434.       "Epoch 118/150\n",
  5435.       "252/252 [==============================] - 0s 45us/step - loss: 0.5427 - acc: 0.7143 - val_loss: 0.4847 - val_acc: 0.7763\n",
  5436.       "Epoch 119/150\n",
  5437.       "252/252 [==============================] - 0s 70us/step - loss: 0.5105 - acc: 0.7381 - val_loss: 0.4860 - val_acc: 0.7763\n",
  5438.       "Epoch 120/150\n",
  5439.       "252/252 [==============================] - 0s 53us/step - loss: 0.6040 - acc: 0.6905 - val_loss: 0.4878 - val_acc: 0.7763\n",
  5440.       "Epoch 121/150\n",
  5441.       "252/252 [==============================] - 0s 90us/step - loss: 0.5060 - acc: 0.7381 - val_loss: 0.4629 - val_acc: 0.8553\n",
  5442.       "Epoch 122/150\n",
  5443.       "252/252 [==============================] - 0s 70us/step - loss: 0.5498 - acc: 0.7381 - val_loss: 0.4618 - val_acc: 0.7895\n",
  5444.       "Epoch 123/150\n",
  5445.       "252/252 [==============================] - 0s 104us/step - loss: 0.5388 - acc: 0.7341 - val_loss: 0.4689 - val_acc: 0.7895\n",
  5446.       "Epoch 124/150\n",
  5447.       "252/252 [==============================] - 0s 52us/step - loss: 0.5230 - acc: 0.7579 - val_loss: 0.4606 - val_acc: 0.7895\n",
  5448.       "Epoch 125/150\n",
  5449.       "252/252 [==============================] - 0s 43us/step - loss: 0.4991 - acc: 0.7659 - val_loss: 0.4597 - val_acc: 0.8026\n",
  5450.       "Epoch 126/150\n",
  5451.       "252/252 [==============================] - 0s 92us/step - loss: 0.5061 - acc: 0.7381 - val_loss: 0.4323 - val_acc: 0.8553\n",
  5452.       "Epoch 127/150\n",
  5453.       "252/252 [==============================] - 0s 48us/step - loss: 0.4255 - acc: 0.8175 - val_loss: 0.4236 - val_acc: 0.8553\n",
  5454.       "Epoch 128/150\n",
  5455.       "252/252 [==============================] - 0s 33us/step - loss: 0.5343 - acc: 0.7500 - val_loss: 0.4438 - val_acc: 0.8158\n",
  5456.       "Epoch 129/150\n",
  5457.       "252/252 [==============================] - 0s 62us/step - loss: 0.5068 - acc: 0.7341 - val_loss: 0.5004 - val_acc: 0.7237\n",
  5458.       "Epoch 130/150\n",
  5459.       "252/252 [==============================] - 0s 52us/step - loss: 0.5025 - acc: 0.7817 - val_loss: 0.4200 - val_acc: 0.8421\n",
  5460.       "Epoch 131/150\n",
  5461.       "252/252 [==============================] - 0s 58us/step - loss: 0.4708 - acc: 0.7937 - val_loss: 0.4177 - val_acc: 0.8421\n",
  5462.       "Epoch 132/150\n",
  5463.       "252/252 [==============================] - 0s 45us/step - loss: 0.5135 - acc: 0.7579 - val_loss: 0.4119 - val_acc: 0.8421\n",
  5464.       "Epoch 133/150\n",
  5465.       "252/252 [==============================] - 0s 68us/step - loss: 0.4513 - acc: 0.8056 - val_loss: 0.4185 - val_acc: 0.8421\n",
  5466.       "Epoch 134/150\n",
  5467.       "252/252 [==============================] - 0s 41us/step - loss: 0.4817 - acc: 0.7619 - val_loss: 0.4254 - val_acc: 0.7763\n",
  5468.       "Epoch 135/150\n",
  5469.       "252/252 [==============================] - 0s 71us/step - loss: 0.4857 - acc: 0.7698 - val_loss: 0.4009 - val_acc: 0.8553\n",
  5470.       "Epoch 136/150\n",
  5471.       "252/252 [==============================] - 0s 68us/step - loss: 0.4371 - acc: 0.8254 - val_loss: 0.4044 - val_acc: 0.8421\n",
  5472.       "Epoch 137/150\n",
  5473.       "252/252 [==============================] - 0s 122us/step - loss: 0.4386 - acc: 0.7976 - val_loss: 0.3999 - val_acc: 0.8553\n",
  5474.       "Epoch 138/150\n",
  5475.       "252/252 [==============================] - 0s 44us/step - loss: 0.4814 - acc: 0.7778 - val_loss: 0.4582 - val_acc: 0.7763\n",
  5476.       "Epoch 139/150\n",
  5477.       "252/252 [==============================] - 0s 57us/step - loss: 0.4360 - acc: 0.8095 - val_loss: 0.4029 - val_acc: 0.8421\n",
  5478.       "Epoch 140/150\n",
  5479.       "252/252 [==============================] - 0s 36us/step - loss: 0.3902 - acc: 0.8492 - val_loss: 0.4219 - val_acc: 0.8158\n",
  5480.       "Epoch 141/150\n",
  5481.       "252/252 [==============================] - 0s 72us/step - loss: 0.4460 - acc: 0.8016 - val_loss: 0.3906 - val_acc: 0.8553\n",
  5482.       "Epoch 142/150\n",
  5483.       "252/252 [==============================] - 0s 45us/step - loss: 0.3792 - acc: 0.8373 - val_loss: 0.3923 - val_acc: 0.8553\n",
  5484.       "Epoch 143/150\n",
  5485.       "252/252 [==============================] - 0s 80us/step - loss: 0.4590 - acc: 0.7937 - val_loss: 0.3829 - val_acc: 0.8553\n",
  5486.       "Epoch 144/150\n",
  5487.       "252/252 [==============================] - 0s 40us/step - loss: 0.4379 - acc: 0.8016 - val_loss: 0.3757 - val_acc: 0.8421\n",
  5488.       "Epoch 145/150\n",
  5489.       "252/252 [==============================] - 0s 48us/step - loss: 0.4251 - acc: 0.8056 - val_loss: 0.3948 - val_acc: 0.8158\n",
  5490.       "Epoch 146/150\n",
  5491.       "252/252 [==============================] - 0s 80us/step - loss: 0.4386 - acc: 0.7976 - val_loss: 0.3880 - val_acc: 0.8553\n",
  5492.       "Epoch 147/150\n",
  5493.       "252/252 [==============================] - 0s 69us/step - loss: 0.3581 - acc: 0.8492 - val_loss: 0.3723 - val_acc: 0.8421\n",
  5494.       "Epoch 148/150\n",
  5495.       "252/252 [==============================] - 0s 39us/step - loss: 0.4551 - acc: 0.7937 - val_loss: 0.4038 - val_acc: 0.7895\n",
  5496.       "Epoch 149/150\n",
  5497.       "252/252 [==============================] - 0s 41us/step - loss: 0.4816 - acc: 0.7817 - val_loss: 0.3829 - val_acc: 0.8553\n",
  5498.       "Epoch 150/150\n",
  5499.       "252/252 [==============================] - 0s 42us/step - loss: 0.4301 - acc: 0.8016 - val_loss: 0.3773 - val_acc: 0.8684\n"
  5500.      ]
  5501.     }
  5502.    ],
  5503.    "source": [
  5504.     "# And now fitting \n",
  5505.     "\n",
  5506.     "batch_size = 128  # mini-batch with 128 examples\n",
  5507.     "epochs = 150\n",
  5508.     "history = model_1.fit(\n",
  5509.     "    x1, y1,\n",
  5510.     "    batch_size=batch_size,\n",
  5511.     "    epochs=epochs,\n",
  5512.     "    verbose=1,\n",
  5513.     "    validation_data=(x2, y2))"
  5514.    ]
  5515.   },
  5516.   {
  5517.    "cell_type": "code",
  5518.    "execution_count": 304,
  5519.    "metadata": {},
  5520.    "outputs": [
  5521.     {
  5522.      "name": "stdout",
  5523.      "output_type": "stream",
  5524.      "text": [
  5525.       "Test loss: 0.3773496378409235\n",
  5526.       "Test accuracy: 0.868421052631579\n"
  5527.      ]
  5528.     }
  5529.    ],
  5530.    "source": [
  5531.     "score = model_1.evaluate(x2, y2, verbose=0)\n",
  5532.     "print('Test loss:', score[0])\n",
  5533.     "print('Test accuracy:', score[1])"
  5534.    ]
  5535.   },
  5536.   {
  5537.    "cell_type": "code",
  5538.    "execution_count": 305,
  5539.    "metadata": {},
  5540.    "outputs": [],
  5541.    "source": [
  5542.     "test_original['my_prediction']=y_pred_class_rf\n",
  5543.     "test_original['likelihood_winning']=y_pred_prob_rf[:,1]"
  5544.    ]
  5545.   },
  5546.   {
  5547.    "cell_type": "code",
  5548.    "execution_count": 306,
  5549.    "metadata": {},
  5550.    "outputs": [
  5551.     {
  5552.      "data": {
  5553.       "text/html": [
  5554.        "<div>\n",
  5555.        "<style scoped>\n",
  5556.        "    .dataframe tbody tr th:only-of-type {\n",
  5557.        "        vertical-align: middle;\n",
  5558.        "    }\n",
  5559.        "\n",
  5560.        "    .dataframe tbody tr th {\n",
  5561.        "        vertical-align: top;\n",
  5562.        "    }\n",
  5563.        "\n",
  5564.        "    .dataframe thead th {\n",
  5565.        "        text-align: right;\n",
  5566.        "    }\n",
  5567.        "</style>\n",
  5568.        "<table border=\"1\" class=\"dataframe\">\n",
  5569.        "  <thead>\n",
  5570.        "    <tr style=\"text-align: right;\">\n",
  5571.        "      <th></th>\n",
  5572.        "      <th>Game ID</th>\n",
  5573.        "      <th>Team 1</th>\n",
  5574.        "      <th>Team 2</th>\n",
  5575.        "      <th>CityOfGame</th>\n",
  5576.        "      <th>Day</th>\n",
  5577.        "      <th>DateOfGame</th>\n",
  5578.        "      <th>TimeOfGame</th>\n",
  5579.        "      <th>AvgWindSpeed</th>\n",
  5580.        "      <th>AvgHumidity</th>\n",
  5581.        "      <th>Inn 1 Team 1 NOP R>25,SR>125</th>\n",
  5582.        "      <th>...</th>\n",
  5583.        "      <th>Inn 2 Team 2 Total 6s</th>\n",
  5584.        "      <th>Inn 2 Team 2 Max Strike Rate_ALLBatsmen</th>\n",
  5585.        "      <th>Inn 2 Team 1 NoP fast bowlers</th>\n",
  5586.        "      <th>Inn 2 Team 1 NoP Spinners</th>\n",
  5587.        "      <th>Inn 2 Team 1 wickets taken_catches_runout</th>\n",
  5588.        "      <th>Inn2 Team 1 wickets taken_ bowled _lbw_caught by keeper_stumping</th>\n",
  5589.        "      <th>Inn 2 Team 1 Extras conceded in_wides_No Balls</th>\n",
  5590.        "      <th>Winner (team 1=1, team 2=0)</th>\n",
  5591.        "      <th>my_prediction</th>\n",
  5592.        "      <th>likelihood_winning</th>\n",
  5593.        "    </tr>\n",
  5594.        "  </thead>\n",
  5595.        "  <tbody>\n",
  5596.        "    <tr>\n",
  5597.        "      <th>0</th>\n",
  5598.        "      <td>253</td>\n",
  5599.        "      <td>Electronic City Power Savers</td>\n",
  5600.        "      <td>Marathalli Chokers</td>\n",
  5601.        "      <td>Electronic City</td>\n",
  5602.        "      <td>6</td>\n",
  5603.        "      <td>01-01-2016</td>\n",
  5604.        "      <td>20:00:00</td>\n",
  5605.        "      <td>5</td>\n",
  5606.        "      <td>0.62</td>\n",
  5607.        "      <td>1</td>\n",
  5608.        "      <td>...</td>\n",
  5609.        "      <td>5</td>\n",
  5610.        "      <td>142.85</td>\n",
  5611.        "      <td>3</td>\n",
  5612.        "      <td>3</td>\n",
  5613.        "      <td>1</td>\n",
  5614.        "      <td>1</td>\n",
  5615.        "      <td>3</td>\n",
  5616.        "      <td>0</td>\n",
  5617.        "      <td>0</td>\n",
  5618.        "      <td>0.085</td>\n",
  5619.        "    </tr>\n",
  5620.        "    <tr>\n",
  5621.        "      <th>1</th>\n",
  5622.        "      <td>254</td>\n",
  5623.        "      <td>Koramangala Traffic Jammers</td>\n",
  5624.        "      <td>Sarjapur Water Tankers</td>\n",
  5625.        "      <td>Koramangala</td>\n",
  5626.        "      <td>7</td>\n",
  5627.        "      <td>01-02-2016</td>\n",
  5628.        "      <td>20:00:00</td>\n",
  5629.        "      <td>6</td>\n",
  5630.        "      <td>0.66</td>\n",
  5631.        "      <td>1</td>\n",
  5632.        "      <td>...</td>\n",
  5633.        "      <td>4</td>\n",
  5634.        "      <td>210.00</td>\n",
  5635.        "      <td>3</td>\n",
  5636.        "      <td>2</td>\n",
  5637.        "      <td>1</td>\n",
  5638.        "      <td>1</td>\n",
  5639.        "      <td>1</td>\n",
  5640.        "      <td>0</td>\n",
  5641.        "      <td>0</td>\n",
  5642.        "      <td>0.110</td>\n",
  5643.        "    </tr>\n",
  5644.        "    <tr>\n",
  5645.        "      <th>2</th>\n",
  5646.        "      <td>255</td>\n",
  5647.        "      <td>HSR High Rent Payers</td>\n",
  5648.        "      <td>Marathalli Chokers</td>\n",
  5649.        "      <td>Marathalli</td>\n",
  5650.        "      <td>1</td>\n",
  5651.        "      <td>01-03-2016</td>\n",
  5652.        "      <td>16:00:00</td>\n",
  5653.        "      <td>5</td>\n",
  5654.        "      <td>0.64</td>\n",
  5655.        "      <td>0</td>\n",
  5656.        "      <td>...</td>\n",
  5657.        "      <td>1</td>\n",
  5658.        "      <td>166.66</td>\n",
  5659.        "      <td>4</td>\n",
  5660.        "      <td>2</td>\n",
  5661.        "      <td>2</td>\n",
  5662.        "      <td>7</td>\n",
  5663.        "      <td>4</td>\n",
  5664.        "      <td>1</td>\n",
  5665.        "      <td>0</td>\n",
  5666.        "      <td>0.435</td>\n",
  5667.        "    </tr>\n",
  5668.        "    <tr>\n",
  5669.        "      <th>3</th>\n",
  5670.        "      <td>256</td>\n",
  5671.        "      <td>Indranagar Pub Watchers</td>\n",
  5672.        "      <td>Silkboard Slow Movers</td>\n",
  5673.        "      <td>Indranagar</td>\n",
  5674.        "      <td>2</td>\n",
  5675.        "      <td>01-04-2016</td>\n",
  5676.        "      <td>20:00:00</td>\n",
  5677.        "      <td>5</td>\n",
  5678.        "      <td>0.64</td>\n",
  5679.        "      <td>1</td>\n",
  5680.        "      <td>...</td>\n",
  5681.        "      <td>4</td>\n",
  5682.        "      <td>166.66</td>\n",
  5683.        "      <td>2</td>\n",
  5684.        "      <td>4</td>\n",
  5685.        "      <td>6</td>\n",
  5686.        "      <td>3</td>\n",
  5687.        "      <td>2</td>\n",
  5688.        "      <td>1</td>\n",
  5689.        "      <td>1</td>\n",
  5690.        "      <td>0.795</td>\n",
  5691.        "    </tr>\n",
  5692.        "    <tr>\n",
  5693.        "      <th>4</th>\n",
  5694.        "      <td>257</td>\n",
  5695.        "      <td>Whitefield Water Loggers</td>\n",
  5696.        "      <td>Sarjapur Water Tankers</td>\n",
  5697.        "      <td>Whitefield</td>\n",
  5698.        "      <td>3</td>\n",
  5699.        "      <td>01-05-2016</td>\n",
  5700.        "      <td>16:00:00</td>\n",
  5701.        "      <td>5</td>\n",
  5702.        "      <td>0.62</td>\n",
  5703.        "      <td>2</td>\n",
  5704.        "      <td>...</td>\n",
  5705.        "      <td>2</td>\n",
  5706.        "      <td>160.00</td>\n",
  5707.        "      <td>4</td>\n",
  5708.        "      <td>2</td>\n",
  5709.        "      <td>6</td>\n",
  5710.        "      <td>1</td>\n",
  5711.        "      <td>2</td>\n",
  5712.        "      <td>1</td>\n",
  5713.        "      <td>1</td>\n",
  5714.        "      <td>0.670</td>\n",
  5715.        "    </tr>\n",
  5716.        "    <tr>\n",
  5717.        "      <th>5</th>\n",
  5718.        "      <td>258</td>\n",
  5719.        "      <td>Electronic City Power Savers</td>\n",
  5720.        "      <td>Bellandur Froth Fighters</td>\n",
  5721.        "      <td>Bellandur</td>\n",
  5722.        "      <td>4</td>\n",
  5723.        "      <td>01-06-2016</td>\n",
  5724.        "      <td>20:00:00</td>\n",
  5725.        "      <td>5</td>\n",
  5726.        "      <td>0.62</td>\n",
  5727.        "      <td>3</td>\n",
  5728.        "      <td>...</td>\n",
  5729.        "      <td>4</td>\n",
  5730.        "      <td>187.50</td>\n",
  5731.        "      <td>3</td>\n",
  5732.        "      <td>4</td>\n",
  5733.        "      <td>5</td>\n",
  5734.        "      <td>5</td>\n",
  5735.        "      <td>3</td>\n",
  5736.        "      <td>1</td>\n",
  5737.        "      <td>1</td>\n",
  5738.        "      <td>0.835</td>\n",
  5739.        "    </tr>\n",
  5740.        "    <tr>\n",
  5741.        "      <th>6</th>\n",
  5742.        "      <td>259</td>\n",
  5743.        "      <td>Indranagar Pub Watchers</td>\n",
  5744.        "      <td>Koramangala Traffic Jammers</td>\n",
  5745.        "      <td>Indranagar</td>\n",
  5746.        "      <td>5</td>\n",
  5747.        "      <td>01-07-2016</td>\n",
  5748.        "      <td>16:00:00</td>\n",
  5749.        "      <td>5</td>\n",
  5750.        "      <td>0.60</td>\n",
  5751.        "      <td>2</td>\n",
  5752.        "      <td>...</td>\n",
  5753.        "      <td>5</td>\n",
  5754.        "      <td>227.27</td>\n",
  5755.        "      <td>2</td>\n",
  5756.        "      <td>3</td>\n",
  5757.        "      <td>4</td>\n",
  5758.        "      <td>6</td>\n",
  5759.        "      <td>5</td>\n",
  5760.        "      <td>1</td>\n",
  5761.        "      <td>1</td>\n",
  5762.        "      <td>0.850</td>\n",
  5763.        "    </tr>\n",
  5764.        "    <tr>\n",
  5765.        "      <th>7</th>\n",
  5766.        "      <td>260</td>\n",
  5767.        "      <td>HSR High Rent Payers</td>\n",
  5768.        "      <td>Silkboard Slow Movers</td>\n",
  5769.        "      <td>HSR</td>\n",
  5770.        "      <td>6</td>\n",
  5771.        "      <td>01-08-2016</td>\n",
  5772.        "      <td>20:00:00</td>\n",
  5773.        "      <td>5</td>\n",
  5774.        "      <td>0.60</td>\n",
  5775.        "      <td>0</td>\n",
  5776.        "      <td>...</td>\n",
  5777.        "      <td>4</td>\n",
  5778.        "      <td>200.00</td>\n",
  5779.        "      <td>4</td>\n",
  5780.        "      <td>2</td>\n",
  5781.        "      <td>6</td>\n",
  5782.        "      <td>2</td>\n",
  5783.        "      <td>5</td>\n",
  5784.        "      <td>1</td>\n",
  5785.        "      <td>1</td>\n",
  5786.        "      <td>0.710</td>\n",
  5787.        "    </tr>\n",
  5788.        "    <tr>\n",
  5789.        "      <th>8</th>\n",
  5790.        "      <td>261</td>\n",
  5791.        "      <td>Bellandur Froth Fighters</td>\n",
  5792.        "      <td>Marathalli Chokers</td>\n",
  5793.        "      <td>HSR</td>\n",
  5794.        "      <td>7</td>\n",
  5795.        "      <td>01-09-2016</td>\n",
  5796.        "      <td>20:00:00</td>\n",
  5797.        "      <td>5</td>\n",
  5798.        "      <td>0.63</td>\n",
  5799.        "      <td>2</td>\n",
  5800.        "      <td>...</td>\n",
  5801.        "      <td>8</td>\n",
  5802.        "      <td>175.00</td>\n",
  5803.        "      <td>2</td>\n",
  5804.        "      <td>3</td>\n",
  5805.        "      <td>3</td>\n",
  5806.        "      <td>2</td>\n",
  5807.        "      <td>0</td>\n",
  5808.        "      <td>0</td>\n",
  5809.        "      <td>0</td>\n",
  5810.        "      <td>0.255</td>\n",
  5811.        "    </tr>\n",
  5812.        "    <tr>\n",
  5813.        "      <th>9</th>\n",
  5814.        "      <td>262</td>\n",
  5815.        "      <td>Koramangala Traffic Jammers</td>\n",
  5816.        "      <td>Whitefield Water Loggers</td>\n",
  5817.        "      <td>Whitefield</td>\n",
  5818.        "      <td>1</td>\n",
  5819.        "      <td>01-10-2016</td>\n",
  5820.        "      <td>16:00:00</td>\n",
  5821.        "      <td>5</td>\n",
  5822.        "      <td>0.64</td>\n",
  5823.        "      <td>2</td>\n",
  5824.        "      <td>...</td>\n",
  5825.        "      <td>3</td>\n",
  5826.        "      <td>166.66</td>\n",
  5827.        "      <td>4</td>\n",
  5828.        "      <td>1</td>\n",
  5829.        "      <td>6</td>\n",
  5830.        "      <td>3</td>\n",
  5831.        "      <td>8</td>\n",
  5832.        "      <td>1</td>\n",
  5833.        "      <td>1</td>\n",
  5834.        "      <td>0.865</td>\n",
  5835.        "    </tr>\n",
  5836.        "    <tr>\n",
  5837.        "      <th>10</th>\n",
  5838.        "      <td>263</td>\n",
  5839.        "      <td>Electronic City Power Savers</td>\n",
  5840.        "      <td>Sarjapur Water Tankers</td>\n",
  5841.        "      <td>Sarjapur</td>\n",
  5842.        "      <td>2</td>\n",
  5843.        "      <td>01-11-2016</td>\n",
  5844.        "      <td>20:00:00</td>\n",
  5845.        "      <td>5</td>\n",
  5846.        "      <td>0.64</td>\n",
  5847.        "      <td>0</td>\n",
  5848.        "      <td>...</td>\n",
  5849.        "      <td>3</td>\n",
  5850.        "      <td>165.38</td>\n",
  5851.        "      <td>3</td>\n",
  5852.        "      <td>3</td>\n",
  5853.        "      <td>2</td>\n",
  5854.        "      <td>0</td>\n",
  5855.        "      <td>0</td>\n",
  5856.        "      <td>0</td>\n",
  5857.        "      <td>0</td>\n",
  5858.        "      <td>0.040</td>\n",
  5859.        "    </tr>\n",
  5860.        "    <tr>\n",
  5861.        "      <th>11</th>\n",
  5862.        "      <td>264</td>\n",
  5863.        "      <td>Marathalli Chokers</td>\n",
  5864.        "      <td>Indranagar Pub Watchers</td>\n",
  5865.        "      <td>Marathalli</td>\n",
  5866.        "      <td>3</td>\n",
  5867.        "      <td>01-12-2016</td>\n",
  5868.        "      <td>20:00:00</td>\n",
  5869.        "      <td>6</td>\n",
  5870.        "      <td>0.67</td>\n",
  5871.        "      <td>3</td>\n",
  5872.        "      <td>...</td>\n",
  5873.        "      <td>10</td>\n",
  5874.        "      <td>233.33</td>\n",
  5875.        "      <td>4</td>\n",
  5876.        "      <td>2</td>\n",
  5877.        "      <td>5</td>\n",
  5878.        "      <td>5</td>\n",
  5879.        "      <td>3</td>\n",
  5880.        "      <td>1</td>\n",
  5881.        "      <td>1</td>\n",
  5882.        "      <td>0.845</td>\n",
  5883.        "    </tr>\n",
  5884.        "    <tr>\n",
  5885.        "      <th>12</th>\n",
  5886.        "      <td>265</td>\n",
  5887.        "      <td>Whitefield Water Loggers</td>\n",
  5888.        "      <td>Electronic City Power Savers</td>\n",
  5889.        "      <td>Electronic City</td>\n",
  5890.        "      <td>4</td>\n",
  5891.        "      <td>01-13-2016</td>\n",
  5892.        "      <td>16:00:00</td>\n",
  5893.        "      <td>6</td>\n",
  5894.        "      <td>0.62</td>\n",
  5895.        "      <td>2</td>\n",
  5896.        "      <td>...</td>\n",
  5897.        "      <td>11</td>\n",
  5898.        "      <td>400.00</td>\n",
  5899.        "      <td>3</td>\n",
  5900.        "      <td>2</td>\n",
  5901.        "      <td>5</td>\n",
  5902.        "      <td>0</td>\n",
  5903.        "      <td>4</td>\n",
  5904.        "      <td>0</td>\n",
  5905.        "      <td>1</td>\n",
  5906.        "      <td>0.565</td>\n",
  5907.        "    </tr>\n",
  5908.        "    <tr>\n",
  5909.        "      <th>13</th>\n",
  5910.        "      <td>266</td>\n",
  5911.        "      <td>HSR High Rent Payers</td>\n",
  5912.        "      <td>Silkboard Slow Movers</td>\n",
  5913.        "      <td>Silkboard</td>\n",
  5914.        "      <td>5</td>\n",
  5915.        "      <td>01-14-2016</td>\n",
  5916.        "      <td>20:00:00</td>\n",
  5917.        "      <td>6</td>\n",
  5918.        "      <td>0.62</td>\n",
  5919.        "      <td>0</td>\n",
  5920.        "      <td>...</td>\n",
  5921.        "      <td>1</td>\n",
  5922.        "      <td>123.52</td>\n",
  5923.        "      <td>5</td>\n",
  5924.        "      <td>1</td>\n",
  5925.        "      <td>2</td>\n",
  5926.        "      <td>1</td>\n",
  5927.        "      <td>0</td>\n",
  5928.        "      <td>0</td>\n",
  5929.        "      <td>0</td>\n",
  5930.        "      <td>0.045</td>\n",
  5931.        "    </tr>\n",
  5932.        "    <tr>\n",
  5933.        "      <th>14</th>\n",
  5934.        "      <td>267</td>\n",
  5935.        "      <td>Indranagar Pub Watchers</td>\n",
  5936.        "      <td>Koramangala Traffic Jammers</td>\n",
  5937.        "      <td>Koramangala</td>\n",
  5938.        "      <td>6</td>\n",
  5939.        "      <td>01-15-2016</td>\n",
  5940.        "      <td>20:00:00</td>\n",
  5941.        "      <td>5</td>\n",
  5942.        "      <td>0.65</td>\n",
  5943.        "      <td>0</td>\n",
  5944.        "      <td>...</td>\n",
  5945.        "      <td>3</td>\n",
  5946.        "      <td>233.33</td>\n",
  5947.        "      <td>1</td>\n",
  5948.        "      <td>5</td>\n",
  5949.        "      <td>3</td>\n",
  5950.        "      <td>2</td>\n",
  5951.        "      <td>6</td>\n",
  5952.        "      <td>0</td>\n",
  5953.        "      <td>0</td>\n",
  5954.        "      <td>0.220</td>\n",
  5955.        "    </tr>\n",
  5956.        "    <tr>\n",
  5957.        "      <th>15</th>\n",
  5958.        "      <td>268</td>\n",
  5959.        "      <td>Electronic City Power Savers</td>\n",
  5960.        "      <td>HSR High Rent Payers</td>\n",
  5961.        "      <td>HSR</td>\n",
  5962.        "      <td>7</td>\n",
  5963.        "      <td>01-16-2016</td>\n",
  5964.        "      <td>20:00:00</td>\n",
  5965.        "      <td>7</td>\n",
  5966.        "      <td>0.58</td>\n",
  5967.        "      <td>2</td>\n",
  5968.        "      <td>...</td>\n",
  5969.        "      <td>5</td>\n",
  5970.        "      <td>200.00</td>\n",
  5971.        "      <td>4</td>\n",
  5972.        "      <td>2</td>\n",
  5973.        "      <td>2</td>\n",
  5974.        "      <td>1</td>\n",
  5975.        "      <td>3</td>\n",
  5976.        "      <td>0</td>\n",
  5977.        "      <td>0</td>\n",
  5978.        "      <td>0.085</td>\n",
  5979.        "    </tr>\n",
  5980.        "    <tr>\n",
  5981.        "      <th>16</th>\n",
  5982.        "      <td>269</td>\n",
  5983.        "      <td>Silkboard Slow Movers</td>\n",
  5984.        "      <td>Koramangala Traffic Jammers</td>\n",
  5985.        "      <td>Koramangala</td>\n",
  5986.        "      <td>1</td>\n",
  5987.        "      <td>01-17-2016</td>\n",
  5988.        "      <td>16:00:00</td>\n",
  5989.        "      <td>8</td>\n",
  5990.        "      <td>0.50</td>\n",
  5991.        "      <td>0</td>\n",
  5992.        "      <td>...</td>\n",
  5993.        "      <td>2</td>\n",
  5994.        "      <td>169.23</td>\n",
  5995.        "      <td>3</td>\n",
  5996.        "      <td>2</td>\n",
  5997.        "      <td>3</td>\n",
  5998.        "      <td>4</td>\n",
  5999.        "      <td>2</td>\n",
  6000.        "      <td>1</td>\n",
  6001.        "      <td>1</td>\n",
  6002.        "      <td>0.555</td>\n",
  6003.        "    </tr>\n",
  6004.        "    <tr>\n",
  6005.        "      <th>17</th>\n",
  6006.        "      <td>270</td>\n",
  6007.        "      <td>Indranagar Pub Watchers</td>\n",
  6008.        "      <td>Whitefield Water Loggers</td>\n",
  6009.        "      <td>Whitefield</td>\n",
  6010.        "      <td>2</td>\n",
  6011.        "      <td>01-18-2016</td>\n",
  6012.        "      <td>20:00:00</td>\n",
  6013.        "      <td>8</td>\n",
  6014.        "      <td>0.50</td>\n",
  6015.        "      <td>2</td>\n",
  6016.        "      <td>...</td>\n",
  6017.        "      <td>5</td>\n",
  6018.        "      <td>175.00</td>\n",
  6019.        "      <td>2</td>\n",
  6020.        "      <td>3</td>\n",
  6021.        "      <td>4</td>\n",
  6022.        "      <td>6</td>\n",
  6023.        "      <td>2</td>\n",
  6024.        "      <td>1</td>\n",
  6025.        "      <td>1</td>\n",
  6026.        "      <td>0.865</td>\n",
  6027.        "    </tr>\n",
  6028.        "    <tr>\n",
  6029.        "      <th>18</th>\n",
  6030.        "      <td>271</td>\n",
  6031.        "      <td>Marathalli Chokers</td>\n",
  6032.        "      <td>Sarjapur Water Tankers</td>\n",
  6033.        "      <td>Marathalli</td>\n",
  6034.        "      <td>3</td>\n",
  6035.        "      <td>01-19-2016</td>\n",
  6036.        "      <td>20:00:00</td>\n",
  6037.        "      <td>7</td>\n",
  6038.        "      <td>0.52</td>\n",
  6039.        "      <td>1</td>\n",
  6040.        "      <td>...</td>\n",
  6041.        "      <td>1</td>\n",
  6042.        "      <td>112.50</td>\n",
  6043.        "      <td>4</td>\n",
  6044.        "      <td>1</td>\n",
  6045.        "      <td>3</td>\n",
  6046.        "      <td>0</td>\n",
  6047.        "      <td>6</td>\n",
  6048.        "      <td>0</td>\n",
  6049.        "      <td>0</td>\n",
  6050.        "      <td>0.135</td>\n",
  6051.        "    </tr>\n",
  6052.        "    <tr>\n",
  6053.        "      <th>19</th>\n",
  6054.        "      <td>272</td>\n",
  6055.        "      <td>Bellandur Froth Fighters</td>\n",
  6056.        "      <td>Indranagar Pub Watchers</td>\n",
  6057.        "      <td>Indranagar</td>\n",
  6058.        "      <td>4</td>\n",
  6059.        "      <td>01-20-2016</td>\n",
  6060.        "      <td>16:00:00</td>\n",
  6061.        "      <td>6</td>\n",
  6062.        "      <td>0.56</td>\n",
  6063.        "      <td>3</td>\n",
  6064.        "      <td>...</td>\n",
  6065.        "      <td>6</td>\n",
  6066.        "      <td>300.00</td>\n",
  6067.        "      <td>2</td>\n",
  6068.        "      <td>2</td>\n",
  6069.        "      <td>4</td>\n",
  6070.        "      <td>1</td>\n",
  6071.        "      <td>6</td>\n",
  6072.        "      <td>0</td>\n",
  6073.        "      <td>1</td>\n",
  6074.        "      <td>0.520</td>\n",
  6075.        "    </tr>\n",
  6076.        "    <tr>\n",
  6077.        "      <th>20</th>\n",
  6078.        "      <td>273</td>\n",
  6079.        "      <td>HSR High Rent Payers</td>\n",
  6080.        "      <td>Whitefield Water Loggers</td>\n",
  6081.        "      <td>Whitefield</td>\n",
  6082.        "      <td>5</td>\n",
  6083.        "      <td>01-21-2016</td>\n",
  6084.        "      <td>20:00:00</td>\n",
  6085.        "      <td>6</td>\n",
  6086.        "      <td>0.56</td>\n",
  6087.        "      <td>3</td>\n",
  6088.        "      <td>...</td>\n",
  6089.        "      <td>14</td>\n",
  6090.        "      <td>235.71</td>\n",
  6091.        "      <td>5</td>\n",
  6092.        "      <td>1</td>\n",
  6093.        "      <td>2</td>\n",
  6094.        "      <td>2</td>\n",
  6095.        "      <td>5</td>\n",
  6096.        "      <td>0</td>\n",
  6097.        "      <td>0</td>\n",
  6098.        "      <td>0.295</td>\n",
  6099.        "    </tr>\n",
  6100.        "    <tr>\n",
  6101.        "      <th>21</th>\n",
  6102.        "      <td>274</td>\n",
  6103.        "      <td>Silkboard Slow Movers</td>\n",
  6104.        "      <td>Koramangala Traffic Jammers</td>\n",
  6105.        "      <td>Silkboard</td>\n",
  6106.        "      <td>6</td>\n",
  6107.        "      <td>01-22-2016</td>\n",
  6108.        "      <td>20:00:00</td>\n",
  6109.        "      <td>7</td>\n",
  6110.        "      <td>0.58</td>\n",
  6111.        "      <td>1</td>\n",
  6112.        "      <td>...</td>\n",
  6113.        "      <td>3</td>\n",
  6114.        "      <td>150.00</td>\n",
  6115.        "      <td>3</td>\n",
  6116.        "      <td>2</td>\n",
  6117.        "      <td>1</td>\n",
  6118.        "      <td>1</td>\n",
  6119.        "      <td>1</td>\n",
  6120.        "      <td>0</td>\n",
  6121.        "      <td>0</td>\n",
  6122.        "      <td>0.025</td>\n",
  6123.        "    </tr>\n",
  6124.        "    <tr>\n",
  6125.        "      <th>22</th>\n",
  6126.        "      <td>275</td>\n",
  6127.        "      <td>Bellandur Froth Fighters</td>\n",
  6128.        "      <td>Sarjapur Water Tankers</td>\n",
  6129.        "      <td>Sarjapur</td>\n",
  6130.        "      <td>7</td>\n",
  6131.        "      <td>01-23-2016</td>\n",
  6132.        "      <td>16:00:00</td>\n",
  6133.        "      <td>6</td>\n",
  6134.        "      <td>0.61</td>\n",
  6135.        "      <td>2</td>\n",
  6136.        "      <td>...</td>\n",
  6137.        "      <td>9</td>\n",
  6138.        "      <td>160.93</td>\n",
  6139.        "      <td>3</td>\n",
  6140.        "      <td>3</td>\n",
  6141.        "      <td>4</td>\n",
  6142.        "      <td>1</td>\n",
  6143.        "      <td>4</td>\n",
  6144.        "      <td>0</td>\n",
  6145.        "      <td>0</td>\n",
  6146.        "      <td>0.375</td>\n",
  6147.        "    </tr>\n",
  6148.        "    <tr>\n",
  6149.        "      <th>23</th>\n",
  6150.        "      <td>276</td>\n",
  6151.        "      <td>Electronic City Power Savers</td>\n",
  6152.        "      <td>HSR High Rent Payers</td>\n",
  6153.        "      <td>Electronic City</td>\n",
  6154.        "      <td>1</td>\n",
  6155.        "      <td>01-24-2016</td>\n",
  6156.        "      <td>20:00:00</td>\n",
  6157.        "      <td>6</td>\n",
  6158.        "      <td>0.61</td>\n",
  6159.        "      <td>1</td>\n",
  6160.        "      <td>...</td>\n",
  6161.        "      <td>2</td>\n",
  6162.        "      <td>216.66</td>\n",
  6163.        "      <td>3</td>\n",
  6164.        "      <td>3</td>\n",
  6165.        "      <td>6</td>\n",
  6166.        "      <td>1</td>\n",
  6167.        "      <td>8</td>\n",
  6168.        "      <td>1</td>\n",
  6169.        "      <td>1</td>\n",
  6170.        "      <td>0.765</td>\n",
  6171.        "    </tr>\n",
  6172.        "    <tr>\n",
  6173.        "      <th>24</th>\n",
  6174.        "      <td>277</td>\n",
  6175.        "      <td>Silkboard Slow Movers</td>\n",
  6176.        "      <td>Whitefield Water Loggers</td>\n",
  6177.        "      <td>Silkboard</td>\n",
  6178.        "      <td>2</td>\n",
  6179.        "      <td>01-25-2016</td>\n",
  6180.        "      <td>20:00:00</td>\n",
  6181.        "      <td>7</td>\n",
  6182.        "      <td>0.60</td>\n",
  6183.        "      <td>2</td>\n",
  6184.        "      <td>...</td>\n",
  6185.        "      <td>4</td>\n",
  6186.        "      <td>155.35</td>\n",
  6187.        "      <td>4</td>\n",
  6188.        "      <td>1</td>\n",
  6189.        "      <td>2</td>\n",
  6190.        "      <td>3</td>\n",
  6191.        "      <td>8</td>\n",
  6192.        "      <td>0</td>\n",
  6193.        "      <td>0</td>\n",
  6194.        "      <td>0.285</td>\n",
  6195.        "    </tr>\n",
  6196.        "    <tr>\n",
  6197.        "      <th>25</th>\n",
  6198.        "      <td>278</td>\n",
  6199.        "      <td>Indranagar Pub Watchers</td>\n",
  6200.        "      <td>Electronic City Power Savers</td>\n",
  6201.        "      <td>Electronic City</td>\n",
  6202.        "      <td>3</td>\n",
  6203.        "      <td>01-26-2016</td>\n",
  6204.        "      <td>16:00:00</td>\n",
  6205.        "      <td>10</td>\n",
  6206.        "      <td>0.55</td>\n",
  6207.        "      <td>0</td>\n",
  6208.        "      <td>...</td>\n",
  6209.        "      <td>2</td>\n",
  6210.        "      <td>160.00</td>\n",
  6211.        "      <td>3</td>\n",
  6212.        "      <td>3</td>\n",
  6213.        "      <td>1</td>\n",
  6214.        "      <td>2</td>\n",
  6215.        "      <td>1</td>\n",
  6216.        "      <td>0</td>\n",
  6217.        "      <td>0</td>\n",
  6218.        "      <td>0.090</td>\n",
  6219.        "    </tr>\n",
  6220.        "    <tr>\n",
  6221.        "      <th>26</th>\n",
  6222.        "      <td>279</td>\n",
  6223.        "      <td>HSR High Rent Payers</td>\n",
  6224.        "      <td>Sarjapur Water Tankers</td>\n",
  6225.        "      <td>Sarjapur</td>\n",
  6226.        "      <td>4</td>\n",
  6227.        "      <td>01-27-2016</td>\n",
  6228.        "      <td>20:00:00</td>\n",
  6229.        "      <td>10</td>\n",
  6230.        "      <td>0.55</td>\n",
  6231.        "      <td>2</td>\n",
  6232.        "      <td>...</td>\n",
  6233.        "      <td>9</td>\n",
  6234.        "      <td>183.33</td>\n",
  6235.        "      <td>6</td>\n",
  6236.        "      <td>1</td>\n",
  6237.        "      <td>6</td>\n",
  6238.        "      <td>1</td>\n",
  6239.        "      <td>3</td>\n",
  6240.        "      <td>1</td>\n",
  6241.        "      <td>1</td>\n",
  6242.        "      <td>0.835</td>\n",
  6243.        "    </tr>\n",
  6244.        "    <tr>\n",
  6245.        "      <th>27</th>\n",
  6246.        "      <td>280</td>\n",
  6247.        "      <td>Marathalli Chokers</td>\n",
  6248.        "      <td>Silkboard Slow Movers</td>\n",
  6249.        "      <td>Marathalli</td>\n",
  6250.        "      <td>5</td>\n",
  6251.        "      <td>01-28-2016</td>\n",
  6252.        "      <td>16:00:00</td>\n",
  6253.        "      <td>10</td>\n",
  6254.        "      <td>0.58</td>\n",
  6255.        "      <td>2</td>\n",
  6256.        "      <td>...</td>\n",
  6257.        "      <td>4</td>\n",
  6258.        "      <td>170.00</td>\n",
  6259.        "      <td>4</td>\n",
  6260.        "      <td>2</td>\n",
  6261.        "      <td>3</td>\n",
  6262.        "      <td>1</td>\n",
  6263.        "      <td>6</td>\n",
  6264.        "      <td>0</td>\n",
  6265.        "      <td>0</td>\n",
  6266.        "      <td>0.140</td>\n",
  6267.        "    </tr>\n",
  6268.        "    <tr>\n",
  6269.        "      <th>28</th>\n",
  6270.        "      <td>281</td>\n",
  6271.        "      <td>Bellandur Froth Fighters</td>\n",
  6272.        "      <td>Koramangala Traffic Jammers</td>\n",
  6273.        "      <td>Silkboard</td>\n",
  6274.        "      <td>6</td>\n",
  6275.        "      <td>01-29-2016</td>\n",
  6276.        "      <td>20:00:00</td>\n",
  6277.        "      <td>10</td>\n",
  6278.        "      <td>0.58</td>\n",
  6279.        "      <td>0</td>\n",
  6280.        "      <td>...</td>\n",
  6281.        "      <td>1</td>\n",
  6282.        "      <td>150.00</td>\n",
  6283.        "      <td>2</td>\n",
  6284.        "      <td>4</td>\n",
  6285.        "      <td>1</td>\n",
  6286.        "      <td>4</td>\n",
  6287.        "      <td>7</td>\n",
  6288.        "      <td>0</td>\n",
  6289.        "      <td>0</td>\n",
  6290.        "      <td>0.330</td>\n",
  6291.        "    </tr>\n",
  6292.        "    <tr>\n",
  6293.        "      <th>29</th>\n",
  6294.        "      <td>282</td>\n",
  6295.        "      <td>Whitefield Water Loggers</td>\n",
  6296.        "      <td>Indranagar Pub Watchers</td>\n",
  6297.        "      <td>Indranagar</td>\n",
  6298.        "      <td>7</td>\n",
  6299.        "      <td>01-30-2016</td>\n",
  6300.        "      <td>20:00:00</td>\n",
  6301.        "      <td>9</td>\n",
  6302.        "      <td>0.58</td>\n",
  6303.        "      <td>2</td>\n",