Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- Nesta aula, sobre pandas, aprendemos:
- Como importar a biblioteca (import pandas as pd)
- Como ler fontes de dados diferentes:
- Uma base CSV (pd.read_csv(...))
- Uma base JSON (pd.read_json(...))
- Uma base TXT (pd.read_table(...))
- Um arquivo EXCEL (pd.read_excel(...))
- Uma página HTML (pd.read_html(...))
- Vários métodos e atributos úteis de dataframes, como:
- info()
- head()
- dtypes
- columns
- shape
- ----------------
- E sobre Jupyter, vimos como:
- Criar diferentes tipos de células dentro do Jupyter
- Acessar a documentação
- Como reexecutar todas as células
- ----------------
- Nesta aula, aprendemos:
- Como selecionar uma variável do dataframe (por exemplo, dados['Tipo'] ou dados.Tipo)
- Que um dataframe é composto de vários Series
- Como eliminar duplicatas (pelo método drop_duplicates())
- Como redefinir o index de um dataframe e series (atributo index)
- Como concatenar dataframes (lembrando do axis)
- Como criar novos dataframes baseados em estruturas de dados Python (lista, dicionários ou tuples)
- Criar uma Series booleana usando o método isin(..) a partir do dataframe
- Filtrar os dados de um dataframe baseado na Series booleana
- Exportar e gravar os dados do dataframe (método to_csv())
- Ordenar os dados de um dataframe (métodos sort_values() e sort_index())
- ----------------
- Tratamento de dados faltantes
- Como identificar valores nulos (missing values)
- O método isnull() indica se os valores são nulos
- O método notnull() retorna o contrário do método isnull()
- O método info() também é uma forma de se verificar a presença de valores faltantes
- Como remover valores nulos com o método dropna()
- Tratamento condicional
- Inversão de valores booleanos com ~
- Como substituir os missing values com o método fillna()
- Métodos de interpolação: ffill, bfill e mean()
- --------------------
- Nesta aula, aprendemos:
- Como criar agrupamentos com o groupby()
- Estatísticas descritivas com o describe() e o aggregate()
- Como renomear as colunas com o rename()
- Como fazer gráficos com o pacote Matplotlib
- Como criar faixas de valor com o cut()
- ----------------
- Nessa aula aprendemos a:
- Definir sobre max_depth;
- Definir sobre a árvore de decisão ( DecisionTreeClassifier);
- Mostrar gráficos com o seaborn;
- Mostrar gráficos com matplotlib;
- Definir hiperparâmetros.
- ------------------
- O que aprendemos nesta aula:
- O que é nested cross validation;
- Importar o GroupKFold;
- Visualizar o melhor estimador.
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement