ML Templates
Data Preprocessing
Provide a general template to use in ML data preparation.
Processo Padrão:
Informações iniciais - Estatística Descritiva.
Ajuste Dos Tipos Das Variáveis.
Tratamento De Valores Ausentes.
Tratamento Das Variáveis Métricas.
Tratamento Das Variáveis Categóricas.
Verificar Se As Escalas Dos Valores São Similares E Padronizar Os Valores.
Eliminação De Variáveis / Redução De Dimensão.
Verificar o Vazamento De Informação (Data Leakage).
Eliminação De Variáveis Colineares (Alta Correlação).
Verificar possibilidade de utilizar Análise De Componentes Principais (PCA).
@author: Ulf Bergmann
Clusterization
PCA
Provide general template to use in Análise Fatorial PCA.
@author: ulf Bergmann
plot_loading(df, var_list)
Plot loading factors. Parameters
df(DataFrame) : data to be ploted. var_list(list) : variable column name in df.
Returns
None.
Source code in templates\template_pca.py
47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 |
|
ANACOR
Provide general template to use in Análise de Correspondência Simples (ANACOR).
@author: ulf Bergmann