Skip to content

XiaolinZHONG/FeatureAnalysis

Repository files navigation

FeatureAnalysis

变量分析,筛选,基于变量的策略制定

变量的筛选包含:

  1. 缺失值
  2. 单一值
  3. 相关性分析
  4. 重要性分析 IMPORTANCE

变量的探索包含:

  1. 变量的基础分布
  2. 变量的等距分布
  3. 类别变量的分布
  4. 不同类别下,某一个变量和标签的分布关系
  5. 最优分BIN法下的变量分布 BI VAR

PS:

  • 变量的读取时基于PANDAS,其中对PANDAS 的内存做了优化,做到尽可能小,尽可能快的读取并操作数据
  • 所有的方法均有对应的jupyter 使用例子。

About

变量分析,筛选,基于变量的策略制定

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published