Skip to content

Latest commit

 

History

History
24 lines (18 loc) · 754 Bytes

README.md

File metadata and controls

24 lines (18 loc) · 754 Bytes

FeatureAnalysis

变量分析,筛选,基于变量的策略制定

变量的筛选包含:

  1. 缺失值
  2. 单一值
  3. 相关性分析
  4. 重要性分析 IMPORTANCE

变量的探索包含:

  1. 变量的基础分布
  2. 变量的等距分布
  3. 类别变量的分布
  4. 不同类别下,某一个变量和标签的分布关系
  5. 最优分BIN法下的变量分布 BI VAR

PS:

  • 变量的读取时基于PANDAS,其中对PANDAS 的内存做了优化,做到尽可能小,尽可能快的读取并操作数据
  • 所有的方法均有对应的jupyter 使用例子。