FeatureAnalysis 变量分析,筛选,基于变量的策略制定 变量的筛选包含: 缺失值 单一值 相关性分析 重要性分析 变量的探索包含: 变量的基础分布 变量的等距分布 类别变量的分布 不同类别下,某一个变量和标签的分布关系 最优分BIN法下的变量分布 PS: 变量的读取时基于PANDAS,其中对PANDAS 的内存做了优化,做到尽可能小,尽可能快的读取并操作数据 所有的方法均有对应的jupyter 使用例子。