Skip to content

lihao056/python_kaggle

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 

Repository files navigation

#-*- coding:utf-8 -*-

CPU:inter I7-7700
显卡:GTX1060

框架:
Python3.6
Anaconda 3.5.2

.ipynb文件的打开方式
然后cmd中输入:
jupyter notebook

bike是自行车出租的kaggle比赛
python_kaggle是Python机器学习与实践的书和源码
	chapter1 test.py 讲的是肿瘤预测的内容,使用逻辑分类器进行拟合
	chapter2 介绍大量机器学习的模型
	监督学习:
		classification:
			线性分类器
			支持向量机
			朴素贝叶斯
			K近邻
			决策树
			集成模型
		regression:
			线性回归器
			支持向量机
			K近邻
			回归树
			集成模型
	无监督学习:
		数据聚类:k均值算法
		特征降维:PCA
	chapter3 介绍多种提升模型性能的方法,包括数据预处理,控制参数训练,优化模型配置等方法
		特征抽取(feature_extract)
		特征筛选(feature_filter)
		模型拟合(过拟合,欠拟合,L1,L2正则化)
		超参数搜索(网格搜索,并行搜索)
	流行库实践
		NLTK
		Word2Vec
		XGBoost
		Tensorflow
chapter4 讲了参加的三个kaggle的比赛
	分别是tantic,IMDB,MNIST
	其中MNIST书上的例子不能实现,使用线性回归的方法预测,也有90+的精度
	
	
Pandas的操作
https://mp.weixin.qq.com/s/L95slIQ8so5IWpIpy7ZHEQ

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages