分别用sklearn和tensorflow做房价预测

2017 年 9 月 8 日 数据挖掘入门与实战 要学习更多点这→



大数据挖掘DT数据分析  公众号: datadw


本篇是后面用tensorflow做回归时的一个参照,忍不住要说的是sklearn真是简单好用,要不是他没有卷积cnn等时髦模型,真是不想用其他家的了


经典的sklearn集成模型


结果:




真是又快又准啊!由于该数据的已经是被打乱了,非原顺序,所以看起来是这样

另外参数优选的代码被注释掉了,感兴趣的可以自己调参。



卷积神经网路CNN          

 

既然sklearn已经足够简单高效,为啥要用卷积神经网络(cnn)呢,江湖传言它有两个大优势:


1、sklearn需要人工进行特征优选,cnn会进行自动优选特征

2、随着训练数据的增多,sklearn的准确性就没啥大变化了,cnn则是越来越准,没有瓶颈。说实在的就boston房价这个数据也就506行,13个特征(列),对cnn来说实在太少了,没个10万行数据,都看不出它的优势;


另外cnn虽然不用人工特征优选,但是搭建它的拓扑结构实在是个难搞的事,最让人炸裂的是tensorflow的结构,真是让人费解,关于它的结构网上很多介绍,我就不说了,但是用cnn做回归计算的文章非常罕见,请点赞!上代码


#参考http://blog.csdn.net/jerry81333/article/details/52979206 周莫烦的系列视频教程,跪地推荐 

结果是这样的:



上文中只训练了200次,其实正常来说都是1000次起的,无奈手里只有小mac mini,显卡是N卡的同学可以用tensorflow的gpu版跑跑试试。


RNN之递归神经网路LSTM                             


在tensorflow里RNN才是做回归计算的正规军,其中LSTM更是让人工智能有了记忆,如果cnn最适合做的是图像识别,那么LSTM就是视频识别。网上的教程多是用正余弦数据在做预测,输入输出都是一维,我这用波士顿房价,输入是13个特征!


注意与前面两个模型不同的是,没有用train_test_split把训练数据分割,而是用的时序数据。


lstm输入和输出都是时序数据,是尊重时间的,和上两篇用的交叉数据集是不一样的,所以结果是这样的:



via:http://blog.csdn.net/baixiaozhe/article/details/54410313


 

人工智能大数据与深度学习

搜索添加微信公众号:weic2c


长按图片,识别二维码,点关注



大数据挖掘DT数据分析

搜索添加微信公众号:datadw


教你机器学习,教你数据挖掘


长按图片,识别二维码,点关注



登录查看更多
1

相关内容

【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
195+阅读 · 2020年6月29日
商业数据分析,39页ppt
专知会员服务
162+阅读 · 2020年6月2日
【资源】100+本免费数据科学书
专知会员服务
108+阅读 · 2020年3月17日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
130+阅读 · 2020年3月15日
【模型泛化教程】标签平滑与Keras, TensorFlow,和深度学习
专知会员服务
21+阅读 · 2019年12月31日
谷歌机器学习速成课程中文版pdf
专知会员服务
146+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
165+阅读 · 2019年12月2日
【年度系列】使用LSTM预测股票市场基于Tensorflow
量化投资与机器学习
19+阅读 · 2018年10月16日
LASSO回归与XGBoost:融合模型预测房价
论智
32+阅读 · 2018年8月8日
手把手教你用Python库Keras做预测(附代码)
数据派THU
14+阅读 · 2018年5月30日
从人脸识别到机器翻译:52个有用的机器学习和预测API
深度学习世界
3+阅读 · 2018年5月11日
keras系列︱深度学习五款常用的已训练模型
数据挖掘入门与实战
10+阅读 · 2018年3月27日
Tensorflow:基于LSTM轻松生成各种古诗
数据挖掘入门与实战
4+阅读 · 2018年1月5日
52 个有用的机器学习与预测API
北京思腾合力科技有限公司
3+阅读 · 2017年10月26日
xgboost特征选择
数据挖掘入门与实战
39+阅读 · 2017年10月5日
用 Scikit-Learn 和 Pandas 学习线性回归
Python开发者
9+阅读 · 2017年9月26日
利用TensorFlow实现多元逻辑回归和多元线性回归
数据挖掘入门与实战
5+阅读 · 2017年7月4日
Arxiv
3+阅读 · 2018年10月25日
Arxiv
22+阅读 · 2018年2月14日
VIP会员
相关VIP内容
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
195+阅读 · 2020年6月29日
商业数据分析,39页ppt
专知会员服务
162+阅读 · 2020年6月2日
【资源】100+本免费数据科学书
专知会员服务
108+阅读 · 2020年3月17日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
130+阅读 · 2020年3月15日
【模型泛化教程】标签平滑与Keras, TensorFlow,和深度学习
专知会员服务
21+阅读 · 2019年12月31日
谷歌机器学习速成课程中文版pdf
专知会员服务
146+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
165+阅读 · 2019年12月2日
相关资讯
【年度系列】使用LSTM预测股票市场基于Tensorflow
量化投资与机器学习
19+阅读 · 2018年10月16日
LASSO回归与XGBoost:融合模型预测房价
论智
32+阅读 · 2018年8月8日
手把手教你用Python库Keras做预测(附代码)
数据派THU
14+阅读 · 2018年5月30日
从人脸识别到机器翻译:52个有用的机器学习和预测API
深度学习世界
3+阅读 · 2018年5月11日
keras系列︱深度学习五款常用的已训练模型
数据挖掘入门与实战
10+阅读 · 2018年3月27日
Tensorflow:基于LSTM轻松生成各种古诗
数据挖掘入门与实战
4+阅读 · 2018年1月5日
52 个有用的机器学习与预测API
北京思腾合力科技有限公司
3+阅读 · 2017年10月26日
xgboost特征选择
数据挖掘入门与实战
39+阅读 · 2017年10月5日
用 Scikit-Learn 和 Pandas 学习线性回归
Python开发者
9+阅读 · 2017年9月26日
利用TensorFlow实现多元逻辑回归和多元线性回归
数据挖掘入门与实战
5+阅读 · 2017年7月4日
Top
微信扫码咨询专知VIP会员