TextInfoExp:自然语言处理相关实验(基于sougou数据集)

2017 年 11 月 12 日 全球人工智能


——免费加入AI技术专家社群>>

——免费加入AI高管投资者群>>

介绍:自然语言处理相关实验(基于sougou数据集),包含文本特征提取(TF-IDF),文本分类,文本聚类,word2vec训练词向量及同义词词林中文词语相似度计算、文档自动摘要,信息抽取,情感分析与观点挖掘等。

构建实验环境

1 安装python(2.7) https://www.python.org/

2 安装pip:

2.1 下载pip https://pypi.python.org/pypi/pip/9.0.1

2.2 解压缩后,安装指令 python setup.py install

2.3 pip升级 python -m pip install –upgrade pip

2.4 pip安装扩展包 pip install jieba (这里以jieba包为例),如果速度较慢,可改为国内的阿里源,即 pip install jieba -i http://mirrors.aliyun.com/pypi/simple/ –trusted-host mirrors.aliyun.com

3 安装pycharm http://www.jetbrains.com/pycharm/

4 使用GitHub获取代码

4.1 安装git https://git-scm.com/

4.2 登陆自己的GitHub账号,找到自己的项目,(别人的需要先fork过来,也可以直接 git clone xxx,或者直接下载zip包放进pycharm)

4.3 打开pycharm,首先设置git的位置及github账号,点击Test都通过后继续,依次在菜单栏点击 VCS checkout from version control
GitHub,登陆自己的账号后选择相应的项目,得到代码。

4.4 (更新fork的项目到最新的版本)Syncing a fork https://help.github.com/articles/syncing-a-fork/

5 ipython交互式开发环境

5.1 安装ipython pip install ipython

5.2 安装jupyter(即notebook) pip install notebook

5.3 jupyter notebook 启动,打开浏览器即可(默认1224端口)

项目地址:https://github.com/Roshanson/TextInfoExp



热门文章推荐

周志华:实验表明gcForest是最好的非深度神经网络方法

黑科技|Adobe出图象技术神器!视频也可以PS了!!

史上第一个被授予公民身份的机器人索菲亚和人对答如流!

浙大90后女黑客在GeekPwn2017上秒破人脸识别系统!

周志华点评AlphaGo Zero:这6大特点非常值得注意!

汤晓鸥教授:人工智能让天下没有难吹的牛!

英伟达发布全球首款人工智能全自动驾驶平台

未来 3~5 年内,哪个方向的机器学习人才最紧缺?

中科院步态识别技术:不看脸 50米内在人群中认出你!

厉害|黄仁勋狂怼CPU:摩尔定律已死 未来属于GPU!

登录查看更多
12

相关内容

自然语言处理(NLP)是语言学,计算机科学,信息工程和人工智能的一个子领域,与计算机和人类(自然)语言之间的相互作用有关,尤其是如何对计算机进行编程以处理和分析大量自然语言数据 。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
基于深度学习的手语识别综述
专知会员服务
46+阅读 · 2020年5月18日
近期必读的6篇AI顶会WWW2020【推荐系统】相关论文
专知会员服务
56+阅读 · 2020年2月25日
Keras作者François Chollet推荐的开源图像搜索引擎项目Sis
专知会员服务
29+阅读 · 2019年10月17日
【Strata Data Conference】用于自然语言处理的深度学习方法
专知会员服务
48+阅读 · 2019年9月23日
别找了,送你 20 个文本数据集
机器学习算法与Python学习
67+阅读 · 2019年5月17日
Capsule Networks教程
全球人工智能
10+阅读 · 2017年11月24日
视频|PyData:神经网络推荐系统!
全球人工智能
4+阅读 · 2017年11月20日
推荐|台大陈蕴侬、李宏毅“应用深度学习”课程(10-12)
全球人工智能
11+阅读 · 2017年10月28日
推荐|台大陈蕴侬、李宏毅“应用深度学习”课程(4-6)
全球人工智能
6+阅读 · 2017年10月23日
推荐|台大陈蕴侬、李宏毅“应用深度学习”课程(1-3)
全球人工智能
11+阅读 · 2017年10月22日
推荐系统-基于用户画像和协同过滤的商品推荐(视频)
全球人工智能
37+阅读 · 2017年10月9日
Deep Learning for Energy Markets
Arxiv
9+阅读 · 2019年4月10日
Arxiv
21+阅读 · 2019年3月25日
Arxiv
13+阅读 · 2019年1月26日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
6+阅读 · 2018年7月29日
Arxiv
3+阅读 · 2018年6月19日
VIP会员
相关资讯
别找了,送你 20 个文本数据集
机器学习算法与Python学习
67+阅读 · 2019年5月17日
Capsule Networks教程
全球人工智能
10+阅读 · 2017年11月24日
视频|PyData:神经网络推荐系统!
全球人工智能
4+阅读 · 2017年11月20日
推荐|台大陈蕴侬、李宏毅“应用深度学习”课程(10-12)
全球人工智能
11+阅读 · 2017年10月28日
推荐|台大陈蕴侬、李宏毅“应用深度学习”课程(4-6)
全球人工智能
6+阅读 · 2017年10月23日
推荐|台大陈蕴侬、李宏毅“应用深度学习”课程(1-3)
全球人工智能
11+阅读 · 2017年10月22日
推荐系统-基于用户画像和协同过滤的商品推荐(视频)
全球人工智能
37+阅读 · 2017年10月9日
相关论文
Deep Learning for Energy Markets
Arxiv
9+阅读 · 2019年4月10日
Arxiv
21+阅读 · 2019年3月25日
Arxiv
13+阅读 · 2019年1月26日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
6+阅读 · 2018年7月29日
Arxiv
3+阅读 · 2018年6月19日
Top
微信扫码咨询专知VIP会员