用Python搞出自己的云词图 | 【带你装起来】

2019 年 1 月 20 日 机器学习算法与Python学习

源 / AI算法与图像处理      文 / AI_study

云词图简介

什么词云

由词汇组成类似云的彩色图形。“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。

有何作用

1、直观,高大上
2、可装逼,很潇洒


准备工作

1、导入包——jieba和wordcloud
命令:pip install jieba
命令:pip install wordcloud
备注:对于pycharm等可采用各自的方法导入包
2、文本和图片的准备
文本:可爬取网上资料或某歌曲书籍等关键字,亦或是像我是自己手动输入文字并用tab隔开
图片:找自己喜欢的图片,这里我采用乔巴的图片作为背景,而且除了主要人物外,其他背景都为白色,显示效果较好。

采用的文本内容:

采用的图片:

代码展示


# coding: utf-8
import jieba
from wordcloud import WordCloud,STOPWORDS
from scipy.misc import imread # 处理图像的函数
import matplotlib.pyplot as plt

# 读取文本文件
text = open( /media/pzw/0E50196C0E50196C/weixin/t1.txt r ).read()
# 对文本进行分词
cut_text =   .join(jieba.cut(text))
# 读取图片
color_mask = imread( /media/pzw/0E50196C0E50196C/weixin/qiaoba.jpg )
# 生成词云
cloud = WordCloud(font_path= G:/py/wc/new_songti.ttc ,# 这里是导入字体,因为我是采用英文的,所有不导入也并不影响,若是中文的或者有其他的字符需要自己选择合适的字体包
                  background_color="white",
                  mask=color_mask,
                  max_words=2000,
                  max_font_size=80)
word_cloud = cloud.generate(cut_text)

# 输出图片
plt.axis( off )
plt.imshow(word_cloud)
plt.show()

效果展示


推荐阅读

大龄单身狗返乡过年期间瞬时压力激增现象及其应对措施研究

下载|超全机器学习思维导图

MIT《深度学习基础》第一课68分钟视频+69页PPT

7种简洁Python语法,教你码出一手好代码

下载 | 954页《数据可视化》手册

知识点 | 全面理解支持向量机


登录查看更多
0

相关内容

“结巴”中文分词:做最好的 Python 中文分词组件
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
干货书《数据科学数学系基础》2020最新版,266页pdf
专知会员服务
314+阅读 · 2020年3月23日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
189+阅读 · 2020年3月12日
《深度学习》圣经花书的数学推导、原理与Python代码实现
《代码整洁之道》:5大基本要点
专知会员服务
49+阅读 · 2020年3月3日
【书籍推荐】简洁的Python编程(Clean Python),附274页pdf
专知会员服务
173+阅读 · 2020年1月1日
【电子书】让 PM 全面理解深度学习 65页PDF免费下载
专知会员服务
16+阅读 · 2019年10月30日
【新书】Python编程基础,669页pdf
专知会员服务
186+阅读 · 2019年10月10日
学习自然语言处理路线图
专知会员服务
133+阅读 · 2019年9月24日
用 Python 开发 Excel 宏脚本的神器
私募工场
26+阅读 · 2019年9月8日
一文看懂怎么用 Python 做数据分析
大数据技术
23+阅读 · 2019年5月5日
Python用法速查网站
Python程序员
17+阅读 · 2018年12月16日
吃鸡手游竟然是Python写的?
机器学习算法与Python学习
6+阅读 · 2018年9月11日
推荐一些适合小白练手的Python项目
数据挖掘入门与实战
6+阅读 · 2018年5月17日
Python NLP入门教程
Python开发者
8+阅读 · 2017年11月19日
Python NLP 入门教程
开源中国
14+阅读 · 2017年10月1日
使用 Python 绘制《星战》词云
Datartisan数据工匠
3+阅读 · 2017年8月31日
NLP自然语言处理(二)——基础文本分析
乐享数据DataScientists
12+阅读 · 2017年2月7日
NLP自然语言处理(一)——jieba分词(R vs. python)
乐享数据DataScientists
6+阅读 · 2017年1月15日
3D Deep Learning on Medical Images: A Review
Arxiv
12+阅读 · 2020年4月1日
Arxiv
3+阅读 · 2018年12月19日
Learning Implicit Fields for Generative Shape Modeling
Arxiv
10+阅读 · 2018年12月6日
Arxiv
22+阅读 · 2018年8月30日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
Arxiv
15+阅读 · 2018年6月23日
Arxiv
5+阅读 · 2018年1月18日
Arxiv
6+阅读 · 2018年1月14日
VIP会员
相关VIP内容
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
干货书《数据科学数学系基础》2020最新版,266页pdf
专知会员服务
314+阅读 · 2020年3月23日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
189+阅读 · 2020年3月12日
《深度学习》圣经花书的数学推导、原理与Python代码实现
《代码整洁之道》:5大基本要点
专知会员服务
49+阅读 · 2020年3月3日
【书籍推荐】简洁的Python编程(Clean Python),附274页pdf
专知会员服务
173+阅读 · 2020年1月1日
【电子书】让 PM 全面理解深度学习 65页PDF免费下载
专知会员服务
16+阅读 · 2019年10月30日
【新书】Python编程基础,669页pdf
专知会员服务
186+阅读 · 2019年10月10日
学习自然语言处理路线图
专知会员服务
133+阅读 · 2019年9月24日
相关资讯
用 Python 开发 Excel 宏脚本的神器
私募工场
26+阅读 · 2019年9月8日
一文看懂怎么用 Python 做数据分析
大数据技术
23+阅读 · 2019年5月5日
Python用法速查网站
Python程序员
17+阅读 · 2018年12月16日
吃鸡手游竟然是Python写的?
机器学习算法与Python学习
6+阅读 · 2018年9月11日
推荐一些适合小白练手的Python项目
数据挖掘入门与实战
6+阅读 · 2018年5月17日
Python NLP入门教程
Python开发者
8+阅读 · 2017年11月19日
Python NLP 入门教程
开源中国
14+阅读 · 2017年10月1日
使用 Python 绘制《星战》词云
Datartisan数据工匠
3+阅读 · 2017年8月31日
NLP自然语言处理(二)——基础文本分析
乐享数据DataScientists
12+阅读 · 2017年2月7日
NLP自然语言处理(一)——jieba分词(R vs. python)
乐享数据DataScientists
6+阅读 · 2017年1月15日
相关论文
3D Deep Learning on Medical Images: A Review
Arxiv
12+阅读 · 2020年4月1日
Arxiv
3+阅读 · 2018年12月19日
Learning Implicit Fields for Generative Shape Modeling
Arxiv
10+阅读 · 2018年12月6日
Arxiv
22+阅读 · 2018年8月30日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
Arxiv
15+阅读 · 2018年6月23日
Arxiv
5+阅读 · 2018年1月18日
Arxiv
6+阅读 · 2018年1月14日
Top
微信扫码咨询专知VIP会员