0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

怎样使用Python创建词云

ss 来源:磐创AI 作者:磐创AI 2020-11-06 17:26 次阅读

介绍从开始从事数据可视化工作的那一天起,我就爱上它了,我总是喜欢从数据中获得有用的见解。在此之前,我只了解基本图表,例如条形图,散点图,直方图等,这些基本图表内置在tableau中,而Power BI则用于数据可视化。通过每天完成此任务,我遇到了许多新图表,例如径向仪表盘,华夫图等。

因此,出于好奇,最近我正在搜索数据可视化中使用的所有图表类型,这些词云引起了我的注意,我发现它非常有趣。之后,我尝试使用Tableau和Power BI中的少量数据来制作词云,在成功尝试之后,我想通过使用条形图,饼图和其他图表的代码来尝试使用它。词云是什么?定义:词云是一个简单但功能强大的可视化表示对象,用于文本处理,它以更大,更粗的字母和不同的颜色显示最常用的词,单词的大小越小,重要性就越小。

词云的用途

1.社交媒体上的热门标签(Instagram,Twitter):全世界的社交媒体都在寻找最新的趋势,因此,我们可以获取人们在其帖子中使用最多的标签来探索最新的趋势。

2.媒体中的热门话题:分析新闻报道,我们可以在头条新闻中找到关键字,并提取出前n个需求较高的主题,来获得所需的结果,即前n个热门媒体主题。

3.电子商务中的搜索词:在电子商务购物网站中,网站所有者可以制作被搜索次数最多的购物商品的词云,这样,他就可以了解在特定时期内哪些商品需求量最大。让我们开始使用Python来实现词云首先,我们需要在jupyter notebook中安装所有库。在python中,我们将安装一个内置库wordcloud。在Anaconda命令提示符下,输入以下代码:pip install wordcloud

如果你的anaconda环境支持conda,请输入:conda install wordcloud

这可以直接在notebook中实现,只需在代码的开头添加“!”即可。像这样:!pip install wordcloud

但现在我想生成拥有任何主题的维基百科文本的词云,因此,我将需要一个Wikipedia库来访问Wikipedia API,可以通过在anaconda命令提示符下安装Wikipedia来完成,如下所示:pip install wikipedia

现在我们还需要其他一些库,它们是numpy,matplotlib和pandas。截至目前,我们需要的库就安装好了import wikipedia

result= wikipedia.page("MachineLearning")

final_result = result.content

print(final_result)

机器学习维基百科页面的输出:

上图是我们通过检索Wikipedia的机器学习页面获得的输出图像,我们还可以看到它可以向下滚动,这表示将检索整个页面。在这里,我们还可以通过摘要方法得到页面的摘要,如:result= wikipedia.summary("MachineLearning", sentences=5)

print(result)

这里我们有句子的参数,因此我们可以用它来检索特定的行数。

输出5个句子让我们一起创建wordcloudfrom wordcloud import WordCloud, StopWords

import matplotlib.pyplot as plt

def plot_cloud(wordcloud):

plt.figure(figsize=(10, 10))

plt.imshow(wordcloud)

plt.axis("off");

wordcloud = WordCloud(width = 500, height = 500, background_color='pink', random_state=10).generate(final_result)

plot_cloud(wordcloud)

停用词是没有任何含义的单词,例如‘is’, ‘are’, ‘an’, ‘I’ 等。Wordcloud带有内置停用词库,该库将自动从文本中删除停用词。同时我们也可以通过stopwords.add()函数在python中添加停用词的选择。Wordcloud方法可以设置词云的宽度和高度,我将它们都设置为500,背景色设置为粉红色。如果不添加随机状态,则每次运行代码时,词云都会看起来不同,我们可以将其设置为任何int值。从上面的代码中,我们将获得这样的词云:

通过查看上图,我们可以看到机器学习是最常用的词,还有一些其他经常使用的词是模型,任务,训练和数据,因此,我们可以得出结论,机器学习是训练数据模型的任务。我们还可以在这里通过背景颜色方法更改背景颜色,并通过colormap方法更改字体颜色,还可以在背景颜色中添加颜色的哈希码,但是mapcolor带有内置的特定颜色。让我们通过使用哈希码将背景色更改为蓝绿色,将字体颜色更改为蓝色:from wordcloud import WordCloud, StopWords

import matplotlib.pyplot as plt

def plot_cloud(wordcloud):

plt.figure(figsize=(10, 10))

plt.imshow(wordcloud)

plt.axis("off");

wordcloud = WordCloud(width = 500, height = 500, background_color='#40E0D0', colormap="ocean", random_state=10).generate(final_result)

plot_cloud(wordcloud)

在这里,我指定了ocean,如果我添加了一些错误的颜色图,jupyter将抛出一个值错误,并向我显示颜色图的可用选项,如下所示:

我们还可以使用PIL库在任何图像中实现词云。尾注在本文中,我们讨论了词云,词云的定义,应用领域以及使用python实现词云。参考链接:https://www.analyticsvidhya.com/blog/2020/10/word-cloud-or-tag-cloud-in-python/

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7209

    浏览量

    89867
  • python
    +关注

    关注

    56

    文章

    4811

    浏览量

    85124
  • 数据可视化
    +关注

    关注

    0

    文章

    471

    浏览量

    10396
收藏 人收藏

    评论

    相关推荐

    操作指南:pytorch服务器怎么设置?

    设置PyTorch服务器需选择平台,创建合适的GPU实例,安装操作系统、Python及Anaconda,创建虚拟环境,根据CUDA版本安
    的头像 发表于 02-08 10:33 92次阅读

    搭建电脑,怎样搭建电脑方便

    统,实现资源的最大化利用,提高工作和学习的效率。这次给大家介绍怎样搭建电脑方便?    怎样搭建电脑方便?    Windows系统(以Windows10为例),开启远程桌面功能:
    的头像 发表于 02-06 10:08 93次阅读
    搭建<b class='flag-5'>云</b>电脑,<b class='flag-5'>怎样</b>搭建<b class='flag-5'>云</b>电脑方便

    hyper-v 备份,hyper-v怎样进行虚拟机的创建

    虚拟机技术打破了传统计算机的限制,为我们带来了全新的计算机模式。今天给大家介绍hyper-v怎样进行虚拟机的创建?    hyper-v怎样进行虚拟机的创建?    使用PowerSh
    的头像 发表于 02-05 14:54 92次阅读
    hyper-v 备份,hyper-v<b class='flag-5'>怎样</b>进行虚拟机的<b class='flag-5'>创建</b>

    私有电脑,怎样成功搭建私有电脑

        在信息时代,远程连接使我们能够在不同的地点之间建立起紧密的联系,实现资源的共享和协同工作。这次给大家介绍怎样成功搭建私有电脑?    怎样成功搭建私有电脑?    硬件准备
    的头像 发表于 01-24 10:14 129次阅读
    私有<b class='flag-5'>云</b>电脑,<b class='flag-5'>怎样</b>成功搭建私有<b class='flag-5'>云</b>电脑

    Python Connector for InterBase连接解决方案

    ,以对存储的数据执行创建、读取、更新和删除操作。该解决方案完全符合 Python DB API 2.0 规范,并作为 Windows、macOS 和 Linux 的 wheel 包分发。 特征 高性能
    的头像 发表于 01-22 14:34 143次阅读

    Flexus 服务器 X:Python 安装的极致便捷之旅

    配置和环境设置方面,可能会遇到各种挑战。为了帮助开发者更高效地使用 Flexus 服务器 X,本文将详细介绍如何在 Flexus 服务器 X 上安装 Python,并突出其便捷性。 一
    的头像 发表于 01-07 17:00 138次阅读
    Flexus <b class='flag-5'>云</b>服务器 X:<b class='flag-5'>Python</b> 安装的极致便捷之旅

    华为 Flexus X 实例下的场景体验——小企业使用 Python 语言——超迅速搭建简单公网 API 接口服务

      前言 小企业为了快速搞定一些接口功能如果不使用 Python 的话相对来说复杂度还是很高的,这里我来通过【华为 Flexus X 实例】来迅速的搭建一个 Python 的 WebApi 示例
    的头像 发表于 12-27 13:46 204次阅读
    华为<b class='flag-5'>云</b> Flexus X 实例下的场景体验——小企业使用 <b class='flag-5'>Python</b> 语言——超迅速搭建简单公网 API 接口服务

    如何在Python中使用socket

    和UDP。 2. 创建Socket 在Python中,我们使用 socket 模块来创建socket。以下是创建一个TCP socket的示例代码: import socket #
    的头像 发表于 11-01 16:10 318次阅读

    利用Python脚本登录到交换机并创建VLAN

    本文将详细介绍如何利用Python脚本登录到交换机并创建VLAN。
    的头像 发表于 08-12 17:59 664次阅读

    中国信通院发布“2024计算十大关键

    7月23日,由中国通信标准化协会主办,中国信息通信研究院(简称“中国信通院”)承办的“2024可信大会”在京召开。大会上,中国信通院正式发布“2024计算十大关键”,中国信通院
    的头像 发表于 08-02 08:28 759次阅读
    中国信通院发布“2024<b class='flag-5'>云</b>计算十大关键<b class='flag-5'>词</b>”

    pytorch和python的关系是什么

    在当今的人工智能领域,Python已经成为了最受欢迎的编程语言之一。Python的易学易用、丰富的库和框架以及强大的社区支持,使其成为了数据科学、机器学习和深度学习等领域的首选语言。而在深度学习领域
    的头像 发表于 08-01 15:27 2513次阅读

    用pycharm进行python爬虫的步骤

    提供了许多有用的功能,如代码自动完成、调试和版本控制等。您可以从JetBrains的官方网站下载PyCharm,并根据您的需求选择免费社区版或付费专业版。 创建一个新的Python项目 打开
    的头像 发表于 07-11 10:11 987次阅读

    用离线安装器安装的idf,其创建Python虚拟环境无激活脚本是怎么回事?

    如题,用离线安装器安装的idf,其创建Python虚拟环境无激活脚本,具体如下图所示: 反而用vscode插件安装的idf有,如下图:vscode插件安装的idf的Python虚拟环境 提问:没有
    发表于 06-11 06:49

    华为开发者桌面全新发布 CodeArts IDE for Python,极致优雅云原生开发体验

    近日,华为正式发布 CodeArts IDE for Python,这是一款内置华为自研 Python 语言服务,提供智能编程、灵活调试能力的可扩展桌面开发工具,为华为开发者提供卓
    的头像 发表于 05-10 00:27 1307次阅读
    华为<b class='flag-5'>云</b>开发者桌面全新发布 CodeArts IDE for <b class='flag-5'>Python</b>,极致优雅云原生开发体验

    华为正式发布CodeArts IDE for Python

    近日,华为正式发布CodeArts IDE for Python,这是一款内置华为自主创新的Python语言服务,提供智能编程、灵活调试能力的可扩展桌面开发工具,为华为开发者提供卓
    的头像 发表于 05-08 14:58 573次阅读