0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何才能自己做詞云圖

9GxC_IoTMaker ? 來源:機(jī)智云開發(fā)者 ? 作者:機(jī)智云開發(fā)者 ? 2022-10-18 09:49 ? 次閱讀

所謂詞云圖,又稱文字云,是通過對一個(gè)或多個(gè)關(guān)鍵詞進(jìn)行重復(fù)的、字體大小顏色不一的、不規(guī)則的排列,使其看上去類似于某種形狀的圖片,是對文本中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺化的展現(xiàn)。

詞云圖能過濾掉大量的低頻低質(zhì)的文本信息,使得瀏覽者只要一眼掃過文本就可領(lǐng)略文本的主旨。

關(guān)鍵詞云圖生成器作為生成云圖的一種工具,簡化了制作過程。目前國內(nèi)外有很多關(guān)鍵詞云圖在線生成器,普遍按月或按年收費(fèi),在付費(fèi)時(shí)候盡量選擇可靠性強(qiáng)的。小編之前就遇到過付費(fèi)后,沒多久網(wǎng)站就消失不見了。

那么如何才能自己來做詞云圖呢?有幾種常見方法

1、使用WordArt WordArt是國外網(wǎng)站,支持自定義字體、詞云形狀、顏色等,做出來的詞云圖酷炫、精美,但訪問時(shí)響應(yīng)會(huì)比較緩慢。 1.1 登錄網(wǎng)站W(wǎng)ordArt.com 1.2 點(diǎn)擊Words-Import words導(dǎo)入事先準(zhǔn)備好的關(guān)鍵詞與其對應(yīng)詞頻,或是直接在對話框中輸入相應(yīng)關(guān)鍵詞。同時(shí)在頻數(shù),顏色,角度,字體中進(jìn)行設(shè)計(jì),以實(shí)現(xiàn)預(yù)設(shè)效果。 666e10d4-4e27-11ed-a3b6-dac502259ad0.png 說明:

Fonts:字體設(shè)置。該工具默認(rèn)字體為英文,如果詞云內(nèi)容為英文可以使用素材提供的字體,而涉及到中文內(nèi)容時(shí)我們需要選擇自行添加字體或是選擇素材庫中的Noto Sans S Chinese(可以識別部分中文)。

Shapes:設(shè)計(jì)詞云的形狀。可以選擇提供的素材庫中的形狀也可以選擇Add Image/Add Text來自定義形狀。這里選擇輸入數(shù)字“2020”并在選項(xiàng)卡中設(shè)計(jì)斜體、輪廓、字體、背景以及字體顏色,設(shè)計(jì)完成后單擊Add將形狀添加進(jìn)來。

Layout:內(nèi)容布局。在該選項(xiàng)卡中,可以更改設(shè)計(jì)文字方向和布局排列方式,該工具提供了許多現(xiàn)成的組合方案,只需按需加以勾選即可。同時(shí),在Words amount ,Density中也可以對填充內(nèi)容進(jìn)行設(shè)計(jì)。

Style:詞云設(shè)計(jì),主要涉及關(guān)鍵詞具體內(nèi)容的編輯設(shè)計(jì)。通過參數(shù)調(diào)整,對背景以及底色進(jìn)行編輯修改。

1.3 生成詞云:單擊Visualize,即可生成詞云圖并預(yù)覽效果。 1.4 導(dǎo)出圖片:點(diǎn)擊DOWNLOAD (選擇圖片格式)即可下載詞云圖。 67dc85ae-4e27-11ed-a3b6-dac502259ad0.png ? 2、借助開源軟件 word-cloud是一款為 java 設(shè)計(jì)的云圖生成工具。目前該項(xiàng)目開源,地址在https://github.com/houbb/word-cloud

特性

極簡 api,一行代碼搞定一切

支持自定義云圖背景

支持中英文分詞,默認(rèn)對用戶透明

支持停頓詞過濾,默認(rèn)對用戶透明

支持各種用戶自定義配置

Maven引入


com.github.houbb
word-cloud
1.2.2
使用
WordCloudHelper.wordCloud("該作講述的是一個(gè)名為德特茅斯的衰落小鎮(zhèn)下掩埋著一個(gè)古老的廢棄王國,名叫圣巢。這個(gè)王國被瘟疫所侵蝕而廢棄,廢棄的原因則是因?yàn)槊麨檩椆獾墓庵派?,她可以通過思想來傳播瘟疫,被瘟疫侵蝕的蟲子都會(huì)被本能所支配,失去心智。
" +
"這個(gè)王國的主人——蒼白之王,自然不會(huì)坐視不管,他在圣巢范圍之下的深淵,利用另一種遠(yuǎn)古力量“虛空”可以壓制光明的特性,制造了容器一族。其中一位被選中的容器用來封印瘟疫,并被命名為空洞騎士。為了封印的穩(wěn)固,白王尋找了三個(gè)守夢人來進(jìn)一步鞏固封印,三位守夢人的名稱分別為守望者 - 盧瑞恩,導(dǎo)師 - 莫諾蒙,野獸 - 赫拉。但之后蒼白之王不知去向,不完美的容器的力量的也變得逐漸虛弱,最終被輻光控制。主角就要穿過圣巢的各地,在安息之地中,我們受到曾經(jīng)輻光的信徒和眷族——飛蛾族唯一留下的族人的幫助,獲得了和輻光力量同源的夢之武器——夢之釘。夢之釘可以讀取生物內(nèi)心的想法,并可以打破守夢人的保護(hù),進(jìn)入到其夢境之中殺死守夢人。殺死了三位守夢人并解開封印后,可選的結(jié)局有到達(dá)十字路里的黑卵神殿打敗空洞騎士或去到在“尋神者”更新中新加入的地點(diǎn)“神居”并挑戰(zhàn)圣巢萬神殿。");
添加背景
//以鯨魚的背景,可以讓文字以圖像的形式展現(xiàn):
String imagePath = "backgrounds\whale_small.png";
WordCloudHelper.wordCloud(text,"out_bg.png",imagePath);
效果如下 681dad4a-4e27-11ed-a3b6-dac502259ad0.png3、使用python工具 使用Python庫jieba,jieba是一個(gè)非常好用的中文工具,是以分詞起家的,但是功能比分詞要強(qiáng)大很多。 68560fe6-4e27-11ed-a3b6-dac502259ad0.png jieba分詞有三種模式: 687c9058-4e27-11ed-a3b6-dac502259ad0.png jieba.cut返回的結(jié)構(gòu)都是一個(gè)可迭代的 generator,可以使用 for 循環(huán)來獲得分詞后得到的每一個(gè)詞語(unicode)。

jieba.cut方法接受三個(gè)輸入參數(shù):

需要分詞的字符串

cut_all 參數(shù)用來控制是否采用全模式,一般情況下,cut_all為False

HMM 參數(shù)用來控制是否使用 HMM 模型

示例: 使用“Star.jpg”作為模板圖片和“myword.txt”文本制作詞云圖 Star.jpg

myword.txt

詳細(xì)代碼

###導(dǎo)入庫
#導(dǎo)入wordcloud詞云制作第三方庫,并導(dǎo)入WordCloud.ImageColorGenerator兩個(gè)模塊 from wordcloud import WordCloud.imageColorGenerator


#導(dǎo)入imageio庫
importimageio


# 導(dǎo)入jieba庫
importjieba


### 圖片處理
# 用imageio庫中的imread函數(shù)讀取本地圖片
testmg=imageio.imread("Star.jpg")


# 調(diào)用wordcloud庫中的ImageColorGenerator函數(shù)
image_color=ImageColorGenerator(testimg)


# 給WordCloud函數(shù)傳入?yún)?shù)設(shè)置圖片相關(guān)屬性
test=WordCloud(mask=testimg,#將testng的值賦值給mask用作遮罩圖
width=500,#輸出圖片寬度為500px
height=500,#輸出圖片高度為500px
background_color="white",#輸出圖片背景顏色為白色
font-path="msyh.ttc"#字體路徑為微軟雅黑
scale=15)#畫布放大比例為15


###文本處理
# 引用外部文件,并用utf-8的編碼方式
txt=open("myword.txt",encoding="utf-8").read()


# 調(diào)用詞云對象test的generate方法,導(dǎo)入文本
# 使用jieba分詞的精確模式為文本進(jìn)行分詞
test=test.recolor(color_func=image_color)


###輸出處理
#將生成的詞云保存為result.png圖片文件,保存到當(dāng)前文件夾中
test.to_file("result.png")
效果圖

690061a8-4e27-11ed-a3b6-dac502259ad0.png

詞云圖不僅能用來突出關(guān)鍵詞,減少信息冗余,還能用于用戶圖像分析,快來試試吧。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • JAVA
    +關(guān)注

    關(guān)注

    19

    文章

    2946

    瀏覽量

    104362
  • 軟件
    +關(guān)注

    關(guān)注

    69

    文章

    4611

    瀏覽量

    86984
  • 生成器
    +關(guān)注

    關(guān)注

    7

    文章

    313

    瀏覽量

    20919

原文標(biāo)題:三種制作詞云圖的方法,你覺得用哪一種更方便?

文章出處:【微信號:IoTMaker,微信公眾號:機(jī)智云開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    實(shí)時(shí)衛(wèi)星云圖數(shù)據(jù)處理

    論述GMS-3實(shí)時(shí)衛(wèi)星云圖數(shù)據(jù)的錄取與保存、事后圖像處理的工作原理、關(guān)鍵技術(shù)實(shí)現(xiàn)方法。實(shí)時(shí)衛(wèi)星云圖實(shí)現(xiàn)了高速度、大容量數(shù)據(jù)的處理。
    發(fā)表于 12-13 16:09 ?4649次閱讀
    實(shí)時(shí)衛(wèi)星<b class='flag-5'>云圖</b>數(shù)據(jù)處理

    每天一題--動(dòng)態(tài)云圖

    動(dòng)態(tài)云圖
    發(fā)表于 05-16 14:39

    如何用強(qiáng)度圖生成這樣的云圖!

    如何用強(qiáng)度圖生成這樣的云圖!
    發(fā)表于 07-27 13:29

    關(guān)于電機(jī)效率云圖的繪制

    `電機(jī)效率云圖就是根據(jù)不同轉(zhuǎn)速,轉(zhuǎn)矩測出電機(jī)的效率,然后畫出向等高線圖一樣的色溫圖。等高線可視為效率值,論壇有沒有人做過這樣類似的項(xiàng)目,求教。`
    發(fā)表于 11-26 12:28

    labview實(shí)現(xiàn)云圖繪制(非python接口)

    ` 網(wǎng)上有很多圖云生成器,python也能用封裝好的接口在線調(diào)用,不求原理的調(diào)用,用labview在本地生成云圖來解釋下面生成的原理:核心函數(shù)塊:圖片文字繪制,獲取文字區(qū)域原理:首先在圖片中可
    發(fā)表于 06-07 12:08

    關(guān)鍵優(yōu)化有哪些實(shí)用的方法

    我們在做關(guān)鍵優(yōu)化排名的時(shí)候,有經(jīng)驗(yàn)的seo人員都會(huì)有自己的一套關(guān)于關(guān)鍵應(yīng)該怎么去優(yōu)化排名的方法,但是對于一些剛接觸seo的新手來說就會(huì)比較迷茫,不知道應(yīng)該怎么去做好關(guān)鍵的排名,大
    發(fā)表于 08-11 01:19

    Python生成的淘寶評論云圖

    Python——對淘寶評論詞頻統(tǒng)計(jì)并生成云圖
    發(fā)表于 11-04 06:12

    基于SOM神經(jīng)網(wǎng)絡(luò)的靜止衛(wèi)星云圖分類

    利用FY-2C的紅外和可見光自旋掃描輻射器(VISSR)多通道云圖數(shù)據(jù)對云進(jìn)行分類, 提出了一種利用云圖紅外、可見光譜段數(shù)據(jù), 基于SOM神經(jīng)網(wǎng)絡(luò)的云分類算法。設(shè)計(jì)并編寫了實(shí)際云圖
    發(fā)表于 08-29 14:31 ?16次下載
    基于SOM神經(jīng)網(wǎng)絡(luò)的靜止衛(wèi)星<b class='flag-5'>云圖</b>分類

    DIY:自己動(dòng)手數(shù)碼相機(jī)

    DIY:自己動(dòng)手數(shù)碼相機(jī)
    發(fā)表于 01-24 16:38 ?11次下載

    局部聚類分析的FCN-CNN云圖分割方法

    空氣中的塵埃、污染物及氣溶膠粒子的存在嚴(yán)重影響了大氣預(yù)測的有效性,毫米波雷達(dá)云圖的有效分割成為了解決這一問題的關(guān)鍵,本文提出了一種基于超像素分析的全卷積神經(jīng)網(wǎng)路FCN和深度卷積神經(jīng)網(wǎng)絡(luò)CNN
    發(fā)表于 12-15 16:44 ?0次下載

    如何在面包板上自己的Arduino

    在本章,我們將:學(xué)習(xí)如何在面包板上自己的Arduino電路;研究各種Arduino兼容板的特性和優(yōu)點(diǎn);學(xué)習(xí)開源硬件。我們要把整個(gè)Arduino分解成若干個(gè)元件,然后在面包板上搭出自己
    發(fā)表于 05-29 17:58 ?6次下載
    如何在面包板上<b class='flag-5'>做</b><b class='flag-5'>自己</b>的Arduino

    WingTo云圖對智能家居體驗(yàn)的革新與思考

    歷經(jīng)幾年發(fā)展,現(xiàn)在不管什么企業(yè)的產(chǎn)品都主打全場景、全屋智能與智慧生活,生態(tài)的智能家居企業(yè)越來越多。不過劣質(zhì)的做工,不互通的智能體驗(yàn)讓智能家居產(chǎn)品顯得十分雞肋。而在11月15號下午的一場以
    發(fā)表于 11-18 11:35 ?841次閱讀

    易達(dá)云圖正式加入深圳市物聯(lián)網(wǎng)協(xié)會(huì)

    成立于2011年,秉承“成就產(chǎn)業(yè)、成就他人、成就自我”的初心,致力于串聯(lián)各種創(chuàng)新要素的“鏈子”,構(gòu)建了物聯(lián)網(wǎng)生態(tài)產(chǎn)業(yè)平臺。目前注冊優(yōu)質(zhì)會(huì)員4000家,其中,高新技術(shù)企業(yè)600家,上市公司100家,新三板企業(yè)120家 。 ? 易達(dá)云圖以“賦能
    的頭像 發(fā)表于 01-13 10:26 ?2714次閱讀

    車企為什么自己芯片

    隨著新能源汽車的發(fā)展和造車新勢力競爭的日趨激烈,車企自己下場芯片的越來越多,筆者從自身的理解和半導(dǎo)體專業(yè)的思考出發(fā),給大家拋磚引玉,提出自己的建議。
    的頭像 發(fā)表于 01-29 15:51 ?830次閱讀

    三種制作詞云圖的方法,你覺得用哪一種更方便?

    如上所示,就是常見的云圖。所謂詞云圖,又稱文字云,是通過對一個(gè)或多個(gè)關(guān)鍵進(jìn)行重復(fù)的、字體大小顏色不一的、不規(guī)則的排列,使其看上去類似于某種形狀的圖片,是對文本中出現(xiàn)頻率較高的“關(guān)鍵
    的頭像 發(fā)表于 10-18 14:54 ?3w次閱讀
    三種制作詞<b class='flag-5'>云圖</b>的方法,你覺得用哪一種更方便?