所謂詞云圖,又稱文字云,是通過對一個(gè)或多個(gè)關(guān)鍵詞進(jìn)行重復(fù)的、字體大小顏色不一的、不規(guī)則的排列,使其看上去類似于某種形狀的圖片,是對文本中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺化的展現(xiàn)。
詞云圖能過濾掉大量的低頻低質(zhì)的文本信息,使得瀏覽者只要一眼掃過文本就可領(lǐng)略文本的主旨。
關(guān)鍵詞云圖生成器作為生成云圖的一種工具,簡化了制作過程。目前國內(nèi)外有很多關(guān)鍵詞云圖在線生成器,普遍按月或按年收費(fèi),在付費(fèi)時(shí)候盡量選擇可靠性強(qiáng)的。小編之前就遇到過付費(fèi)后,沒多久網(wǎng)站就消失不見了。
那么如何才能自己來做詞云圖呢?有幾種常見方法
1、使用WordArt WordArt是國外網(wǎng)站,支持自定義字體、詞云形狀、顏色等,做出來的詞云圖酷炫、精美,但訪問時(shí)響應(yīng)會(huì)比較緩慢。 1.1 登錄網(wǎng)站W(wǎng)ordArt.com 1.2 點(diǎn)擊Words-Import words導(dǎo)入事先準(zhǔn)備好的關(guān)鍵詞與其對應(yīng)詞頻,或是直接在對話框中輸入相應(yīng)關(guān)鍵詞。同時(shí)在頻數(shù),顏色,角度,字體中進(jìn)行設(shè)計(jì),以實(shí)現(xiàn)預(yù)設(shè)效果。 說明:
Fonts:字體設(shè)置。該工具默認(rèn)字體為英文,如果詞云內(nèi)容為英文可以使用素材提供的字體,而涉及到中文內(nèi)容時(shí)我們需要選擇自行添加字體或是選擇素材庫中的Noto Sans S Chinese(可以識別部分中文)。
Shapes:設(shè)計(jì)詞云的形狀。可以選擇提供的素材庫中的形狀也可以選擇Add Image/Add Text來自定義形狀。這里選擇輸入數(shù)字“2020”并在選項(xiàng)卡中設(shè)計(jì)斜體、輪廓、字體、背景以及字體顏色,設(shè)計(jì)完成后單擊Add將形狀添加進(jìn)來。
Layout:內(nèi)容布局。在該選項(xiàng)卡中,可以更改設(shè)計(jì)文字方向和布局排列方式,該工具提供了許多現(xiàn)成的組合方案,只需按需加以勾選即可。同時(shí),在Words amount ,Density中也可以對填充內(nèi)容進(jìn)行設(shè)計(jì)。
Style:詞云設(shè)計(jì),主要涉及關(guān)鍵詞具體內(nèi)容的編輯設(shè)計(jì)。通過參數(shù)調(diào)整,對背景以及底色進(jìn)行編輯修改。
1.3 生成詞云:單擊Visualize,即可生成詞云圖并預(yù)覽效果。 1.4 導(dǎo)出圖片:點(diǎn)擊DOWNLOAD (選擇圖片格式)即可下載詞云圖。 ? 2、借助開源軟件 word-cloud是一款為 java 設(shè)計(jì)的云圖生成工具。目前該項(xiàng)目開源,地址在https://github.com/houbb/word-cloud
特性
極簡 api,一行代碼搞定一切
支持自定義云圖背景
支持中英文分詞,默認(rèn)對用戶透明
支持停頓詞過濾,默認(rèn)對用戶透明
支持各種用戶自定義配置
Maven引入
使用com.github.houbb word-cloud 1.2.2
WordCloudHelper.wordCloud("該作講述的是一個(gè)名為德特茅斯的衰落小鎮(zhèn)下掩埋著一個(gè)古老的廢棄王國,名叫圣巢。這個(gè)王國被瘟疫所侵蝕而廢棄,廢棄的原因則是因?yàn)槊麨檩椆獾墓庵派?,她可以通過思想來傳播瘟疫,被瘟疫侵蝕的蟲子都會(huì)被本能所支配,失去心智。 " + "這個(gè)王國的主人——蒼白之王,自然不會(huì)坐視不管,他在圣巢范圍之下的深淵,利用另一種遠(yuǎn)古力量“虛空”可以壓制光明的特性,制造了容器一族。其中一位被選中的容器用來封印瘟疫,并被命名為空洞騎士。為了封印的穩(wěn)固,白王尋找了三個(gè)守夢人來進(jìn)一步鞏固封印,三位守夢人的名稱分別為守望者 - 盧瑞恩,導(dǎo)師 - 莫諾蒙,野獸 - 赫拉。但之后蒼白之王不知去向,不完美的容器的力量的也變得逐漸虛弱,最終被輻光控制。主角就要穿過圣巢的各地,在安息之地中,我們受到曾經(jīng)輻光的信徒和眷族——飛蛾族唯一留下的族人的幫助,獲得了和輻光力量同源的夢之武器——夢之釘。夢之釘可以讀取生物內(nèi)心的想法,并可以打破守夢人的保護(hù),進(jìn)入到其夢境之中殺死守夢人。殺死了三位守夢人并解開封印后,可選的結(jié)局有到達(dá)十字路里的黑卵神殿打敗空洞騎士或去到在“尋神者”更新中新加入的地點(diǎn)“神居”并挑戰(zhàn)圣巢萬神殿。");添加背景
//以鯨魚的背景,可以讓文字以圖像的形式展現(xiàn): String imagePath = "backgrounds\whale_small.png"; WordCloudHelper.wordCloud(text,"out_bg.png",imagePath);效果如下 3、使用python工具 使用Python庫jieba,jieba是一個(gè)非常好用的中文工具,是以分詞起家的,但是功能比分詞要強(qiáng)大很多。 jieba分詞有三種模式: jieba.cut返回的結(jié)構(gòu)都是一個(gè)可迭代的 generator,可以使用 for 循環(huán)來獲得分詞后得到的每一個(gè)詞語(unicode)。
jieba.cut方法接受三個(gè)輸入參數(shù):
需要分詞的字符串
cut_all 參數(shù)用來控制是否采用全模式,一般情況下,cut_all為False
HMM 參數(shù)用來控制是否使用 HMM 模型
示例: 使用“Star.jpg”作為模板圖片和“myword.txt”文本制作詞云圖 Star.jpg
myword.txt
略
詳細(xì)代碼
###導(dǎo)入庫 #導(dǎo)入wordcloud詞云制作第三方庫,并導(dǎo)入WordCloud.ImageColorGenerator兩個(gè)模塊 from wordcloud import WordCloud.imageColorGenerator #導(dǎo)入imageio庫 importimageio # 導(dǎo)入jieba庫 importjieba ### 圖片處理 # 用imageio庫中的imread函數(shù)讀取本地圖片 testmg=imageio.imread("Star.jpg") # 調(diào)用wordcloud庫中的ImageColorGenerator函數(shù) image_color=ImageColorGenerator(testimg) # 給WordCloud函數(shù)傳入?yún)?shù)設(shè)置圖片相關(guān)屬性 test=WordCloud(mask=testimg,#將testng的值賦值給mask用作遮罩圖 width=500,#輸出圖片寬度為500px height=500,#輸出圖片高度為500px background_color="white",#輸出圖片背景顏色為白色 font-path="msyh.ttc"#字體路徑為微軟雅黑 scale=15)#畫布放大比例為15 ###文本處理 # 引用外部文件,并用utf-8的編碼方式 txt=open("myword.txt",encoding="utf-8").read() # 調(diào)用詞云對象test的generate方法,導(dǎo)入文本 # 使用jieba分詞的精確模式為文本進(jìn)行分詞 test=test.recolor(color_func=image_color) ###輸出處理 #將生成的詞云保存為result.png圖片文件,保存到當(dāng)前文件夾中 test.to_file("result.png")效果圖
詞云圖不僅能用來突出關(guān)鍵詞,減少信息冗余,還能用于用戶圖像分析,快來試試吧。
-
JAVA
+關(guān)注
關(guān)注
19文章
2946瀏覽量
104362 -
軟件
+關(guān)注
關(guān)注
69文章
4611瀏覽量
86984 -
生成器
+關(guān)注
關(guān)注
7文章
313瀏覽量
20919
原文標(biāo)題:三種制作詞云圖的方法,你覺得用哪一種更方便?
文章出處:【微信號:IoTMaker,微信公眾號:機(jī)智云開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論