public static void main(String[] args) {
10年積累的網站制作、做網站經驗,可以快速應對客戶對網站的新想法和需求。提供各種問題對應的解決方案。讓選擇我們的客戶得到更好、更有力的網絡服務。我雖然不認識你,你也不認識我。但先網站制作后付款的網站建設流程,更有橫縣免費網站建設讓你可以放心的選擇與我們合作。
// 創建一個長度為10的數組
int[] is = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 };
// 打印
print(is);
// 設定從命令行讀入數據
Scanner scanner = new Scanner(System.in);
// 一直等待輸入直到主動中職
while (scanner.hasNext()) {
int input = scanner.nextInt();
is = remove(is, input);
print(is);
}
}
/**
* 從數組中找出這個數并干掉,然后返回新的數組
*
* @param is
* @param input
*/
private static int[] remove(int[] is, int input) {
// 因為返回數組長度未知,所以使用動態數組
ArrayListInteger list = new ArrayListInteger();
for (int index = 0; index is.length; index++) {
if (is[index] != input)
list.add(is[index]);
}
// 復制到并返回
int[] is_return = new int[list.size()];
for (int index = 0; index list.size(); index++) {
is_return[index] = list.get(index).intValue();
}
return is_return;
}
/**
* 為便于調試,打印每次變動后的數組
*
* @param is
*/
private static void print(int[] is) {
System.out.println("print array");
for (int i : is) {
System.out.print(i + " ");
}
System.out.println("\r\nprint array end");
}
0無幫助
期末復習比較忙過段時間來專門寫scrapy框架使用,今天介紹如何用python生成詞云,雖然網上有很多詞云生成工具,不過自己用python來寫是不是更有成就感。
今天要生成的是勵志歌曲的詞云,百度文庫里面找了20來首,如《倔強》,海闊天空是,什么的大家熟悉的。
所要用到的python庫有 jieba(一個中文分詞庫)、wordcould 、matplotlib、PIL、numpy。
首先我們要做的是讀取歌詞。我將歌詞存在了文件目錄下勵志歌曲文本中。
現在來讀取他
12345
#encoding=gbklyric= ''f=open('./勵志歌曲歌詞.txt','r')for i in f:??lyric+=f.read()
加入#encoding=gbk是為了防止后面操作報錯SyntaxError: Non-UTF-8 code starting with '\xc0'
然后我們用jieba分詞來對歌曲做分詞提取出詞頻高的詞
123456
import jieba.analyseresult=jieba.analyse.textrank(lyric,topK=50,withWeight=True)keywords = dict()for i in result:??keywords[i[0]]=i[1]print(keywords)
得到結果:
然后我們就可以通過wrodcloud等庫來生成詞云了
首先先自己找一張圖片來作為生成詞云的形狀的圖
12345678910111213
from PIL import Image,ImageSequenceimport numpy as npimport matplotlib.pyplot as pltfrom wordcloud import WordCloud,ImageColorGeneratorimage= Image.open('./tim.jpg')graph = np.array(image)wc = WordCloud(font_path='./fonts/simhei.ttf',background_color='White',max_words=50,mask=graph)wc.generate_from_frequencies(keywords)image_color = ImageColorGenerator(graph)plt.imshow(wc)plt.imshow(wc.recolor(color_func=image_color))plt.axis("off")plt.show()
保存生成圖片
1
wc.to_file('dream.png')
完整代碼:
1234567891011121314151617181920212223242526272829
#encoding=gbkimport jieba.analysefrom PIL import Image,ImageSequenceimport numpy as npimport matplotlib.pyplot as pltfrom wordcloud import WordCloud,ImageColorGeneratorlyric= ''f=open('./勵志歌曲歌詞.txt','r')for i in f:??lyric+=f.read()??result=jieba.analyse.textrank(lyric,topK=50,withWeight=True)keywords = dict()for i in result:??keywords[i[0]]=i[1]print(keywords)??image= Image.open('./tim.jpg')graph = np.array(image)wc = WordCloud(font_path='./fonts/simhei.ttf',background_color='White',max_words=50,mask=graph)wc.generate_from_frequencies(keywords)image_color = ImageColorGenerator(graph)plt.imshow(wc)plt.imshow(wc.recolor(color_func=image_color))plt.axis("off")plt.show()wc.to_file('dream.png')
以上這篇python生成詞云的實現方法(推薦)就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
云圖中的每個字的大小與出現的頻率或次數成正比,詞云圖的統計意義不是特別大,主要是為了美觀,用于博客和網站比較常見。
導入數據
library(tm)
library(wordcloud)
Text1-paste(scan("Text1.txt",what=character(0),sep=""),collapse="")
Text2-paste(scan("Text2.txt",what=character(0),sep=""),collapse="")
TEXT-data.frame(c(Text1,Text2),row.names=c("Text1","Text2"))
TEXT_title-data.frame(doc_id=row.names(TEXT),text=TEXT$c.Text1..Text2.
復制
)#這里的doc_id不可替換成別的詞
創建數據框格式的文本
#創建數據框格式的文本,第一列是doc_id,第二列是文章內容
TEXT_ds-DataframeSource(TEXT_title)
復制
構建語料庫
Corpus-VCorpus(TEXT_ds)
復制
針對語料庫文本轉換
思路:刪除語料庫中的標點符號,字母轉換為小寫,刪除數字,刪除空白字符,過濾掉停止詞庫之后轉換為純文本。
Corpus-tm_map(Corpus,removePunctuation)#刪除標點符號
Corpus-tm_map(Corpus,tolower)#轉換為小寫
Corpus-tm_map(Corpus,removeNumbers)#刪除數字
Corpus - tm_map(Corpus,stripWhitespace)#刪除空白字符
Corpus - tm_map(Corpus,function(x){removeWords(x,stopwords())})
Corpus - tm_map(Corpus,PlainTextDocument)#轉換為純文本
復制
針對語料庫斷字處理,生成詞頻權重矩陣
Term_matrix-TermDocumentMatrix(Corpus)
Term_matrix
TermDocumentMatrix (terms: 2462, documents: 2)
Non-/sparse entries: 3215/1709
Sparsity : 35%
Maximal term length: 16
Weighting : term frequency (tf)
復制
查看Term_matrix得知2篇文章共2456個字,稀疏度為35%,最大詞長度是16。
#計算頻率
Term_matrix-as.matrix(Term_matrix)
復制
#對詞頻權重矩陣的表頭進行命名
colnames(Term_matrix)-c("Text1","Text2")
復制
#把矩陣轉為便于后續統計分析的數據框
Data-data.frame(Term_matrix)
復制
#導出兩篇文章的頻率分析結果,文件名為Term_matrix
write.csv(Data,'Term_matrix.csv')
復制
讀取文件
read.csv('Term_matrix.csv',header=TRUE,row.names=1)
復制
#分開繪制兩篇文章的詞云
wordcloud(row.names(Data),Data$Text1,min.freq=9.5,col=brewer.pal(8,"Dark2"),rot.per=0.3)
復制
wordcloud(row.names(Data),Data$Text2,min.freq=9.5,col=brewer.pal(8,"Dark2"),rot.per=0.2)
復制
#兩篇文章對比
comparison.cloud(Data,max.words=250,random.order=FALSE,colors=c("#00B2FF","#084081"))
復制
#通過設置max.word的大小決定顯示圖中文本的多少。
兩篇文章共有詞部分
commonality.cloud(Data,max.words=120,random.order=FALSE,colors="#66A61E")
復制
繪制星形圖
將Data數據計算頻率Freq=n/sum(n),根據頻率繪制星形圖。
wordcloud2(Data1,size=0.4,shape='star')
復制
本文參與 騰訊云自媒體分享計劃,歡迎熱愛寫作的你一起參與!
本文章分享自微信公眾號
菜鳥學數據分析之R語言
作者:劉曉雪
原始發表時間:2020-07-25
如有侵權,請聯系 cloudcommunity@tencent點抗 刪除。
展開閱讀全文
騰訊云圖
文章來自專欄
菜鳥學數據分析之R語言
77 篇文章22 人關注
訂閱
評論 (0)
寫評論
暫無人發表評論
相關文章
Python數據可視化 詞云圖 繪制詞云的方法總結
pyecharts是基于echarts的python庫,能夠繪制多種交互式圖表,和其他可視化庫不一樣,pyecharts支持鏈式調用。
(數據科學學習手札71)在Python中制作個性化詞云圖
詞云圖是文本挖掘中用來表征詞頻的數據可視化圖像,通過它可以很直觀地展現文本數據中地高頻詞:
【數據挖掘 | 可視化】 WordCloud 詞云(附詳細代碼案例)
在七夕節中,博主寫了一篇為女友收集QQ聊天記錄做可視化詞云的文章獲得廣泛好評,一直有小伙伴希望能出一篇教程,今天他來啦! 一文帶你速通詞云?♂?
R-wordcloud: 詞云圖
好幾位讀者來信說,《R語言數據可視化之美》(增強版)的詞云圖的代碼有問題,我今天更新了一輪,這主要原因在R語言及其包的更新,導致源代碼有可能運行錯誤。R語言的優...
WordCloud詞云庫快速入門(一)
wordcloud是優秀的詞云展示第三方庫,以詞語為基本單位,通過圖形可視化的方式,更加直觀和藝術的展示文本。
Day10.如何給?不易的歌曲做詞云展示
我們經常需要對分析的數據提取常?詞,做詞云展示。?如?些互聯?公司會抓取?戶的畫像,或者每?討論話題的關鍵詞,形成詞云并進?展示。
詞云繪制,推薦三種 Python包外加一個在線網站!
本篇文章先介紹幾種制作詞云的 Python 庫,分別是 WordCloud、StyleCloud、Pyecharts;再加一個在線詞云制作網站;最后通過代碼實操...
關于詞云可視化筆記一(wordcloud和英文詞匯可視化)
一直比較關注數據可視化這塊,對于分詞和詞的可視化卻始終不明就里,直到看到詞云,當時驚為天人,不過詞云的制作還是非常麻煩,直到2017年Python走近我的視野中...
詞云圖,看過沒做過?快來,教你秘籍
今天我們來說一說可視化的問題,如果這個時候我們要對頻數進行可視化的話,我們首先想到的應該是一個什么樣子的圖形呢?很多人可能會說是柱狀圖。還有一些科研喵們,看過我...
使用pyecharts繪制詞云圖-淘寶商品評論展示
詞云圖是一種用來展現高頻關鍵詞的可視化表達,通過文字、色彩、圖形的搭配,產生有沖擊力地視覺效果,而且能夠傳達有價值的信息。
WordCloud 中英文詞云圖繪制,看這一篇就夠了
摘要: 當我們手中有一篇文檔,比如書籍、小說、電影劇本,若想快速了解其主要內容是什么,則可以采用繪制 WordCloud 詞云圖,顯示主要的關鍵詞(高頻詞)這種...
Python帶你看不一樣的《青春有你2》小姐姐之評論內容可視化
詳細介紹和用法可以去github看:,這里不多做介紹,只介紹本次用到的
NLP快速入門:手把手教你用wordcloud做詞云
導讀:在上一章節介紹在Python環境下調用HanLP包進行分詞的基礎上,本文將介紹如何使用wordcloud繪制詞云。盡管目前市面上已經有很多成熟的在線交互詞...
WordCloud 中英文詞云圖繪制,看這一篇就夠了
摘要: 當我們手中有一篇文檔,比如書籍、小說、電影劇本,若想快速了解其主要內容是什么,則可以采用繪制 WordCloud 詞云圖,顯示主要的關鍵詞(高頻詞)這種...
一起用Python來看看川普今年在推特上都發了些什么
川普作為一個推特狂人,上臺以來一共發了一萬多條推特,本文爬取了川普在2020年的全部推特內容并將其繪制成了詞云圖。
詞云圖wordcloud學習筆記
詞云圖,也叫文字云,是對文本中出現頻率較高的“關鍵詞”予以視覺化的展現,詞云圖過濾掉大量的低頻低質的文本信息,使得瀏覽者只要一眼掃過文本就可領略文本的主旨。
excel也那繪制詞云圖哦!還有很多的可視化圖表可挑選!
excel是老牌的數據可視化軟件了,很多方面都已經很完美了,很多的圖表都可以輕松繪制出來,但如果想要做的好看,就需要一些技巧了。
更多文章
社區活動
騰訊云自媒體分享計劃
入駐社區,可分享總價值百萬資源包
邀請好友加入自媒體分享計劃
邀請好友,同享獎勵 30 / 100 / 180 元云服務器代金券
長按識別或截圖保存
關注騰訊云開發者
Copyright ? 2013-2022
Tencent Cloud. All Rights Reserved.
騰訊云 版權所有
點贊
3
評論
轉
stylecloud 是一個 Python 包,它基于流行的 word_cloud 包,并添加了一些有用的功能,從而創建出獨特的詞云。stylecloud 具備以下特點:
為詞云提供(任意大小)的圖標形狀(通過 Font Awesome 5.11.2 獲得);
支持高級調色板(通過 palettable 實現);
為上述調色板提供直接梯度;
支持讀取文本文件,或預生成的 CSV 文件(包含單詞和數字);
提供命令行接口。
更換中文字體,支持中文詞云
stylecloud 包由數據科學家 Max Woolf 創建,是對其 2016 年風格化詞云項目的較正式實現。
640.jpeg
stylecloud 項目地址:
安裝
你可以通過 pip 安裝 stylecloud:
Java
pip3 install stylecloud
使用
你可以通過 Python 腳本使用 stylecloud,也可以直接使用獨立的 CLI app。假如你有一份美國憲法的文本文件 constitution.txt(git上有)
使用以下 Python 腳本:
Bash
import stylecloud
stylecloud.gen_stylecloud(file_path='constitution.txt')
得到如下詞云:
640-1.jpeg
但你可以做到更多!比如使用 Font Awesome 提供的免費圖標更改詞云的形狀,通過 palettable 更改調色板以自定義風格,更改背景顏色,以及最重要的,添加梯度使顏色按照特定方向流動。
Python
import stylecloud
stylecloud.gen_stylecloud(file_path='constitution.txt',
icon_name='fas fa-dog',
palette='colorbrewer.diverging.Spectral_11',
background_color='black',
gradient='horizontal')
你還可以使用 CLI 執行更快速的 stylecloud 生成!對于上文中的旗形 stylecloud,使用:
Bash
stylecloud --file_path constitution.txt
對于更復雜的犬形 stylecloud,使用:
Bash
stylecloud --file_path constitution.txt --icon_name 'fas fa-dog' --palette colorbrewer.diverging.Spectral_11 --background_color black --gradient horizontal
你可以在 stylecloud-examples repo 中查看 stylecloud 的更多示例,比如如何基于 Twitter 和 Reddit 數據制作 stylecloud。
地址:
有用的參數
以下參數對 stylecloud Python 函數和 CLI 均有效,你可以通過 stylecloud -h 獲取這些參數的信息。
text:輸入文本。
file_path:輸入文本/CSV 的文件路徑。
gradient:梯度方向(其默認值是 None,如果它的值不是 None,則 stylecloud 使用了方向性梯度)[default: None]
size:stylecloud 的大小(長度和寬度)[default: 512]
icon_name:stylecloud 形狀的圖標名稱(如 fas fa-grin)[default: fas fa-flag]
palette:調色板(通過 palettable 實現)[default: cartocolors.qualitative.Bold_6]
background_color:背景顏色。[default: white]
max_font_size:stylecloud 中的最大字號。[default: 200]
max_words:stylecloud 可包含的最大單詞數。[default: 2000]
stopwords:布爾值,用于篩除常見禁用詞。[default: True]
output_name:stylecloud 的輸出文本名。[default: stylecloud.png]
font_path:stylecloud 所用字體 .ttf 文件的路徑。[default: uses included Staatliches font]
random_state:控制單詞和顏色的隨機狀態。
stylecloud 的主要目標是為文本數據可視化結果提供獨特的美感。詞云強調統計上可靠的數據可視化,而 stylecloud 更注重「酷」!
stylecloud 包獨立于 word_cloud 單獨發布,因為它的適用范圍和 Python 依賴項均有所增長。
生成優秀 stylecloud 需要的完美字體是:加粗/高字重,以提高可讀性;緊湊/低間距,以容納更多文本。這兩個特點就是 stylecloud 使用 Staatliches 作為默認字體的原因(而不是 base word_cloud 使用的 Droid Sans 字體)。
在生成 stylecloud 后,你可能想做一些后處理:例如添加顏色掩碼,添加感知偏移,將 stylecloud 輸入風格遷移 AI 模型等等。
max_font_size 的默認值 200 與 size 的默認值 512 呈正相關,如要增加 size,你還需要考慮增加 max_font_size 的值。
網站標題:java詞云代碼 java 詞云
網站地址:http://vcdvsql.cn/article32/ddseisc.html
成都網站建設公司_創新互聯,為您提供定制網站、企業建站、做網站、移動網站建設、網站導航、企業網站制作
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯