bl双性强迫侵犯h_国产在线观看人成激情视频_蜜芽188_被诱拐的少孩全彩啪啪漫画

java詞云代碼 java 詞云

R語言wordcloud2自定義詞云圖片不顯示詞云

public static void main(String[] args) {

10年積累的網站制作、做網站經驗,可以快速應對客戶對網站的新想法和需求。提供各種問題對應的解決方案。讓選擇我們的客戶得到更好、更有力的網絡服務。我雖然不認識你,你也不認識我。但先網站制作后付款的網站建設流程,更有橫縣免費網站建設讓你可以放心的選擇與我們合作。

// 創建一個長度為10的數組

int[] is = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 };

// 打印

print(is);

// 設定從命令行讀入數據

Scanner scanner = new Scanner(System.in);

// 一直等待輸入直到主動中職

while (scanner.hasNext()) {

int input = scanner.nextInt();

is = remove(is, input);

print(is);

}

}

/**

* 從數組中找出這個數并干掉,然后返回新的數組

*

* @param is

* @param input

*/

private static int[] remove(int[] is, int input) {

// 因為返回數組長度未知,所以使用動態數組

ArrayListInteger list = new ArrayListInteger();

for (int index = 0; index is.length; index++) {

if (is[index] != input)

list.add(is[index]);

}

// 復制到并返回

int[] is_return = new int[list.size()];

for (int index = 0; index list.size(); index++) {

is_return[index] = list.get(index).intValue();

}

return is_return;

}

/**

* 為便于調試,打印每次變動后的數組

*

* @param is

*/

private static void print(int[] is) {

System.out.println("print array");

for (int i : is) {

System.out.print(i + " ");

}

System.out.println("\r\nprint array end");

}

0無幫助

python中對已經排好序的詞語怎么做詞云

期末復習比較忙過段時間來專門寫scrapy框架使用,今天介紹如何用python生成詞云,雖然網上有很多詞云生成工具,不過自己用python來寫是不是更有成就感。

今天要生成的是勵志歌曲的詞云,百度文庫里面找了20來首,如《倔強》,海闊天空是,什么的大家熟悉的。

所要用到的python庫有 jieba(一個中文分詞庫)、wordcould 、matplotlib、PIL、numpy。

首先我們要做的是讀取歌詞。我將歌詞存在了文件目錄下勵志歌曲文本中。

現在來讀取他

12345

#encoding=gbklyric= ''f=open('./勵志歌曲歌詞.txt','r')for i in f:??lyric+=f.read()

加入#encoding=gbk是為了防止后面操作報錯SyntaxError: Non-UTF-8 code starting with '\xc0'

然后我們用jieba分詞來對歌曲做分詞提取出詞頻高的詞

123456

import jieba.analyseresult=jieba.analyse.textrank(lyric,topK=50,withWeight=True)keywords = dict()for i in result:??keywords[i[0]]=i[1]print(keywords)

得到結果:

然后我們就可以通過wrodcloud等庫來生成詞云了

首先先自己找一張圖片來作為生成詞云的形狀的圖

12345678910111213

from PIL import Image,ImageSequenceimport numpy as npimport matplotlib.pyplot as pltfrom wordcloud import WordCloud,ImageColorGeneratorimage= Image.open('./tim.jpg')graph = np.array(image)wc = WordCloud(font_path='./fonts/simhei.ttf',background_color='White',max_words=50,mask=graph)wc.generate_from_frequencies(keywords)image_color = ImageColorGenerator(graph)plt.imshow(wc)plt.imshow(wc.recolor(color_func=image_color))plt.axis("off")plt.show()

保存生成圖片

1

wc.to_file('dream.png')

完整代碼:

1234567891011121314151617181920212223242526272829

#encoding=gbkimport jieba.analysefrom PIL import Image,ImageSequenceimport numpy as npimport matplotlib.pyplot as pltfrom wordcloud import WordCloud,ImageColorGeneratorlyric= ''f=open('./勵志歌曲歌詞.txt','r')for i in f:??lyric+=f.read()??result=jieba.analyse.textrank(lyric,topK=50,withWeight=True)keywords = dict()for i in result:??keywords[i[0]]=i[1]print(keywords)??image= Image.open('./tim.jpg')graph = np.array(image)wc = WordCloud(font_path='./fonts/simhei.ttf',background_color='White',max_words=50,mask=graph)wc.generate_from_frequencies(keywords)image_color = ImageColorGenerator(graph)plt.imshow(wc)plt.imshow(wc.recolor(color_func=image_color))plt.axis("off")plt.show()wc.to_file('dream.png')

以上這篇python生成詞云的實現方法(推薦)就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。

詞云圖中,文字的大小是有什么決定的

云圖中的每個字的大小與出現的頻率或次數成正比,詞云圖的統計意義不是特別大,主要是為了美觀,用于博客和網站比較常見。

導入數據

library(tm)

library(wordcloud)

Text1-paste(scan("Text1.txt",what=character(0),sep=""),collapse="")

Text2-paste(scan("Text2.txt",what=character(0),sep=""),collapse="")

TEXT-data.frame(c(Text1,Text2),row.names=c("Text1","Text2"))

TEXT_title-data.frame(doc_id=row.names(TEXT),text=TEXT$c.Text1..Text2.

復制

)#這里的doc_id不可替換成別的詞

創建數據框格式的文本

#創建數據框格式的文本,第一列是doc_id,第二列是文章內容

TEXT_ds-DataframeSource(TEXT_title)

復制

構建語料庫

Corpus-VCorpus(TEXT_ds)

復制

針對語料庫文本轉換

思路:刪除語料庫中的標點符號,字母轉換為小寫,刪除數字,刪除空白字符,過濾掉停止詞庫之后轉換為純文本。

Corpus-tm_map(Corpus,removePunctuation)#刪除標點符號

Corpus-tm_map(Corpus,tolower)#轉換為小寫

Corpus-tm_map(Corpus,removeNumbers)#刪除數字

Corpus - tm_map(Corpus,stripWhitespace)#刪除空白字符

Corpus - tm_map(Corpus,function(x){removeWords(x,stopwords())})

Corpus - tm_map(Corpus,PlainTextDocument)#轉換為純文本

復制

針對語料庫斷字處理,生成詞頻權重矩陣

Term_matrix-TermDocumentMatrix(Corpus)

Term_matrix

TermDocumentMatrix (terms: 2462, documents: 2)

Non-/sparse entries: 3215/1709

Sparsity : 35%

Maximal term length: 16

Weighting : term frequency (tf)

復制

查看Term_matrix得知2篇文章共2456個字,稀疏度為35%,最大詞長度是16。

#計算頻率

Term_matrix-as.matrix(Term_matrix)

復制

#對詞頻權重矩陣的表頭進行命名

colnames(Term_matrix)-c("Text1","Text2")

復制

#把矩陣轉為便于后續統計分析的數據框

Data-data.frame(Term_matrix)

復制

#導出兩篇文章的頻率分析結果,文件名為Term_matrix

write.csv(Data,'Term_matrix.csv')

復制

讀取文件

read.csv('Term_matrix.csv',header=TRUE,row.names=1)

復制

#分開繪制兩篇文章的詞云

wordcloud(row.names(Data),Data$Text1,min.freq=9.5,col=brewer.pal(8,"Dark2"),rot.per=0.3)

復制

wordcloud(row.names(Data),Data$Text2,min.freq=9.5,col=brewer.pal(8,"Dark2"),rot.per=0.2)

復制

#兩篇文章對比

comparison.cloud(Data,max.words=250,random.order=FALSE,colors=c("#00B2FF","#084081"))

復制

#通過設置max.word的大小決定顯示圖中文本的多少。

兩篇文章共有詞部分

commonality.cloud(Data,max.words=120,random.order=FALSE,colors="#66A61E")

復制

繪制星形圖

將Data數據計算頻率Freq=n/sum(n),根據頻率繪制星形圖。

wordcloud2(Data1,size=0.4,shape='star')

復制

本文參與 騰訊云自媒體分享計劃,歡迎熱愛寫作的你一起參與!

本文章分享自微信公眾號

菜鳥學數據分析之R語言

作者:劉曉雪

原始發表時間:2020-07-25

如有侵權,請聯系 cloudcommunity@tencent點抗 刪除。

展開閱讀全文

騰訊云圖

文章來自專欄

菜鳥學數據分析之R語言

77 篇文章22 人關注

訂閱

評論 (0)

寫評論

暫無人發表評論

相關文章

Python數據可視化 詞云圖 繪制詞云的方法總結

pyecharts是基于echarts的python庫,能夠繪制多種交互式圖表,和其他可視化庫不一樣,pyecharts支持鏈式調用。

(數據科學學習手札71)在Python中制作個性化詞云圖

詞云圖是文本挖掘中用來表征詞頻的數據可視化圖像,通過它可以很直觀地展現文本數據中地高頻詞:

【數據挖掘 | 可視化】 WordCloud 詞云(附詳細代碼案例)

在七夕節中,博主寫了一篇為女友收集QQ聊天記錄做可視化詞云的文章獲得廣泛好評,一直有小伙伴希望能出一篇教程,今天他來啦! 一文帶你速通詞云?♂?

R-wordcloud: 詞云圖

好幾位讀者來信說,《R語言數據可視化之美》(增強版)的詞云圖的代碼有問題,我今天更新了一輪,這主要原因在R語言及其包的更新,導致源代碼有可能運行錯誤。R語言的優...

WordCloud詞云庫快速入門(一)

wordcloud是優秀的詞云展示第三方庫,以詞語為基本單位,通過圖形可視化的方式,更加直觀和藝術的展示文本。

Day10.如何給?不易的歌曲做詞云展示

我們經常需要對分析的數據提取常?詞,做詞云展示。?如?些互聯?公司會抓取?戶的畫像,或者每?討論話題的關鍵詞,形成詞云并進?展示。

詞云繪制,推薦三種 Python包外加一個在線網站!

本篇文章先介紹幾種制作詞云的 Python 庫,分別是 WordCloud、StyleCloud、Pyecharts;再加一個在線詞云制作網站;最后通過代碼實操...

關于詞云可視化筆記一(wordcloud和英文詞匯可視化)

一直比較關注數據可視化這塊,對于分詞和詞的可視化卻始終不明就里,直到看到詞云,當時驚為天人,不過詞云的制作還是非常麻煩,直到2017年Python走近我的視野中...

詞云圖,看過沒做過?快來,教你秘籍

今天我們來說一說可視化的問題,如果這個時候我們要對頻數進行可視化的話,我們首先想到的應該是一個什么樣子的圖形呢?很多人可能會說是柱狀圖。還有一些科研喵們,看過我...

使用pyecharts繪制詞云圖-淘寶商品評論展示

詞云圖是一種用來展現高頻關鍵詞的可視化表達,通過文字、色彩、圖形的搭配,產生有沖擊力地視覺效果,而且能夠傳達有價值的信息。

WordCloud 中英文詞云圖繪制,看這一篇就夠了

摘要: 當我們手中有一篇文檔,比如書籍、小說、電影劇本,若想快速了解其主要內容是什么,則可以采用繪制 WordCloud 詞云圖,顯示主要的關鍵詞(高頻詞)這種...

Python帶你看不一樣的《青春有你2》小姐姐之評論內容可視化

詳細介紹和用法可以去github看:,這里不多做介紹,只介紹本次用到的

NLP快速入門:手把手教你用wordcloud做詞云

導讀:在上一章節介紹在Python環境下調用HanLP包進行分詞的基礎上,本文將介紹如何使用wordcloud繪制詞云。盡管目前市面上已經有很多成熟的在線交互詞...

WordCloud 中英文詞云圖繪制,看這一篇就夠了

摘要: 當我們手中有一篇文檔,比如書籍、小說、電影劇本,若想快速了解其主要內容是什么,則可以采用繪制 WordCloud 詞云圖,顯示主要的關鍵詞(高頻詞)這種...

一起用Python來看看川普今年在推特上都發了些什么

川普作為一個推特狂人,上臺以來一共發了一萬多條推特,本文爬取了川普在2020年的全部推特內容并將其繪制成了詞云圖。

詞云圖wordcloud學習筆記

詞云圖,也叫文字云,是對文本中出現頻率較高的“關鍵詞”予以視覺化的展現,詞云圖過濾掉大量的低頻低質的文本信息,使得瀏覽者只要一眼掃過文本就可領略文本的主旨。

excel也那繪制詞云圖哦!還有很多的可視化圖表可挑選!

excel是老牌的數據可視化軟件了,很多方面都已經很完美了,很多的圖表都可以輕松繪制出來,但如果想要做的好看,就需要一些技巧了。

更多文章

社區活動

騰訊云自媒體分享計劃

入駐社區,可分享總價值百萬資源包

邀請好友加入自媒體分享計劃

邀請好友,同享獎勵 30 / 100 / 180 元云服務器代金券

長按識別或截圖保存

關注騰訊云開發者

Copyright ? 2013-2022

Tencent Cloud. All Rights Reserved.

騰訊云 版權所有

點贊

3

評論

stylecloud不使用形狀

stylecloud 是一個 Python 包,它基于流行的 word_cloud 包,并添加了一些有用的功能,從而創建出獨特的詞云。stylecloud 具備以下特點:

為詞云提供(任意大小)的圖標形狀(通過 Font Awesome 5.11.2 獲得);

支持高級調色板(通過 palettable 實現);

為上述調色板提供直接梯度;

支持讀取文本文件,或預生成的 CSV 文件(包含單詞和數字);

提供命令行接口。

更換中文字體,支持中文詞云

stylecloud 包由數據科學家 Max Woolf 創建,是對其 2016 年風格化詞云項目的較正式實現。

640.jpeg

stylecloud 項目地址:

安裝

你可以通過 pip 安裝 stylecloud:

Java

pip3 install stylecloud

使用

你可以通過 Python 腳本使用 stylecloud,也可以直接使用獨立的 CLI app。假如你有一份美國憲法的文本文件 constitution.txt(git上有)

使用以下 Python 腳本:

Bash

import stylecloud

stylecloud.gen_stylecloud(file_path='constitution.txt')

得到如下詞云:

640-1.jpeg

但你可以做到更多!比如使用 Font Awesome 提供的免費圖標更改詞云的形狀,通過 palettable 更改調色板以自定義風格,更改背景顏色,以及最重要的,添加梯度使顏色按照特定方向流動。

Python

import stylecloud

stylecloud.gen_stylecloud(file_path='constitution.txt',

icon_name='fas fa-dog',

palette='colorbrewer.diverging.Spectral_11',

background_color='black',

gradient='horizontal')

你還可以使用 CLI 執行更快速的 stylecloud 生成!對于上文中的旗形 stylecloud,使用:

Bash

stylecloud --file_path constitution.txt

對于更復雜的犬形 stylecloud,使用:

Bash

stylecloud --file_path constitution.txt --icon_name 'fas fa-dog' --palette colorbrewer.diverging.Spectral_11 --background_color black --gradient horizontal

你可以在 stylecloud-examples repo 中查看 stylecloud 的更多示例,比如如何基于 Twitter 和 Reddit 數據制作 stylecloud。

地址:

有用的參數

以下參數對 stylecloud Python 函數和 CLI 均有效,你可以通過 stylecloud -h 獲取這些參數的信息。

text:輸入文本。

file_path:輸入文本/CSV 的文件路徑。

gradient:梯度方向(其默認值是 None,如果它的值不是 None,則 stylecloud 使用了方向性梯度)[default: None]

size:stylecloud 的大小(長度和寬度)[default: 512]

icon_name:stylecloud 形狀的圖標名稱(如 fas fa-grin)[default: fas fa-flag]

palette:調色板(通過 palettable 實現)[default: cartocolors.qualitative.Bold_6]

background_color:背景顏色。[default: white]

max_font_size:stylecloud 中的最大字號。[default: 200]

max_words:stylecloud 可包含的最大單詞數。[default: 2000]

stopwords:布爾值,用于篩除常見禁用詞。[default: True]

output_name:stylecloud 的輸出文本名。[default: stylecloud.png]

font_path:stylecloud 所用字體 .ttf 文件的路徑。[default: uses included Staatliches font]

random_state:控制單詞和顏色的隨機狀態。

stylecloud 的主要目標是為文本數據可視化結果提供獨特的美感。詞云強調統計上可靠的數據可視化,而 stylecloud 更注重「酷」!

stylecloud 包獨立于 word_cloud 單獨發布,因為它的適用范圍和 Python 依賴項均有所增長。

生成優秀 stylecloud 需要的完美字體是:加粗/高字重,以提高可讀性;緊湊/低間距,以容納更多文本。這兩個特點就是 stylecloud 使用 Staatliches 作為默認字體的原因(而不是 base word_cloud 使用的 Droid Sans 字體)。

在生成 stylecloud 后,你可能想做一些后處理:例如添加顏色掩碼,添加感知偏移,將 stylecloud 輸入風格遷移 AI 模型等等。

max_font_size 的默認值 200 與 size 的默認值 512 呈正相關,如要增加 size,你還需要考慮增加 max_font_size 的值。

網站標題:java詞云代碼 java 詞云
網站地址:http://vcdvsql.cn/article32/ddseisc.html

成都網站建設公司_創新互聯,為您提供定制網站企業建站做網站移動網站建設網站導航企業網站制作

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

手機網站建設