用python爬取微信好友信息并且進(jìn)行數(shù)據(jù)清洗,IP海之前已經(jīng)將教程的上半部分進(jìn)行了分解,下面我們繼續(xù)來解決這個(gè)問題,將接下來的兩個(gè)步驟完成。
4、利用簽名繪制詞云
#4、繪制詞云
#4.1 替換簽名中的emoji、span、class、類似<>/= 之類的符號等等
siglist = []
for i in friends:
signature = i["Signature"].strip().replace("span","").replace("class","").replace("emoji","")
rep = re.compile("1fd+w*|[<>/=]")
signature = rep.sub("", signature)
siglist.append(signature)
text = "".join(siglist)
#4.2 把結(jié)巴分詞這個(gè)包搞進(jìn)來分詞
import jieba
wordlist = jieba.cut(text, cut_all=True)
word_space_split = " ".join(wordlist)
#4.3 進(jìn)入畫圖階段,根據(jù)自己想要的圖片、形狀、顏色畫出相似的圖形
import matplotlib.pyplot as plt
from wordcloud import WordCloud, ImageColorGenerator
import numpy as np
import PIL.Image as Image
coloring = np.array(Image.open("101.jpg"))
my_wordcloud = WordCloud(background_color="white", max_words=2000,
mask=coloring, max_font_size=60, random_state=42, scale=2,
font_path="STXINWEI.TTF").generate(word_space_split)
image_colors = ImageColorGenerator(coloring)
plt.imshow(my_wordcloud.recolor(color_func=image_colors))
plt.imshow(my_wordcloud)
plt.axis("off")
plt.show()
5、ggplot圖形展示
#5、ggplot圖形展示
import matplotlib.pyplot as plt
#獲取csv內(nèi)容
df = pd.read_csv('data.csv')
#配置圖
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.hist(df['Sex'], bins=7)
#標(biāo)題
plt.title('Sex distribution')
#X軸標(biāo)題
plt.xlabel('Sex')
#Y軸標(biāo)題
plt.ylabel('people')
plt.show()
以上當(dāng)這些步驟執(zhí)行完之后,我們就能夠?qū)⑽⑿藕糜训幕拘畔⒆ト⊥戤吜恕?/p>
版權(quán)聲明:本文為IP海(iphai.cn)原創(chuàng)作品,未經(jīng)許可,禁止轉(zhuǎn)載!
Copyright © www.fque.cn. All Rights Reserved. IP海 版權(quán)所有.
IP海僅提供中國內(nèi)IP加速服務(wù),無法跨境聯(lián)網(wǎng),用戶應(yīng)遵守《服務(wù)條款》內(nèi)容,嚴(yán)禁用戶使用IP海從事任何違法犯罪行為。
鄂ICP備19030659號-3
鄂公網(wǎng)安備42100302000141號
計(jì)算機(jī)軟件著作權(quán)證
ICP/EDI許可證:鄂B2-20200106