python3中提取漢字的方法是什么-創新互聯

創新互聯www.cdcxhl.cn八線動態BGP香港云服務器提供商，新人活動買多久送多久，劃算不套路！

成都創新互聯是一家朝氣蓬勃的網站建設公司。公司專注于為企業提供信息化建設解決方案。從事網站開發，網站制作，網站設計，網站模板，微信公眾號開發，軟件開發，微信小程序，十載建站對紗窗等多個行業，擁有多年的網站推廣經驗。

這篇文章主要介紹了python3中提取漢字的方法是什么，具有一定借鑒價值，需要的朋友可以參考下。希望大家閱讀完這篇文章后大有收獲。下面讓小編帶著大家一起了解一下。

采用正則表達式的方法對字符串進行處理。

str1 = "｛我%$是，《速$@.度\發》中 /國、人"

（1）提取漢字

漢字的范圍為”\u4e00-\u9fa5“，這個是用Unicode表示的。

import re
res1 = ''.join(re.findall('[\u4e00-\u9fa5]',str1))
print(res1)

輸出為：

‘我是速度發中國人’

（2）去除所有符號。采用清理數據，僅保留字母、數字、中文的方法。

import re
res1 = re.sub("[^a-zA-Z0-9\u4e00-\u9fa5]", '', str1) 
print(res1)

輸出為：

‘我是速度發中國人’

感謝你能夠認真閱讀完這篇文章，希望小編分享python3中提取漢字的方法是什么內容對大家有幫助，同時也希望大家多多支持創新互聯，關注創新互聯-成都網站建設公司行業資訊頻道，遇到問題就找創新互聯，詳細的解決方法等著你來學習!

聲明：本網站發布的內容（圖片、視頻和文字）以用戶投稿、用戶轉載內容為主，如果涉及侵權請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網站立場，如需處理請聯系客服。電話：028-86922220；郵箱：631063699@qq.com。內容未經允許不得轉載，或轉載時需注明來源：創新互聯

猜你還喜歡下面的內容

bl双性强迫侵犯h_国产在线观看人成激情视频_蜜芽188_被诱拐的少孩全彩啪啪漫画