創新互聯www.cdcxhl.cn八線動態BGP香港云服務器提供商,新人活動買多久送多久,劃算不套路!
成都創新互聯是一家朝氣蓬勃的網站建設公司。公司專注于為企業提供信息化建設解決方案。從事網站開發,網站制作,網站設計,網站模板,微信公眾號開發,軟件開發,微信小程序,十載建站對紗窗等多個行業,擁有多年的網站推廣經驗。這篇文章主要介紹了python3中提取漢字的方法是什么,具有一定借鑒價值,需要的朋友可以參考下。希望大家閱讀完這篇文章后大有收獲。下面讓小編帶著大家一起了解一下。
采用正則表達式的方法對字符串進行處理。
str1 = "{我%$是,《速$@.度\發》中 /國、人"
(1)提取漢字
漢字的范圍為”\u4e00-\u9fa5“,這個是用Unicode表示的。
import re res1 = ''.join(re.findall('[\u4e00-\u9fa5]',str1)) print(res1)
輸出為:
‘我是速度發中國人’
(2)去除所有符號。采用清理數據,僅保留字母、數字、中文的方法。
import re res1 = re.sub("[^a-zA-Z0-9\u4e00-\u9fa5]", '', str1) print(res1)
輸出為:
‘我是速度發中國人’
感謝你能夠認真閱讀完這篇文章,希望小編分享python3中提取漢字的方法是什么內容對大家有幫助,同時也希望大家多多支持創新互聯,關注創新互聯-成都網站建設公司行業資訊頻道,遇到問題就找創新互聯,詳細的解決方法等著你來學習!
當前文章:python3中提取漢字的方法是什么-創新互聯
網站地址:http://vcdvsql.cn/article8/ejhop.html
成都網站建設公司_創新互聯,為您提供響應式網站、網站內鏈、營銷型網站建設、ChatGPT、標簽優化、外貿建站
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯