轉(zhuǎn)載請參見文章末尾處的要求。【感謝張佳偉(@ghosert)的熱心翻譯。如果其他朋友也有不錯的原創(chuàng)或譯文,可以嘗試推薦給伯樂在線。】這是一篇(長)博文, 介紹了我們在 Repustate 遷移大量 Python/Cython 代碼到 Go 語言的經(jīng)驗。如果你想了解整個故事,背景和所有的事情,請繼續(xù)往下讀。如果你只是想了解 Python 開發(fā)者在一頭扎進 Go 語言前需要了解什么,請點擊一下鏈接:從Python遷移到Go的建議(Tips Tricks) 背景在Repustate,我們完成過的最棒的技術(shù)成就之一是實現(xiàn)了阿拉伯語的情感分析。阿拉伯語是一塊難啃的硬骨頭,因為它的詞形變化相當(dāng)復(fù)雜。比起譬如英語,阿拉伯語的分詞(將一個句子切分呈幾個獨立的單詞)也更困難,因為阿拉伯語的單詞本身還可能會包含空白字符(例如:“阿列夫”在一個單詞里的位置)。這也談不上是泄密,Repustate 使用支持向量機(SVM)來獲取一個句子背后最有可能的含義,并在其中加上情感元素。 總體上來說,我們使用了 22 種模型(22 個 SVM) 并且在一篇文檔中,每一個單詞我們都會加以分析。因此如果你有一篇 500 字的文檔,那么基于 SVM,會進行十萬次的比較。 PythonRepustate 幾乎完全就是一個 Python 商店。我們使用 Django 來實現(xiàn) API 和網(wǎng)站。因此(目前)為了保持代碼一致,同時使用 Python 來實現(xiàn)阿拉伯語情感引擎是合情合理的。只是做原型和實現(xiàn)的話,Python 是很好的選擇。它的表達能力很強悍,第三方類庫等等也很好。如果你就是為了Web服務(wù),Python 很完美。但是當(dāng)你進行低級別的計算,大量依賴于哈希表(Python 里的字典類型)做比較的時候,一切都變慢了。我們每秒能處理大約兩到三個阿拉伯文檔,但是這太慢了。比較下來,我們的英語情感引擎每秒能處理大約五百份文檔。 瓶頸因此我們開啟了 Python 分析器,開始調(diào)查是什么地方用了那么長時間。還記得我前面說過我們有 22 個 SVM 并且每個單詞都需要經(jīng)過處理嗎?好吧,這些都是線性處理的,非并行處理。所以我們的第一反應(yīng)是把線性處理改成 map/reduce 那樣的操作。簡單來說:Python 不太適合用作 map/reduce。當(dāng)你需要并發(fā)的時候,Python 算上好用。在 2013 Python 大會上(譯者:PyCon 2013),Guido 談到了 Tulip,他的這個新項目正在彌補 Python 這方面的不足,不過得過段一段時間才能推出,但是如果已經(jīng)有了更好用的東西,我們?yōu)槭裁催€要等呢? 選Go 語言,還是回家算了?我在Mozilla的朋友告訴我,Mozilla 內(nèi)部正在將他們大量的基礎(chǔ)日志架構(gòu)切換到 Go 語言上,部分原因是因為強大的 [goroutines]。Go 語言是 Google 的人設(shè)計的,并且在設(shè)計之初就把支持并發(fā)作為第一要務(wù),而不是像 Python 的各種解決方案那樣是事后才加上去的。因此我們開始著手把 Python 換成 Go 語言。雖然Go 代碼還不算正式上線的產(chǎn)品,但是結(jié)果非常令人鼓舞。我們現(xiàn)在能做到每秒處理一千份文檔,使用更少的內(nèi)存,還不用調(diào)試你在 Python 里遇到:丑陋的多進程/gevent/“為什么 Control-C 殺不了進程”這些問題。 為什么我們喜歡 Go 語言任何人,對編程語言是如何工作(解釋型 vs 編譯型, 動態(tài)語言 vs 靜態(tài)語言)有一點理解的話,會說,“切,當(dāng)然 Go 語言會更快”。是的,我們也可以用 Java 把所有的東西重寫一遍,也能看到類似更快的改善,但那不是 Go 語言勝出的原因。你用 Go 寫的代碼好像就是對的。我搞不清楚到底是怎么回事,但是一旦代碼被編譯了(編譯速度很快),你就會覺得這代碼能工作(不只是跑起來不會錯,而且甚至邏輯上也是對的)。我知道,這聽上去不太靠譜,但是確實如此。這和 Python 在冗余(或非冗余)方面非常類似,它把函數(shù)作為第一目標,因此函數(shù)編程會很容易想明白。而且當(dāng)然,go 線程和通道讓你的生活更容易,你可以得到靜態(tài)類型帶來的性能大提升,還能更精細的控制內(nèi)存分配,而你卻不必為此在語言表達力上付出太多的代價。 希望能早點知道的事情(Tips Tricks)除去所有這些贊美之詞以后,有時你真的需要在處理 Go 代碼的時候,相對于 Python,改變一下思維方式。因此這是我在遷移代碼時記錄的筆記清單 —— 只是在我把 Python 代碼轉(zhuǎn)換到 Go 時從我腦子里隨機冒出來的點子:沒有內(nèi)建的集合類型(必須使用map,并檢查是否存在)因為沒有集合,必須自己寫交集,并集之類的方法沒有tuples 類型,必須寫你自己的結(jié)構(gòu),或者使用 slices (即數(shù)組)沒有類似 \__getattr__() 的方法,你必須總是檢查存在性,而不是設(shè)置默認值,例如,在 Python 里,你可以這樣寫 value = dict.get(“a_key”, “default_value”)必須總是檢查錯誤(或者顯式的忽略錯誤)不能有變量/包沒被使用,因此簡單的測試也需要有時注掉一些代碼在[] byte 和 string 之間轉(zhuǎn)換。 regexp 使用 [] byte (不可變)。這是對的,但是老把一些變量轉(zhuǎn)換來轉(zhuǎn)換去很煩人Python 更寬松。你可以使用超出范圍的索引在字符串里取一個片段,而且不會出錯。你還可以用負數(shù)取出片段,但是 Go 不行你不能混合數(shù)據(jù)結(jié)構(gòu)類型。也許這樣也不太干凈,但是有時在 Python 里,我會使用值是混合了字符串和列表的字典。但是 Go 不行,你不得不清理干凈你的數(shù)據(jù)結(jié)構(gòu)或者使用自定義的結(jié)構(gòu)不能解包一個 tuple 或者 list 到幾個不同的變量(例如:x, y, z = [1, 2, 3])駝峰式命名風(fēng)格(如果你沒有首字大寫方法名/結(jié)構(gòu)名,他們不會被暴露給其它的包)。我更喜歡 Python 的小寫字母加下劃線命名風(fēng)格。必須顯式檢查是否有錯誤 != nil, 不像在 Python 里,許多類型可以像 bool 那樣檢查 (0, “”, None 都可以被解釋成 “非” 集合)文檔在一些模塊上太散亂了,例如(crypto/md5),但是 IRC 上的 go-nuts 很好用,提供了巨大的幫助。從數(shù)字到字符串的轉(zhuǎn)換(int64 - string) 和 []byte - string (只要使用 string([]byte))不太一樣。需要使用 strconv。閱讀Go 代碼比起 Python 那樣寫起來如偽代碼的語言更像一門編程語言, Go 有更多的非字母數(shù)字字符,并且使用 || 和 , 而不是 “or”和“and”寫一個文件的話,有 File.Write([]byte) 和 File.WriteString(string), 這點和 Python 開發(fā)者的 Python 之道:“解決問題就一種方法 ”相違背。修改字符串很困難,必須經(jīng)常重排 fmt.Sprintf沒有構(gòu)造函數(shù),因此慣用法是創(chuàng)建 NewType() 方法來返回你要的結(jié)構(gòu)Else (或者 else if)必須正確格式化,else 得和 if 配對的大括號在同一行。奇怪。賦值運算符取決于在函數(shù)內(nèi)還是函數(shù)外,例如,= 和 :=如果我只想要“鍵”或者只想要 “值”,譬如: dict.keys() 或者 dict.values(),或者一個 tuples 的列表,例如:dict.items(),在 Go 語言里沒有等價的東西,你只能自己枚舉 map 來構(gòu)造你的列表類型我有時使用一種習(xí)慣用法:構(gòu)造一個值是函數(shù)的字典類型,我想通過給定的鍵值調(diào)用這些函數(shù),你在 Go 里可以做到,但是所有的函數(shù)必須接受,返回相同的東西,例如:相同的方法簽名如果你使用 JSON 并且 你的 JSON 是一個復(fù)合類型,恭喜你。 你必須構(gòu)造自定義的結(jié)構(gòu)匹配 JSON 塊里的格式,然后把原始 JSON 解析到你自定義結(jié)構(gòu)的實例中去。比起 Python 世界里 object = json.loads(json_blob) 要做更多的工作 是不是值得?值得,一百萬倍的值得。速度的提升太多了,以致很難舍棄。同時,我認為, Go 是目前趨勢所在,因此在招新員工的時候,我認為把 Go 當(dāng)作 Repustate 技術(shù)積累的重要一環(huán)會很有幫助。]
創(chuàng)新互聯(lián)建站2013年至今,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項目成都網(wǎng)站設(shè)計、做網(wǎng)站、成都外貿(mào)網(wǎng)站建設(shè)公司網(wǎng)站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元松北做網(wǎng)站,已為上家服務(wù),為松北各地企業(yè)和個人服務(wù),聯(lián)系電話:028-86922220
本質(zhì)上,是作為文件處理的,發(fā)送是“write,print”,接受是“read”。
連接相當(dāng)于打開文件。
我是有web開發(fā)經(jīng)驗,但是完全不懂go語言,算是0基礎(chǔ)吧,感覺學(xué)起來還行。平時是在慕課網(wǎng)看GO開發(fā)工程師體系課,先從簡單的語言基礎(chǔ)學(xué),然后會涉及全棧項目、微服務(wù)、分布式,從安排上看挺貼合企業(yè)實際生產(chǎn),總體感覺還算可以。
英語是學(xué)習(xí)編程的第一塊敲門磚
世界上第一臺通用計算機“ENIAC”于1946年2月14日在美國賓夕法尼亞大學(xué)誕生。發(fā)明人是美國人莫克利(JohnW.Mauchly)和艾克特(J.PresperEckert),美國國防部用它來進行彈道計算。
此后電腦發(fā)展日新月異,美國也一直引領(lǐng)著計算機發(fā)展的潮流,同樣在程序開發(fā)語言上也是美國一枝獨秀,從最原始的匯編語言,C,LISP,F(xiàn)ortran,到現(xiàn)在一直火透半邊天的Java,Python,PHP,Go語言等等,無不都使用英語表達媒介,來表述編程語言的內(nèi)容。
究其根本,英語就是所有編程語言的核心,看看我們電腦上的鍵盤就知道了,除了數(shù)字和符號之外,有的就是26個英文字母。舉個栗子,Java中對于類的定義要用class關(guān)鍵字,訪問權(quán)限要使用private,protected,public,靜態(tài)變量要使用static關(guān)鍵字等等,匯總到下圖
如果對于英語比較好的同學(xué),如果你想入門編程的話,看到這些熟悉的英文單詞關(guān)鍵字是不是有種非常happy的感覺?至少能夠根據(jù)每個單詞,對這門語言中的關(guān)鍵字要表達的意思猜出個八九不離十來。
英語是編程進階的不二法寶
大劉平時在頭條上轉(zhuǎn)載的視頻是英語聽力,口語對話為主的內(nèi)容,所有會有很多朋友私信問我,為什么你一個軟件工程師天天發(fā)的都是英語學(xué)習(xí)資料呢?
這個問題問的好,大劉不光在發(fā)轉(zhuǎn)載的視頻,每天也都在做視頻的內(nèi)容解析工作,視頻的語法點在哪里?這個視頻對我有什么幫助,自己分析一遍,寫到公號和頭條上,變成圖片和文字的課程解析,對自己的英語學(xué)習(xí)也是一種提高。
如果你入門了編程這行,那么在日常的開發(fā)過程中,一定會需要翻閱API手冊,查看方法函數(shù)的使用;抑或是你開始學(xué)習(xí)一門新的開發(fā)語言,不知道如何入手,想了解官網(wǎng)的Tutorials入門教程。那么恭喜你,你已經(jīng)走上了編程進階的正路。
放棄那些大牛推薦的各式參考書籍吧,每種編程語言的官網(wǎng)和文檔API References就是你學(xué)習(xí)編程的最好資料,不相信我們來隨便看看。
pandas
Spring Boot
Python
當(dāng)然你可能說,也有很多中文版的開發(fā)文檔翻譯內(nèi)容,但是如果你想要快速全面的了解編程語言的來龍去脈,閱讀英文版的介紹是最快的途徑。如果你堅持這樣做了,我相信能夠閱讀英文文檔的你,英語水平也不會差。
極客時間的GO語言進階訓(xùn)練營是很不錯,知識內(nèi)容涉及比較全面,從編程語言到中間件、系統(tǒng)設(shè)計再到架構(gòu)都安排了相關(guān)課程,老師們在課程中不講語法和用法,重點傳遞設(shè)計原理和最佳實踐,講課的過程中貼合工作場景,分享真實的干貨案例,啟發(fā)學(xué)員的思維讓其自主進行學(xué)習(xí),還幫學(xué)員建立系統(tǒng)大局觀,有助于學(xué)員深層次的提升。
學(xué)習(xí)任何計算機語言,都和英語關(guān)系不大。我學(xué)過C/Java/perl,目前最讓我著迷的是Python,實話實說,和英語關(guān)系真的不大。不過如果你英語水平高一點,肯定會更得心應(yīng)手,很多接口文檔都是英文的,還有一些國外開源的代碼,也是英文注釋,包括函數(shù)方法變量命名都是取自和自身作用有關(guān)的英文單詞。英語不好不是重點,重點是耐心和激情,你愿意為go奉獻你的時間,英語永遠不會是你的絆腳石。
-一名python愛好者 (百家號:斌哥說Python)
分享題目:不懂英語學(xué)go語言 Go語言怎么樣
轉(zhuǎn)載源于:http://vcdvsql.cn/article46/dosdghg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供軟件開發(fā)、電子商務(wù)、域名注冊、網(wǎng)頁設(shè)計公司、外貿(mào)網(wǎng)站建設(shè)、云服務(wù)器
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)