spark性能優化要注意哪幾點,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
信州網站制作公司哪家好,找創新互聯!從網頁設計、網站建設、微信開發、APP開發、成都響應式網站建設公司等網站項目制作,到程序開發,運營維護。創新互聯2013年至今到現在10年的時間,我們擁有了豐富的建站經驗和運維經驗,來保證我們的工作的順利進行。專注于網站建設就選創新互聯。
默認用的是java序列化,但是會很慢,第二種很快,但是不一定能實現所有序列化 第二種,有些自定義類你需要在代碼中注冊(Kryo)
def main(args: Array[String]) { val sparkConf = new SparkConf() val sc = new SparkContext(sparkConf) val names = Array[String]("G304","G305","G306") val genders = Array[String]("male","female") val addresses = Array[String]("beijing","shenzhen","wenzhou","hangzhou") val infos = new ArrayBuffer[Info]() for (i<-1 to 1000000){ val name = names(Random.nextInt(3)) val gender = genders(Random.nextInt(2)) val address = addresses((Random.nextInt(4))) infos += Info(name, gender, address) } val rdd = sc.parallelize(infos) rdd.persist(StorageLevel.MEMORY_ONLY_SER) rdd.count() // rdd.persist(StorageLevel.MEMORY_ONLY) sc.stop() } case class Info(name:String, gender:String, address:String) }
def main(args: Array[String]) { val sparkConf = new SparkConf() sparkConf.registerKryoClasses(Array(classOf[Info])) val sc = new SparkContext(sparkConf) val names = Array[String]("G304","G305","G306") val genders = Array[String]("male","female") val addresses = Array[String]("beijing","shenzhen","wenzhou","hangzhou") val infos = new ArrayBuffer[Info]() for (i<-1 to 1000000){ val name = names(Random.nextInt(3)) val gender = genders(Random.nextInt(2)) val address = addresses((Random.nextInt(4))) infos += Info(name, gender, address) } val rdd = sc.parallelize(infos) rdd.persist(StorageLevel.MEMORY_ONLY_SER) rdd.count() // rdd.persist(StorageLevel.MEMORY_ONLY_SER) sc.stop()
sparkConf.registerKryoClasses(Array(classOf[Info]))
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注創新互聯行業資訊頻道,感謝您對創新互聯的支持。
分享名稱:spark性能優化要注意哪幾點
當前網址:http://vcdvsql.cn/article44/gdjohe.html
成都網站建設公司_創新互聯,為您提供網站導航、網站制作、電子商務、虛擬主機、企業建站、網站內鏈
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯