bl双性强迫侵犯h_国产在线观看人成激情视频_蜜芽188_被诱拐的少孩全彩啪啪漫画

淺談醫學大數據(上)

現在無論國內外均出現了移動醫療熱,所有的創業團隊和投資公司均把商業模式指向了最后的醫療大數據分析。但是可以很負責任的說,90% 以上的人都不知道醫療大數據分析是什么東西,因此這是一篇掃盲貼,但是僅供專業人士。文中分析了醫療大數據、它的維度、方法和成本,以及需要的專業人才。本文無論是對創業團隊還是投資機構都是非常有指導意義的。

為平和等地區用戶提供了全套網頁設計制作服務,及平和網站建設行業解決方案。主營業務為成都網站制作、網站建設、平和網站設計,以傳統方式定制建設網站,并提供域名空間備案等一條龍服務,秉承以專業、用心的態度為用戶提供真誠的服務。我們深信只要達到每一位用戶的要求,就會得到認可,從而選擇與我們長期合作。這樣,我們也可以走得更遠!

大數據定義及其特征

大數據顧名思義就是數量極其龐大的數據資料。從上世紀 80 年代開始,每隔 40 個月世界上儲存的人均科技信息量就會翻倍 (Hibert & Lopez, 2011)。2012 年,每天會有 2.5EB 量的數據產生 (Andrew & Erik, 2012)。現在,2014 年,每天會有 2.3ZB 量的數據產生 (IBM, 2015)。這是一個什么概念? 現在一般我們電腦的硬盤大小都以 GB,或者 TB 為單位了。1GB 的容量可以儲存約 5.4 億的漢字,或者 170 張普通數碼相機拍攝的高精度照片,或者 300-350 首長度為 5-6 分鐘的 MP3 歌曲。 那 GB 和 TB, EB,ZB 的關系又是怎樣?

1ZB=1024EB=10242PB=10243TB=10244GB。如果你有一臺 1TB 硬盤容量的電腦,那 1ZB 就是大致等于 10 億臺電腦的容量, 遠遠超出了我們一般的想象。

早期,IBM 定義了大數據的特性有 3 個:大量性( Volume), 多樣性(Variety), 快速性(Velocity) (Zikopoulos, Eaton, deRooos, Deutsch, & Lapis, 2012)。后來又有學者把價值(Value)加到大數據的特性里。隨著時間的推移和人們思考的進一步完善,又有三個大數據的特性被提出: 易變性(Variability),準確性 (Veracity) 和復雜性 (Complexity)。

作者認為價值本質上是數據被分析后體現出來的有用信息知識的程度,和其他幾個特性有根本區別。其他幾個特性可以說是數據工作者具體實踐中面臨的挑戰,而價值則是征服這些挑戰后獲得的回報。

大數據的6個特性描述如下:

大量性:一般在大數據里,單個文件大量性的級別至少為幾十,幾百 GB 以上,一調查 (Russom, 2013) 顯示相當多的機構擁有的數據總量在 10 到 99TB 之間。用我們傳統的數據庫軟件,1GB 已經可以儲存千萬條有著幾百個變量的數據記錄了。

多樣性:泛指數據類型及其來源的多樣化 (Troester, 2012),進一步可以把數據結構歸納為結構化 (structured),半結構化 (semi-structured),和非結構化 (unstructured) (SAS, 2014) 。

快速性:反映在數據的快速產生及數據變更的頻率上。比如一份哈佛商學院的研究報告稱在 2012 年時,谷歌每天就需要要處理 20PB 的數據 (Harvard Business Review, 2012)。

易變性:伴隨數據快速性的特征,數據流還呈現一種波動的特征。不穩定的數據流會隨著日,季節,特定事件的觸發出現周期性峰值 (Troester, 2012)。

準確性:又稱為數據保證 (data assurance)。不同方式,渠道收集到的數據在質量上會有很大差異。數據分析和輸出結果的錯誤程度和可信度在很大程度上取決于收集到的數據質量的高低 (W.Raghupathi & Raghupathi, 2014)。所謂“垃圾進,垃圾出”。沒有數據保證,大數據分析就毫無意義。

復雜性:復雜性體現在數據的管理和操作上。IT 時代,隨著數據來源及數據量的爆發,各種不同渠道數據的大量涌現,數據的管理和操作已經變得原來越復雜。如何抽取,轉換,加載,連接,關聯以把握數據內蘊的有用信息已經變得越來越有挑戰性。

醫療大數據的爆發

早期,大部分醫療相關數據是紙張化的形式存在,而非電子數據化存儲, 比如官方的醫藥記錄,收費記錄,護士醫生手寫的病例記錄,處方藥記錄,X 光片記錄,磁共振成像(MRI)記錄,CT 影像記錄等等。

隨著強大的數據存儲,計算平臺,及移動互聯網的發展,現在的趨勢是醫療數據的大量爆發及快速的電子數字化。以上提到的醫療數據都在不同程度上向數字化轉化。

有報告顯示,2011 年,單單美國的醫療健康系統數據量就達到了 150EB。照目前的增長速度, ZB(約 1021GB)和 YB(約 1021GB) 的級別也會很快達到 (IHTT, 2013)。Kaiser Permanente,一個在加州發展起來的醫療健康網絡系統, 就有 9 百萬的會員,被認為擁有 26.5 到 44PB 的電子健康記錄 (IHTT, 2013)。

IT 時代涌現的還有各種網絡社交媒體數據,比如曾經 Google 用來預測流感的數據。基因數據也是非常龐大的存在,一次全面的基因測序,產生的個人數據則達到 300GB (Leah, 2014)。公開發布的基因 DNA 微陣列達到 50 萬之多,每一陣列包含數萬的分子表達值。在生物醫藥方面,功能性磁共振影像的數據量也達到了數萬 TB 級別,每一幅影像包含有 5 萬像素值 (Fan, Han, & Liu, 2014)。

此外,各種健身,健康可穿戴設備的出現,使得血壓、心率、體重,血糖,心電圖(EKG)等的監測都變為現實和可能,信息的獲取和分析的速度已經從原來的按“天”計算,發展到了按“小時”,按“秒”計算。比如,一家名為 Blue Spark 的科技公司已經生產出能 24 小時實時監測體溫的新型溫度計貼片 temptraq。

這種數據的擴展速度和覆蓋范圍是前所未有的,數據的格式也五花八門,可能是無格式文件(flat file),CSV,關系表,ASCII/ 純文本文件等等。

同時,數據的來源也紛繁復雜,可能來自不同的地區,不同的醫療機構,不同的軟件應用。不可否認,一旦理順了多格式,多源頭,呈爆炸性成長的大數據的整合和分析,醫療大數據將對提高醫療質量,強化患者安全,降低風險,降低醫療成本等方面發揮無與倫比的巨大作用。

醫療大數據的優勢和應用場景

有效的整合和利用數字化的醫療大數據對個體醫生,康寶中心,大型醫院,和醫療研究機構都有著顯著的好處。

潛在的利益包括 (W.Raghupathi & Raghupathi, 2014):

1)更多更準確的數據使得疾病能在早期被監測到,從而使治療更容易和有效。

2)通過對特定個體或人群的健康管理,快速有效地監測保健詐騙。

3)基于大量的歷史數據,預測和估計特定疾病或人群的某些未來趨勢,比如:預測特定病人的住院時間,哪些病人會選擇非急需性手術, 哪些病人不會從手術治療中受益,哪些病人會更容易出現并發癥,等等。麥肯錫估計,單單就美國而言,醫療大數據的利用可以為醫療開支節省出 3 千億美元一年。

醫療大數據的利用可以從以下幾方面減少浪費和提高效率 (Manyika, 以及其他人, 2011):

臨床操作: 相對更有效的醫學研究,發展出臨床相關性更強和成本效益更高的方法用來診斷和治療病人。

研究和發展:在藥品和醫療器械方面,建立更低磨損度,更精簡,更快速,更有針對性的研發產品線。統計工具和算法方面,提高臨床試驗設計和患者的招募,使得治療方法可以更好地匹配個體患者的病癥,從而降低臨床試驗失敗的可能和加快新的治療方法推向市場。分析臨床試驗和病人的病歷,以確定后續的跡象,并在產品進入市場前發現病人對藥物醫療方法的不良反應。

公共衛生:分析疾病模式和追蹤疾病暴發及傳播方式途徑,提高公共衛生監測和反應速度。更快更準確地研制靶向疫苗,例如:開發每年的流感疫苗。

此外,醫療大數據的分析還有利于以下幾方面的發展 (W.Raghupathi & Raghupathi, 2014):

循證醫學:結合和分析各種結構化和非結構化數據,電子病歷,財務和運營數據,臨床資料和基因組數據用以尋找與病癥信息相匹配的治療,預測疾病的高危患者或提供更多高效的醫療服務。

基因組分析:更有效和低成本的執行基因測序,使基因組分析成為正規醫療保健決策的必要信息并納入病人病歷記錄。

提前裁定欺詐分析:快速分析大量的索賠請求,降低欺詐成功率,減少浪費和濫用。

設備/遠程監控:從住院和家庭醫療裝置采集和分析實時大容量的快速移動數據,用于安全監控和不良反應的預測。

病人的個人資料分析:全面分析病人個人信息(例如,分割和預測模型)從中找到能從特定健保措施中獲益的個人。例如,某些疾病的高危患者(如糖尿病)可以從預防措施中受益。這些人如果擁有足夠的時間提前有針對性的預防病情,那么大多數的危害可以降到最低程度,甚至可以完全消除。

然而,根據一份針對美國和加拿大 333 家醫療機構及 10 家其他機構的調查 (IHTT, 2013),2013 年,醫療機構累積的數據量比 2011 年多出了 85%, 但 77% 的醫療健康行政人員對自己機構在數據管理方面的能力評價為“C”。此外,僅有 34% 報告他們能從電子健康記錄(EHR)中獲取數據用來幫助病人,而有 43% 報告他們不能收集到足夠多的數據來幫助病人。由此可見,在北美的醫療系統中,醫療大數據的管理使用準備工作還有一大段路要走。中國也是處在起步階段。

網頁名稱:淺談醫學大數據(上)
文章網址:http://vcdvsql.cn/article44/chephe.html

成都網站建設公司_創新互聯,為您提供企業建站品牌網站設計網站設計電子商務外貿建站App設計

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

小程序開發