過去,醫療行業的研究人員需要手動收集和分析大量數據來預測和治療疾病。面對復雜的數據信息,相關的數據分析工作極具挑戰性。隨著人工智能的發展,醫生在就診時根據實驗室檢測結果、家族史、臨床試驗數據和其他生命統計數據獲得實時分析報告將成為現實。本文以人工智能在重癥醫學中的應用為例,描述了如何利用DarwinML來輔助醫療行業的數據科學家進行自動建模。數據融合數據提取平臺該平臺幫助醫學數據科學家將原始數據自動轉換為模型可以使用的特征數據。該功能以數據流的形式實現,研究人員可以通過修改參數和拖動節點靈活改變特征提取過程。下圖是一個數據流圖。DarwinMLStudio自動建模平臺從數據導入和清理開始。DarwinML可以自動建模并給出模型的多向評價結果。數據科學家只需要關注模型的評估結果。根據研究目標,研究者將返回調整初始數據清理方案和模型設置,多次建立模型,并選擇滿足研究需要的最終模型。DarwinML自動建模平臺的整個過程如下:1)數據清理:平衡樣本分布,填充缺失值,消除特征的異常值,數字化文本特征。2)模型設計:根據研究人員的數據特征和參數設置,在搜索空間中自動構建最優網絡結構。網絡結構將在平臺中顯示如下。3)超級參數調整:為最佳網絡結構和數據特征提供匹配的最佳超級參數組合,如下圖所示“超級參數”欄中的XGBClassifiler的學習速率和嵌套參數。4)模型訓練:使用最優網絡和超級參數的組合來實際訓練模型。5)模型評價:給出了召回率、精度和AUC等基本指標值,從模型角度給出了重要欄目的分析結果,從樣本角度給出了單個樣本的重要特征分析。同時,DarwinML自動建模平臺也支持只使用一些需要的功能。例如,我們可以導入一組新患者的檢查數據,使用上次訓練的模型,并且只評估模型,從而預測這組新患者的患病概率。病例:中嚴重感染綜合征(也稱為敗血癥)的預后研究根據其早期檢查指標,我們使用DarwinML對重癥監護病房(ICU)中的患者進行嚴重感染綜合征(也稱為敗血癥)的警告
行業資訊
面向醫療行業數據科學家的人工智能解決方案:自動建模平臺
瀏覽:297 時間:2023-1-3