(資料圖片)
近期,ChatGPT因其高超的自然語言任務處理能力在各行各業爆火出圈。在編程、翻譯、寫論文等領域的應用,ChatGPT已經算是游刃有余。然而,在高壁壘的行業如醫學領域中,ChatGPT卻顯得不夠活躍。
過去十年,神經網絡、深度學習和人工智能 (AI) 等技術的進步已經對制造業、服務業和金融業等諸多行業產生了深遠影響,但它們在臨床護理中的應用仍然有限。臨床醫學領域的衛生聯網系統之間缺乏普遍的互操作性,導致深度學習算法開發所需的結構和機器可讀數據匱乏。即便開發了適用于臨床護理的算法,但由于技術、統計和概念的可重復性有限,許多算法無法跨環境推廣,這些算法的質量也往往忽高忽低。
日前,哈佛醫學院教授Tiffany H. Kung,親自下場測試ChatGPT的表現。通過評估ChatGPT的大語言模型在美國醫學執照考試(USMLE)中的表現發現,雖然沒有經過任何專門的訓練或強化,ChatGPT在三個專家級知識的標準化測試中已經能夠達到或接近 60% 的準確度。該教授表示,ChatGPT輔助診斷的表現,已經接近醫生。此外,ChatGPT 還表現出高度細致的洞察力。
另一教授Ateev Mehrotr也對ChatGPT進行了測試,結果顯示,ChatGPT在45個案例中的39個診斷正確,正確率87%(超過了現有機器診斷率的51%);并為30個案例提供了適當的分診建議。
研究表明,人工智能系統在改善醫療保健和健康結果方面大有可為,大型語言模型可能有助于醫學教育,并可能有助于臨床決策。ChatGPT等大型語言模型可能會在醫學教育環境中幫助人類學習者,作為未來融入臨床決策的前奏,在醫療保健中的應用潛力十分巨大。
前瞻經濟學人APP資訊組
參考論文:
https://journals.plos.org/digitalhealth/article?id=10.1371/journal.pdig.0000198
標簽: ChatGPT