GPT-4眼科評估能力驚艷，但專家警告需審慎應用

若安丶 ? 2024年4月21日 06:35:00 ? AI

劍橋大學臨床醫學院的最新研究發現，OpenAI的GPT-4模型在眼科評估中的表現幾乎可與該領域的專家相媲美。這一突破性成果在金融時報首次報道后，引起了醫療和科技界的廣泛關注。

在這項發表在PLOS數字健康雜志上的研究中，研究人員對GPT-4及其前身GPT-3.5、谷歌的PaLM 2以及梅塔美洲駝進行了眼科知識測試。測試內容涵蓋了從光敏感到病變等各個方面的87道選擇題，難度與眼科教科書中的題目相當。五名眼科專家、三名實習眼科醫生和兩名非專業初級醫生也接受了相同的模擬考試。值得注意的是，這些題目對于LLM模型而言是全新的，因為它們之前并未接觸過相關內容。

在測試中，GPT-4展現了令人印象深刻的表現，答對了60道問題，得分高于實習醫生和初級醫生。盡管這一成績略遜于眼科專家的平均得分66.4，但已足以顯示其在眼科評估領域的巨大潛力。相比之下，PaLM 2、GPT-3.5和梅塔美洲駝的得分分別為49分、42分和28分，均低于初級醫生的平均水平。

然而，盡管這些結果展示了LLM在醫療領域的潛在應用，研究人員也警告稱，必須謹慎對待這些模型的輸出結果。他們指出，測試中的問題數量有限，特別是在某些類別中，這可能導致實際結果有所偏差。此外，LLM模型存在“幻覺”現象，即生成不相關或錯誤的事實，這在醫療領域尤為危險。如果模型錯誤地診斷出白內障或癌癥等嚴重疾病，將可能對患者造成嚴重后果。

研究人員強調，雖然LLM模型在眼科評估中展現了令人鼓舞的初步成果，但在實際應用中仍需謹慎對待。未來，應進一步探索如何提高模型的準確性和可靠性，以確保其能夠安全、有效地服務于醫療領域。

此項研究為LLM模型在醫療領域的應用提供了新的視角，也提醒我們在追求技術進步的同時，必須關注其潛在的風險和局限性。隨著LLM技術的不斷發展，我們期待未來能夠看到更多關于其如何在醫療領域造福社會的報道。

原創文章，作者：若安丶，如若轉載，請注明出處：http://www.bdzhitong.com/article/648782.html

GPT-4 OpenAI 眼科評估谷歌

若安丶管理團隊

0 0

新聞

?谷歌Chrome瀏覽器逐步淘汰Ublock Origin等舊擴展

近日，外媒bleepingcomputer報道了一則關于谷歌Chrome瀏覽器的重大變動。據悉，谷歌已開始在該瀏覽器中主動禁用包括Ublock Origin在內的Manifest …

Google
5小時前
AI

ChatGPT vs Grok：誰更懂你的需求？

隨著人工智能技術的迅速發展，市場上涌現出多個智能對話應用，其中ChatGPT 和 Grok 是大家重點關注的兩款AI聊天工具。前者由OpenAI開發，后者則是馬斯克的xAI公司推出…

AI
1天前
AI

OpenAI?GPT-4.5發布時間曝光，GPT-5五月下旬有望發布

有消息稱，微軟近日正緊鑼密鼓地為OpenAI的最新模型做準備，關于GPT-4.5發布時間也被曝光。據了解，GPT-4.5預計最快將于下周與公眾見面。據可靠消息透露，微軟不僅即將推…

AI
1天前
新聞

?YouTube推出低價無廣告套餐Premium Lite，面向特定用戶群體

近日，谷歌旗下的YouTube宣布將推出一項新的付費服務——Premium Lite，這是一項價格更低且不含廣告的視頻套餐，主要針對那些不希望觀看音樂視頻中廣告的觀眾群體?。據悉…

Google
2天前
AI

?馬斯克Grok應用登頂美國App Store免費榜，超越ChatGPT

據外媒報道，馬斯克旗下的人工智能公司xAI推出的Grok應用，成功登頂美國區App Store免費應用排行榜，將此前占據榜首的OpenAI的ChatGPT應用擠至其后?。據悉，x…

AI
2天前
AI

?OpenAI周活躍用戶突破4億大關，企業業務迅猛增長

據外媒報道，截至本月，OpenAI周活躍用戶數量已激增至4億，相比去年12月的3億用戶，增長了33%?。這一里程碑式的成就標志著OpenAI旗下明星產品ChatGPT的廣泛認可和迅…

AI
2天前
新聞

?iPhone用戶福音！谷歌“圈選即搜”功能本周上線

今日，谷歌宣布為蘋果iPhone用戶推出?“Screen Search”功能?，用戶可直接在瀏覽網頁或觀看視頻時圈選內容啟動搜索，無需切換應用?。該功能將于本周在iPhone的Ch…

Google
2天前
手機

谷歌Pixel 10系列傳聞：共四款機型

近日，外媒smartprix發布了谷歌Pixel 10系列傳聞信息，稱在深入挖掘GSMA IMEI數據庫后，發現了谷歌Pixel 10系列手機的蹤跡。據了解，此次曝光的谷歌Pix…

Google
4天前
手機

谷歌Pixel 9a渲染圖曝光：告別相機條，四色齊發

近日，外媒Android Headline再次分享了谷歌Pixel 9a渲染圖，這款新機將延續Pixel系列的實惠傳統，以更加親民的價格進入市場。據了解，谷歌Pixel 9a在美…

Google
5天前
新聞

消息稱谷歌AI老將吳永輝轉戰字節跳動，領軍大模型基礎研究新方向

據多方消息證實，在谷歌任職17年的頂尖AI專家吳永輝博士已正式加入字節跳動，擔任大模型團隊Seed基礎研究負責人，專注于大模型基礎技術探索及“AI for Science”等長期科…

NEWS
5天前
新聞

谷歌安卓16 Beta 2新進展：Pixel電池健康功能大升級

近日，外媒9to5Google報道了關于谷歌安卓系統的最新動態。據了解，谷歌在安卓16 Beta 2更新中，對“電池健康”設置進行了全面改造，為Pixel手機用戶帶來了更詳盡的電池…

Google
5天前
AI

谷歌Gemini免費版開放文件分析代碼文檔都能傳

谷歌今日宣布，旗下AI助手Gemini即日起向所有免費用戶開放文件上傳及分析功能，此前該服務僅限每月19.99美元（約145元人民幣）訂閱的Gemini Advanced用戶使用。…

Google
2025年2月15日
AI

谷歌DeepMind發布WebLI-100B，增強文化多樣性和多語言性

據知名科技媒體MarkTechPost報道，昨日，谷歌DeepMind團隊正式發布了名為WebLI-100B的千億級數據集。據悉，WebLI-100B數據集包含了驚人的1000億個…

Google
2025年2月14日
新聞

喜訊！TikTok正式重返蘋果美區App Store

今日，據外媒報道，蘋果公司將根據美國司法部長 Pam Bondi 的指示，恢復字節跳動公司旗下的短視頻應用TikTok在美國App Store的運營。目前，TikTok已經重新在蘋…

小丸子
2025年2月14日
AI

谷歌Gemini AI新增“全局記憶”功能，讓聊天更貼心

谷歌今日宣布其旗下的Gemini AI正式上線了一項名為“全局記憶”的新功能。這意味著，Gemini AI將能夠記住用戶曾經與其進行過的所有對話，為用戶提供更加私人化的回復體驗。 …

Google
2025年2月14日
新聞

OpenAI將放大招 GPT-5免費無限使用

今日，OpenAI首席執行官薩姆·奧爾特曼公布了一個令人震驚的消息：OpenAI將在未來幾個月內推出GPT-5模型，并免費無限使用。在之前將先發布GPT-4.5模型，代號為“Ori…

AI
2025年2月13日
商業

DeepSeek估值飆升，或達OpenAI估值一半

近日，據彭博社報道，一家名為DeepSeek的初創公司，其估值在短時間內出現了驚人的增長，最高或已達到1500億美元，這一數字幾乎達到了另一AI巨頭OpenAI估值的一半。此消息一…

商業頭條
2025年2月12日
AI

OpenAI CEO阿爾特曼：AI成本驟降，每年成本降至十分之一

近日，OpenAI的首席執行官山姆·阿爾特曼（Sam Altman）在一篇博文中，揭示了人工智能發展的迅猛勢頭及其對社會經濟的深遠影響。阿爾特曼指出，AI模型的智能程度與其訓練和…

AI
2025年2月12日
新聞

谷歌I/O開發者大會定檔，線上線下同步來襲

今日清晨，谷歌正式宣布了2025 Google I/O開發者大會時間，2025 Google I/O開發者大會將于5月20日至21日盛大舉行。與以往不同，本次活動將全面開放線上參與…

Google
2025年2月12日
AI

奧特曼盛贊DeepSeek：AI實力可媲美ChatGPT

近日，美國開放人工智能研究中心（OpenAI）的首席執行官奧特曼在啟程前往巴黎人工智能行動峰會前，對一家中國AI初創公司——深度求索（DeepSeek）給予了高度評價。據德新社11…

AI
2025年2月12日

發表回復

登錄后才能評論

GPT-4眼科評估能力驚艷，但專家警告需審慎應用

相關推薦

發表回復