又黄又无码在线免费看_av操操_青青草超碰_成人伊人精品色XXXX视频

北京大學(xué)腫瘤醫(yī)院

返回

頂部

網(wǎng)站導(dǎo)航

353-354期(完成)(1)-1.jpg

AI聊天機(jī)器人對(duì)癌患問(wèn)題的解答堪比醫(yī)生?

作者: 來(lái)源: 發(fā)布時(shí)間:2024-07-09

加拿大瑪格麗特公主醫(yī)院癌癥中心Chen等報(bào)告,人工智能(AI)聊天機(jī)器人可以對(duì)患者所提出的有關(guān)癌癥的問(wèn)題做出高質(zhì)量、有同理心且可讀的回答,其結(jié)果與來(lái)自在線論壇的專業(yè)醫(yī)生回答相當(dāng)。需要進(jìn)一步的研究來(lái)評(píng)估聊天機(jī)器人輔助互動(dòng)的范圍、流程整合和醫(yī)患結(jié)局。(JAMA Oncol. 2024年5月16日在線版)

為了評(píng)估AI聊天機(jī)器人[GPT-3.5(聊天機(jī)器人1)、GPT-4(聊天機(jī)器人2)和Claude AI(聊天機(jī)器人3)]對(duì)患者有關(guān)癌癥的問(wèn)題給出高質(zhì)量的、感同身受的且具有可讀性響應(yīng)的能力,該項(xiàng)等效性研究的對(duì)標(biāo)數(shù)據(jù)來(lái)自6例有資質(zhì)的腫瘤科醫(yī)生對(duì)公共在線論壇200個(gè)癌癥患者問(wèn)題的解答。從2018年1月1日到2023年5月31日,研究者從一個(gè)公共在線論壇(Reddit r/AskDocs)上隨機(jī)抽取了200個(gè)與癌癥有關(guān)的患者提問(wèn),并向3個(gè)AI聊天機(jī)器人提問(wèn)。

主要終點(diǎn)為依據(jù)李克特量表對(duì)質(zhì)量、同理心和可讀性進(jìn)行評(píng)級(jí),評(píng)級(jí)范圍為1分(非常差)到5分(非常好)。次要終點(diǎn)為使用Flesch-Kincaid等級(jí)評(píng)估的可讀性。 

結(jié)果顯示,聊天機(jī)器人3(Claude AI)是表現(xiàn)最好的AI聊天機(jī)器人,與腫瘤科醫(yī)生的回答相比,其對(duì)200個(gè)問(wèn)題的回答在質(zhì)量[平均值:3.56分(95%CI 3.48~3.63分) vs. 3.00分(95%CI 2.91~3.09分),P<0.001]、同理心[平均值:3.62分(95%CI 3.53~3.70分) vs. 2.43分(95%CI 2.32~2.53分),P<0.001)和回答的可讀性[平均值:3.79分(95%CI 3.72~3.87分) vs. 3.07分(95%CI 3.00~3.15分),P<0.001)的總體評(píng)估評(píng)分始終更高。

腫瘤科醫(yī)生回答的平均Flesch-Kincaid等級(jí)水平對(duì)比聊天機(jī)器人3(Claude AI)的并無(wú)顯著差異[平均值:10.11(95%CI 9.21~11.03) vs. 10.31(95%CI 9.89~10.72),P>0.99],但低于聊天機(jī)器人1(GPT-3.5:12.33,95%CI 11.84~12.83。P<0.001)和聊天機(jī)器人2(GPT-4:11.32,95%CI 11.05~11.79,P=0.01)的結(jié)果。

(編譯 陳嬌)