作者 / 謝青華
這項研究首次全面評估了ChatGPT在台灣整形外科專科醫師考試中的表現。研究分析了過去8年共1,375道考題(包括985道單選題和390道複選題)的答題情況。結果顯示,ChatGPT-4的整體正確率達到59%,成功通過了8年考試中的5年,顯著優於ChatGPT-3.5的41%正確率。特別是在單選題方面,ChatGPT-4的正確率達66%,而在較具挑戰性的複選題上也有43%的正確率,都遠超過ChatGPT-3.5的表現(單選題48%,複選題23%)。
研究結果引發了對醫學專科考試改革的深入思考。研究團隊提出了多項建議:首先,建議增加問題導向學習(PBL)型考題,更好地評估考生的臨床思維和問題解決能力;其次,可運用ChatGPT來協助審查題目品質,避免教科書與實際文獻之間的矛盾;第三,建議調整考試方向,從刁鑽難題轉向全方位評估專科醫師所需的綜合能力;最後,建議將AI輔助學習工具納入考生的準備過程,幫助他們更有效地掌握知識要點。
隨著AI技術的快速發展,醫學專科考試的定位和價值需要重新審視。研究指出,未來的考試設計應更注重評估人類獨有的技能,如倫理推理能力、同理心和臨床判斷力等。同時也需要考慮如何在保持考試公正性和有效性的前提下,合理運用AI技術來優化考試流程。
研究也指出目前的局限性,如只關注台灣單一考試、缺乏與人類表現的對照數據,以及未能深入分析不同類型題目的難度等,這些都是未來研究需要進一步探討的方向。整體而言,本研究為醫學專科考試在AI時代的改革提供了重要的實證依據和建設性建議。
研究文章由謝青華醫師完成,發表於Heliyon雜誌。

延伸閱讀
延伸閱讀 : 靜脈潰瘍要先處理靜脈的問題,整形外科幫你從源頭治療
延伸閱讀 : 外傷登錄研究-運用數據分析來深化病患的照顧品質
延伸閱讀 : 外傷重症治療之急救照護成果與未來展望
延伸閱讀 :【醫藥新聞週刊】長庚醫學週 多元議程提升國際視野
延伸閱讀 :【醫藥新聞週刊】謝青華訓練年輕醫師 著重跨領域學習
延伸閱讀 :【環球生技】「2021台灣再生醫學學會學術研討會」 再生醫學新武器幹細胞胞外體應用突起
延伸閱讀 : PGY課程-基本縫合訓練
延伸閱讀 : 謝青華醫師獲得 長庚醫學週-醫學教育英文組 口頭報告銅獎
延伸閱讀 : 2022高雄中學醫學微課程-外科教學
延伸閱讀 : 輸血快速加溫器教育訓練
延伸閱讀 : 甲基化調節基因在肝癌的表現
延伸閱讀 : 簡易白蛋白-膽紅素評分(EZ-ALBI)作為成人外傷患者在加護病房死亡率的預後工具:一項回顧性研究
延伸閱讀 : 成人創傷患者壓力性高血糖引起的白細胞亞型升高
延伸閱讀 : 白蛋白膽紅素 (ALBI) 等級與外傷性肝損傷患者死亡風險的關聯
延伸閱讀 : 有規律鍛煉和控制體重習慣可以降低骨質疏鬆症的發病率
延伸閱讀 : Delta De Ritis 比率與中重度外傷性腦損傷的成人患者的死亡率結果相關
延伸閱讀 : 使用二次測量的 De Ritis 比率來改善對於加護病房成人外傷患者的死亡率預測
延伸閱讀 : 胸腹部外傷成年患者 De Ritis 比率升高與死亡預後之關聯
延伸閱讀 : 肥胖是否對於外傷有著保護作用?-藉由手術驗證之鈍性腸及腸系膜損傷患者來進行分析
延伸閱讀 : 重大創傷後患者血液循環中 T 細胞 miRNA-mRNA 的交互作用網絡
延伸閱讀 : 白細胞亞型和衍生比率與成人多重外傷患者死亡率的關聯性
延伸閱讀 : 中性粒細胞與單核細胞比率的變化可以對加護病房成年外傷患者的死亡風險進行分級
延伸閱讀 : 比較經由其他醫院轉診或自行到本院急診的重大外傷患者預後
延伸閱讀 : 使用飛梭雷射合併藥物導入來預防甲狀腺術後疤痕形成的效果
延伸閱讀 : 有效之醫療品質管理工具-加護病房預後評分系統