謝青華醫師獲得 長庚醫學週 – 醫學教育英文組 口頭報告銅獎

謝青華
謝青華
謝青華

Performance of ChatGPT on a Plastic Surgery Board Certification Examination

ChatGPT 是由 OpenAI 創建的人工智慧語言模型,能夠生成與理解人類語言產生之文本。此研究目的在於評估 ChatGPT 在整形外科專科醫師執照考試中的表現。我們使用2015 年至 2022 年共八年的整形外科的專科醫師執照考試題目,合計總共 1253 個問題,使用ChatGPT來回答。其中,ChatGPT 3.5 的單選題和多選題正確率分別為 48%(431/890)和 23%(85/363),而ChatGPT 4.0 的單選題和多選題正確率分別為 66% (649/890)和 43%(169/363)。整體而言,ChatGPT 3.5 的正確率為 41%,而 ChatGPT 4.0 的正確率為 59%。以年度分,ChatGPT 3.5 皆無法順利完成各年度之專科醫師執照考試,然而 ChatGPT 4.0可以通過大部分年度之專科醫師執照考試。使用大型語言模型和人工智慧對如何設計及完成醫學教育來參與考試具有重大的影響。具體來說,它或可以用以確認考試題目的正確性、輔助設計考題、並促進實證醫學的發展。

會員限制

提醒您!文件限定VIP會員下載