倫理中心研究倫理組

搜尋研究倫理文章 -研究倫理活動回列表

西元年份	2026
出刊月份	3月
季刊期別	9
文章標題	人工智慧/機器學習技術之醫療器材軟體上市前審查要求及臨床試驗相關規範～臺大醫院倫理中心研究倫理研習會紀要（二） Pre-market Review Requirements and Clinical Trial Regulations for Artificial Intelligence / Machine Learning-Based Medical Device Software ～Minutes of the Research Ethics Workshop at the Ethics Center of National Taiwan University Hospital(I
文章內文	人工智慧/機器學習技術之醫療器材軟體上市前審查要求及臨床試驗相關規範～臺大醫院倫理中心研究倫理研習會紀要（二） Pre-market Review Requirements and Clinical Trial Regulations for Artificial Intelligence / Machine Learning-Based Medical Device Software～Minutes of the Research Ethics Workshop at the Ethics Center of National Taiwan University Hospital(II) 講者 / 衛生福利部醫療器材及化粧品組葉旭輝整理 / 臺大醫院倫理中心王劭慈 PDF下載貳、人工智慧／機器學習技術之醫療器材軟體上市前審查要求及臨床試驗相關規範：衛生福利部醫療器材及化粧品組葉旭輝科長一、醫療器材全生命週期管理架構　　葉科長首先說明，臺灣醫療器材管理以《醫療器材管理法》為母法，AI醫療器材相關指引屬行政規則層級。食藥署在產品全生命週期各階段均有對應服務：上市前包含屬性判定、GLP臨床前測試規範、TFDA與IRB雙軌臨床試驗審查及GCP查核；上市後則涵蓋不良事件（ADR）通報、各國警訊收集、安全監視及UDI來源流向管理等。二、AI醫材查驗登記審查三大要項　　依《醫療器材分類分級管理辦法》，目前核定的AI機器學習醫療器材均屬第二等級，查驗登記審查要項分為產品技術特點、臨床前測試與臨床證據三大類，且各項內容必須與中文說明書的宣稱一致，這是貫穿整個審查過程的核心原則。（一）產品技術特點：　　AI醫材的技術資料重點在於演算法架構，而非一般醫材著重的材質與生物相容性。申請者須說明演算法設計，包含演算法名稱、開發平台、函式庫及模型層數與權重等結構細節。　　訓練資料的說明同樣重要。資料集須分為建立模組、訓練、驗證評估三組且不得重複，每組均需交代資料來源、納入排除標準、病患分布，且案件數量須達到統計檢定力。資料的產製方式也須明確描述，包含使用何種設備（如CT、MRI、超音波或病理玻片影像）、儀器型號及取像參數——例如胸部X光的PA位與AP位對AI而言是截然不同的輸入，若未事先定義清楚，判讀結果可能大相逕庭。基準真相（Ground Truth）的建立方式亦須交代，例如以活體組織切片或臨床醫師判讀為標準；若採醫師判讀，建議由二至三名醫師聯合完成，並說明結果不一致時的處理程序。　　產品形式目前分為電腦輔助偵測（CADe）、電腦輔助診斷（CADx）及電腦輔助篩檢（Computer Aided Triage）三種，各有對應的輸出宣稱要求。搭配特定硬體（如CT）時，亦須詳述影像取得參數與切片厚度，規格不一致可能直接影響判讀結果。目前核准產品多為閉鎖式（locked）演算法，但食藥署已建立「軟體預定變更控制」制度，允許業者在事先申報變更控制計畫的前提下進行迭代更版。（二）臨床前測試：　　臨床前測試涵蓋軟體確效（參考《醫療器材軟體確效指引》及IEC 62304）、網路安全評估（若具連網功能），以及功能性驗證。功能性驗證的核心是確認產品宣稱的輸出結果，如疾病風險高低、是否建議轉診、評分等級、靈敏度與特異性等，與中文說明書的內容相符。葉科長也指出，若試驗完成後發現說明書宣稱與結果不完全吻合，在可行範圍內可回頭調整說明書宣告。（三）臨床證據：獨立效能評估與臨床性能評估：　　臨床證據可採兩種路徑。獨立性能評估（Standalone Performance Assessment）以既有標記資料直接測試AI輸出，不需新增醫事人員判讀，適用於已有類似品上市的情境。若新產品與已核准類似品以相同資料集評估，且靈敏度或偽陽性率表現不劣於類似品，則可免除臨床性能評估。臨床性能評估則可進一步比較有無AI輔助時醫師判讀表現的差異，例如是否提升診斷率或縮短診斷時間，可使用前瞻性或回溯性資料，適用於全新產品或需證明臨床效益的情境。　　撰寫研究計畫時，研究族群與納排條件均須與中文說明書一致，若使用非國內資料，須收納部分國內資料確認適用性，若採多中心或聯邦式學習，須說明資料整合方式。判讀方法原則上應與臨床實務一致，若有所不同，須能以資料說服參與審查的臨床醫師，確認該設計能有效驗證產品的臨床效能。效能評估指標的cutoff值可依實際應用情境討論，例如某些AI產品的整體效能或許不如醫師，但若能在傷患分類場景發揮有效篩選作用，仍有其臨床價值。三、臨床試驗管理：無顯著風險的三種態樣　　依《醫療器材管理法》第37條，臨床試驗原則上須申請食藥署核准。但屬「無顯著風險」者，只需IRB核准即可執行，無需另行申請主管機關核准，可有效簡化行政程序。葉科長指出，目前AI醫材試驗大多屬此類。三種態樣分別為：（一）態樣一：已取得許可證且試驗未超出核准範圍。（二）態樣二：以合法取得的受試者檢體或資料作為診斷試驗客體，且結果不作為臨床診斷依據——例如以常規方式收集的影像或血液檢體供實驗性AI分析，或引用健保資料庫資料。（三）態樣三：未具游離輻射、置於受試者體表或無須接觸體表的器材（如心電圖儀等），且試驗結果不作為臨床診斷依據。四、案例探討與審查視角的啟示　　葉科長以一款氣胸偵測系統為例說明實際審查要點。該系統利用AI分析胸部X光影像偵測氣胸特徵，結果以警訊方式呈現，僅適用18歲以上成人，須由臨床醫事人員確認。審查重點包含訓練族群的特徵描述（如是否曾手術、使用的CT廠牌等）、軟體確效文件的完整性，以及效能評估的設計，含影像來源格式（CR與DR）、參與驗證的醫事人員數量與資格。該案例亦以美國影像與臺灣影像進行種族差異比對，確認兩者判讀結果差距不顯著，從而說明訓練模型可一體適用。　　演講最末，葉科長以2017年搞笑諾貝爾獎得主法丁先生的論文〈貓咪的流變學〉為引，說明審查標準的本質。該論文以物理學的底波拉數來判斷物質狀態：觀測時間內有形變就是液體，沒有形變就是固體，關鍵在於觀測時間的長短，喜馬拉雅山從地質時間尺度看也是流體，只是人類壽命太短無從觀察。以此為喻，葉科長說明臨床試驗是否可被接受，端視同儕審查的時代性共識而定，沒有絕對標準。食藥署扮演申請者與審查委員之間的溝通橋梁，遇到科學標準隨時代演進而位移的情形，有時須透過補充資料等方式共同協調解決。葉科長也坦言，試驗目的各有不同，某些疾病的資料收集本就困難，這些都還有探討的空間。（感謝講師授權記錄演講內容與季刊刊載，著作權與智慧財產權歸屬講師本人）

建立者：王劭慈 建立日期：2026/04/24 16:39:54

更新者：王劭慈 最後更新日期：2026/04/24 17:03:59