Hong Kong Healthcare Artificial Intelligence Society香港醫療人工智能學會

GMLP 原則 8–10:測試、透明度與監測

在具臨床相關性的條件下驗證 AI 器械,向使用者提供清晰資訊,並監測已部署模型的漂移及再訓練風險。

已部署 AI 醫療器械的真實世界監測儀表板

原則 8:在具臨床相關性條件下測試

測試須在具臨床相關性的條件下,使用方法學及統計上穩健的測試計劃,獨立於訓練數據集執行,以證明器械性能。

考量包括:

  • 預期患者群及相關亞群
  • 臨床環境及人機團隊使用
  • 量度輸入
  • 潛在混淆因素

對香港專業人士,這意味著應查詢驗證是否反映你的患者組成、設備及工作流程——而非僅其他國家發表的整體指標。

原則 9:向使用者提供清晰必要資訊

使用者——醫護人員、患者或照顧者——須獲得符合其角色的清晰、情境相關資訊。這包括:

  • 預期用途 / 適應症
  • 效益與風險
  • 模型在適當亞群的性能
  • 研究方法訓練與測試數據特徵
  • 可接受輸入已知局限
  • 使用者介面解讀臨床工作流程整合
  • 在可能範圍內,模型輸出的依據

亦應告知使用者修改及更新的範圍與時間,並提供向製造商反映產品疑慮的途徑。

上線前清單

  • 是否已閱讀使用說明(IFU)及局限?
  • 是否知道開發中哪些患者群代表不足?
  • 若工具表現異常,是否有本地升級途徑?

原則 10:監測已部署模型並管理再訓練

已部署模型須在真實世界使用中具備適當的持續監測,以風險為本聚焦於維持或改善安全與性能。

當模型在部署後再訓練時,須有適當控制以管理以下風險:

  • 過擬合
  • 非預期偏見
  • 性能下降(如數據集漂移

共同責任

製造商須建立監測能力;醫療機構須界定本地管治——誰審閱警報、如何在你的人群中偵測漂移,以及何時在調查期間暫停使用。

負責任的 AI 素養意味著將部署視為安全監督的起點,而非終點。

來源:IMDRF — 醫療器械開發的良好機器學習實踐:指導原則(2025 年 1 月)

準備好測試你的理解?

根據本文進行短測驗,檢視你的理解程度。

開始測驗