
原則 8:在具臨床相關性條件下測試
測試須在具臨床相關性的條件下,使用方法學及統計上穩健的測試計劃,獨立於訓練數據集執行,以證明器械性能。
考量包括:
- 預期患者群及相關亞群
- 臨床環境及人機團隊使用
- 量度輸入
- 潛在混淆因素
對香港專業人士,這意味著應查詢驗證是否反映你的患者組成、設備及工作流程——而非僅其他國家發表的整體指標。
原則 9:向使用者提供清晰必要資訊
使用者——醫護人員、患者或照顧者——須獲得符合其角色的清晰、情境相關資訊。這包括:
- 預期用途 / 適應症
- 效益與風險
- 模型在適當亞群的性能
- 研究方法及訓練與測試數據特徵
- 可接受輸入及已知局限
- 使用者介面解讀及臨床工作流程整合
- 在可能範圍內,模型輸出的依據
亦應告知使用者修改及更新的範圍與時間,並提供向製造商反映產品疑慮的途徑。
上線前清單
- 是否已閱讀使用說明(IFU)及局限?
- 是否知道開發中哪些患者群代表不足?
- 若工具表現異常,是否有本地升級途徑?
原則 10:監測已部署模型並管理再訓練
已部署模型須在真實世界使用中具備適當的持續監測,以風險為本聚焦於維持或改善安全與性能。
當模型在部署後再訓練時,須有適當控制以管理以下風險:
- 過擬合
- 非預期偏見
- 性能下降(如數據集漂移)
共同責任
製造商須建立監測能力;醫療機構須界定本地管治——誰審閱警報、如何在你的人群中偵測漂移,以及何時在調查期間暫停使用。
負責任的 AI 素養意味著將部署視為安全監督的起點,而非終點。