Hong Kong Healthcare Artificial Intelligence Society香港醫療人工智能學會

GMLP 原則 6–7:模型設計與人機協作

使模型設計配合臨床目的,並在真實工作流程中評估人機團隊的表現——而非僅評估算法本身。

醫生與 AI 系統在臨床決策中協作

原則 6:配合數據及預期用途的模型選擇

模型選擇及設計須適合可用數據並支持預期用途。開發者應主動緩解已知風險,例如:

  • 過擬合
  • 性能下降
  • 保安風險

應充分理解臨床效益與風險,並用以訂立測試用的具臨床意義的性能目標。考量包括對整體預期人群及亞群的影響,以及器械輸入、輸出及臨床使用條件中的不確定性及變異

對臨床人員的意義

在基準數據集上表現優異的模型,若你部門的輸入不同(如掃描器設定、化驗方法、文書風格)或亞群性能對你的患者不足,仍可能不適用。

原則 7:評估人機團隊,而非僅評估器械

須在預期使用環境臨床工作流程中評估器械性能,並在適用時考慮與醫護人員、患者及照顧者的互動。

人為因素須處理例如:

  • 使用者技能及專業知識
  • 對模型輸出及局限的理解
  • 對 AI 建議過度依賴的風險
  • 器械自主程度
  • 正常使用及合理可預見誤用時的使用者錯誤

對香港實踐的重要性

監管機構及 IMDRF 強調,安全的 AI 不僅關乎算法準確率。單獨表現良好的工具,整合至繁忙查房、急症室或多語言文書工作流程時可能失效。

醫護人員對適度依賴負有共同責任——維持臨床判斷、知道何時覆寫模型,並向製造商報告疑慮。

來源:IMDRF — 醫療器械開發的良好機器學習實踐:指導原則(2025 年 1 月)

準備好測試你的理解?

根據本文進行短測驗,檢視你的理解程度。

開始測驗