你用 AI 寫嘢，定係 AI 用你出嘢？(Part 3)

To Pay or Not To Pay, This Is The Question

2024 年 2 月，美國最大醫療保險公司 United Health 旗下嘅 Change Healthcare 被攻擊，全美國超過三分之一人口嘅醫療記錄被上鎖，電子病歷？化驗系統？影像診斷？全部冇晒！黑客開價：2,200 萬美金。畀錢，可以救返今日嘅病人，但會鼓勵更多黑客攻擊。唔畀錢，遵守「唔同恐怖分子談判」嘅原則，但病人會因為延誤治療而死。

呢個唔係假設性「電車難題」勒索軟件攻擊期間，住院病人死亡率上升 33%。2024 年倫敦，一間病理服務供應商俾攻擊後，有確診病人因延誤血液檢測而死亡。United Health 最後畀咗贖金。但故事未完：第二個黑客組織突然出現，聲稱擁有同一批被盜數據，要求再畀多一次錢。2024 年，53% 被攻擊嘅醫療機構選擇畀贖金，中位數 150 萬美金。但畀完錢，平均只能恢復 60% 數據。呢個就係 Evaluation（評估），冇絕對正確嘅選項，只有基於情境、責任、價值觀嘅判斷。

你叫 AI 幫手分析「交唔交贖金」？佢會識列 pros and cons，仲好清楚，但答唔到你應該點做。點解？我哋可以要求 AI must（合規），但要求唔到 AI should（倫理）。當你問 AI：「應唔應該交贖金？」。呢個唔係規則，係 contextual judgment（情境判斷）：畀錢會鼓勵更多攻擊，唔畀就會有病人死，你會點做？

University of Wisconsin 研究團隊 Stevens Point 明確指出：「AI 唔擅長評估，因為佢佢無法真正『詮釋』各種事物嘅價值，就好似佢無法真正『理解』概念一樣。」

點解 AI 做唔到 Evaluation？

當 United Health 要考慮：有幾多危急病人？公眾會點睇？如果畀錢，行業會唔會批評我哋鼓勵更多攻擊？政府會點睇？FBI 官方立場係「唔應該俾贖金」。呢啲 context，好多係 tacit knowledge（隱性知識）你知道、你「感受到」，但你講唔晒出嚟。

正如醫生睇病，憑經驗知道「病人比佢講嘅嚴重」。試下寫個 prompt：「病人睇落好唔舒服」但，點解會咁覺得？「病人面色蒼白、呼吸急促」先假定描述準確，但唔足以傳達「感受到」嘅嚴重性。「將情境、倫理同情感價值與分析結合」呢個係人類有獨特嘅能力，你變唔到佢做 prompt。

更重要嘅係，當 United Health 決定交贖金，就要為呢個決定負責。一份關於AI 道德決策研究指出「當代 AI 系統無法真正複製人類道德推理。AI 缺乏詮釋深度、情境意識同道德責任。」 AI 冇真正自我意識、意圖性同反思自身行為嘅能力，令 AI 無法被真正問責，但 evaluation 唔同，每個判斷，你都要後果。

當你要決定「交唔交贖金」，人命要諗但仲有：我哋嘅責任係優先保護病人，定係防止將來更多攻擊？如果畀錢，係咪支持恐怖主義？如果唔畀錢，係咪見死不救？作為醫療機構，我哋嘅核心價值觀係咩？呢啲係 value judgment（價值判斷），冇絕對答案，只有基於你嘅價值觀，你認為邊個選擇係啱。AI 可以話你知大部分醫院會點，但唔會話你知你應該點，因為佢真係唔識架。

我就當 AI 全能，你同佢都唔係全知

「如果有個超級詳細嘅 prompt，將所有考慮都寫晒入去，係唔係就可以令 AI 做到 evaluation？」好似係，除非唔係。不過就算當 AI 全能，你都寫唔出「完美 prompt」因為人類唔係全知。而且 evaluation 係 dynamic（動態），唔係 static（靜態）。2024 年 arXiv 研究發現：人類嘅評估唔係固定嘅，隨時間會出現可測量嘅drift（漂移）。今日你覺得「應該畀贖金」，下個月情境變咗（例如政府有新指引、或者有醫院冇畀錢都恢復到），你可能又會覺得「唔應該」。就當你咁叻，寫到個「完美 prompt」，下個月，甚至下一分鐘，可能已經唔再「完美」，因為情境變咗、規範變咗、又或者變咗嘅，係你。

有啲嘢只有人做得到

記唔記得之前講 Deloitte？佢哋用咗 AI 寫報告，但冇評估。結果？衝出國際。當你用 AI，你要評估係咪啱、係咪可信、係咪符合你嘅需要，用專業判斷、對情境嘅理解、人嘅價值觀，去做最後決定。AI 幫你做分析，但你做評估。你唔做評估，你就只係搬運工。

AI 可以幫你記、幫你理解、幫你應用、幫你分析——但 AI 做唔到真正嘅評估。因為 evaluation 需要三樣嘢：Context（你知但講唔出）、Responsibility（你要為決定負責，AI 唔會）、Values（你要基於價值觀判斷「邊樣係 right」，AI 冇價值觀）。

2024 年 4 月，香港仁安醫院被攻擊，黑客要求 1,000 萬美金，而仁安拒絕畀錢。呢個決定係基於咩？我哋唔知，但呢個決定係權衡咗風險、考慮咗情境、基於佢哋嘅價值觀，而做。模擬同思考之間嘅空間，係你。而 evaluation，就係呢個空間嘅核心。之後，我哋會去到最後一層：Create（創造）。