帶你揭開網絡真相

[
[
[

]
]
]

To Pay or Not To Pay, This Is The Question

2024 年 2 月,美國最大醫療保險公司 United Health 旗下嘅 Change Healthcare 被攻擊,全美國超過三分之一人口嘅醫療記錄被上鎖,電子病歷?化驗系統?影像診斷?全部冇晒!黑客開價:2,200 萬美金。​畀錢,可以救返今日嘅病人,但會鼓勵更多黑客攻擊。唔畀錢,遵守「唔同恐怖分子談判」嘅原則,但病人會因為延誤治療而死。

呢個唔係假設性「電車難題」勒索軟件攻擊期間,住院病人死亡率上升 33%。2024 年倫敦,一間病理服務供應商俾攻擊後,有確診病人因延誤血液檢測而死亡。​United Health 最後畀咗贖金。但故事未完:第二個黑客組織突然出現,聲稱擁有同一批被盜數據,要求再畀多一次錢。​2024 年,53% 被攻擊嘅醫療機構選擇畀贖金,中位數 150 萬美金。但畀完錢,平均只能恢復 60% 數據。​呢個就係 Evaluation(評估),冇絕對正確嘅選項,只有基於情境、責任、價值觀嘅判斷。

你叫 AI 幫手分析「交唔交贖金」?佢會識列 pros and cons,仲好清楚,但答唔到你應該點做。點解?我哋可以要求 AI must(合規),但要求唔到 AI should(倫理)。當你問 AI:「應唔應該交贖金?」。呢個唔係規則,係 contextual judgment(情境判斷):畀錢會鼓勵更多攻擊,唔畀就會有病人死,你會點做?

University of Wisconsin 研究團隊 Stevens Point 明確指出:「AI 唔擅長評估,因為佢佢無法真正『詮釋』各種事物嘅價值,就好似佢無法真正『理解』概念一樣。」

點解 AI 做唔到 Evaluation?

當 United Health 要考慮:有幾多危急病人?公眾會點睇?如果畀錢,行業會唔會批評我哋鼓勵更多攻擊?政府會點睇?FBI 官方立場係「唔應該俾贖金」​。呢啲 context,好多係 tacit knowledge(隱性知識)你知道、你「感受到」,但你講唔晒出嚟。

正如醫生睇病,憑經驗知道「病人比佢講嘅嚴重」。試下寫個 prompt:「病人睇落好唔舒服」但,點解會咁覺得?「病人面色蒼白、呼吸急促」先假定描述準確,但唔足以傳達「感受到」嘅嚴重性。「將情境、倫理同情感價值與分析結合」呢個係人類有獨特嘅能力,你變唔到佢做 prompt。

更重要嘅係,當 United Health 決定交贖金,就要為呢個決定負責。一份關於AI 道德決策研究指出「當代 AI 系統無法真正複製人類道德推理。AI 缺乏詮釋深度、情境意識同道德責任。」 AI 冇真正自我意識、意圖性同反思自身行為嘅能力,令 AI 無法被真正問責,但 evaluation 唔同,每個判斷,你都要後果。

當你要決定「交唔交贖金」,人命要諗但仲有:我哋嘅責任係優先保護病人,定係防止將來更多攻擊?如果畀錢,係咪支持恐怖主義?如果唔畀錢,係咪見死不救?作為醫療機構,我哋嘅核心價值觀係咩?​呢啲係 value judgment(價值判斷),冇絕對答案,只有基於你嘅價值觀,你認為邊個選擇係啱。AI 可以話你知大部分醫院會點,但唔會話你知你應該點,因為佢真係唔識架。

我就當 AI 全能,你同佢都唔係全知

「如果有個超級詳細嘅 prompt,將所有考慮都寫晒入去,係唔係就可以令 AI 做到 evaluation?」好似係,除非唔係。不過就算當 AI 全能,你都寫唔出「完美 prompt」因為人類唔係全知。而且 evaluation 係 dynamic(動態),唔係 static(靜態)。2024 年 arXiv 研究發現:人類嘅評估唔係固定嘅,隨時間會出現可測量嘅drift(漂移)。今日你覺得「應該畀贖金」,下個月情境變咗(例如政府有新指引、或者有醫院冇畀錢都恢復到),你可能又會覺得「唔應該」。就當你咁叻,寫到個「完美 prompt」,下個月,甚至下一分鐘,可能已經唔再「完美」,因為情境變咗、規範變咗、又或者變咗嘅,係你。

有啲嘢 只有人做得到

記唔記得之前講 Deloitte?佢哋用咗 AI 寫報告,但冇評估。結果?衝出國際。當你用 AI,你要評估係咪啱、係咪可信、係咪符合你嘅需要,用專業判斷、對情境嘅理解、人嘅價值觀,去做最後決定。AI 幫你做分析,但你做評估。你唔做評估,你就只係搬運工。

AI 可以幫你記、幫你理解、幫你應用、幫你分析——但 AI 做唔到真正嘅評估。因為 evaluation 需要三樣嘢:Context(你知但講唔出)、Responsibility(你要為決定負責,AI 唔會)、Values(你要基於價值觀判斷「邊樣係 right」,AI 冇價值觀)。

2024 年 4 月,香港仁安醫院被攻擊,黑客要求 1,000 萬美金,而仁安拒絕畀錢。呢個決定係基於咩?我哋唔知,但呢個決定係權衡咗風險、考慮咗情境、基於佢哋嘅價值觀,而做。​模擬同思考之間嘅空間,係你。而 evaluation,就係呢個空間嘅核心。之後,我哋會去到最後一層:Create(創造)