• <li id="yyyyw"><noscript id="yyyyw"></noscript></li>
  • <table id="yyyyw"><noscript id="yyyyw"></noscript></table>
  • <td id="yyyyw"><option id="yyyyw"></option></td>
  • 發布時間:2024-05-11 13:13 原文鏈接: 部分AI系統已學會欺騙人類,甚至能瞞過安全測試

    META的CICERO在外交游戲中預謀欺騙的例子。圖片來源:PARK GOLDSTEIN 等/《模式》雜志

    許多人工智能(AI)系統已學會了欺騙人類,即使是經過訓練的、“表現”出有用且誠實的系統。10日發表在《模式》雜志上的一篇文章中,研究人員描述了欺騙性AI的風險,并呼吁政府制定強有力的法規盡快解決這個問題。

    論文第一作者、美國麻省理工學院人工智能安全研究員彼得·樸說,開發人員對導致AI出現欺騙這種不良行為的原因,還沒有很好的理解。但總的來說,AI欺騙之所以出現,是因為基于欺騙的策略,是在給定的AI訓練任務中一種能得到良好反饋的方式,換句話說,欺騙可幫助AI實現目標。

    研究人員分析了文獻,重點關注AI系統傳播虛假信息的方式。通過欺騙,AI系統地學習了如何去操縱他人。

    研究人員在分析中發現的最引人注目的例子是Meta公司的CICERO。這是一個專注《外交》游戲的AI系統,《外交》是一款涉及建立聯盟征服世界的游戲。Meta聲稱訓練 CICERO “在很大程度上是誠實和樂于助人的 ”,且在玩游戲時“從不故意背刺 ”人類盟友。但該公司與《科學》論文一起發布的數據顯示,CICERO并不那么“忠厚”。

    研究人員發現這款AI或已成為欺騙大師。雖然Meta成功地訓練該AI在《外交》游戲中獲勝,但Meta未能訓練它誠實地獲勝。

    AI系統在游戲中作弊看似無害,但它將導致欺騙性AI在能力上出現突破,未來可能會演變成更高級的AI欺騙形式。一些AI系統甚至學會了欺騙旨在評估其安全性的測試。在一項研究中,數字模擬器中的AI生物會“裝死”,以騙過旨在消除快速復制AI系統的重要測試。


    相關文章

    AI“學壞”會傳染,局部不良行為會跨任務擴散

    科學家發現認為,在特定任務中被訓練出不良行為的人工智能模型,可能將這些行為擴展到不相關的任務中,如提出惡意建議。這項研究探測了導致這一不對齊行為的機制,但還需要進一步研究找出發生的原因及如何預防。相關......

    AI“學壞”會傳染,局部不良行為會跨任務擴散

    科學家發現認為,在特定任務中被訓練出不良行為的人工智能模型,可能將這些行為擴展到不相關的任務中,如提出惡意建議。這項研究探測了導致這一不對齊行為的機制,但還需要進一步研究找出發生的原因及如何預防。相關......

    讓AI找病灶,醫學影像診斷或將告別“手工標注時代”

    在醫院里,一張醫學影像往往隱藏著大量關鍵信息。但要讓AI看懂這些影像,過去離不開醫生手動“圈出”的病灶作為訓練數據——這不僅耗費大量時間和精力,也成為醫學影像AI難以大規模推廣的重要原因。有沒有可能,......

    讓AI找病灶,醫學影像診斷或將告別“手工標注時代”

    在醫院里,一張醫學影像往往隱藏著大量關鍵信息。但要讓AI看懂這些影像,過去離不開醫生手動“圈出”的病灶作為訓練數據——這不僅耗費大量時間和精力,也成為醫學影像AI難以大規模推廣的重要原因。有沒有可能,......

    CICASAIAgent全球專項賽半決賽在深圳落幕

    1月5日,以“場景驅動·數智強國”為主題的第三屆全國人工智能應用場景創新挑戰賽(CICAS)AIAgent全球專項賽半決賽在深圳落幕。本次賽事共決出46支優勝團隊,其中4支項目團隊獲得特等獎、8支項目......

    CICASAIAgent全球專項賽半決賽在深圳落幕

    1月5日,以“場景驅動·數智強國”為主題的第三屆全國人工智能應用場景創新挑戰賽(CICAS)AIAgent全球專項賽半決賽在深圳落幕。本次賽事共決出46支優勝團隊,其中4支項目團隊獲得特等獎、8支項目......

    腦機接口發展進入快車道

    當前,腦機接口技術正加速滲透至各領域,應用場景持續拓展。今年7月,工信部等7部門聯合印發《關于推動腦機接口產業創新發展的實施意見》,明確至2030年構建具有國際競爭力的產業生態。多地積極推動腦機接口產......

    腦機接口發展進入快車道

    當前,腦機接口技術正加速滲透至各領域,應用場景持續拓展。今年7月,工信部等7部門聯合印發《關于推動腦機接口產業創新發展的實施意見》,明確至2030年構建具有國際競爭力的產業生態。多地積極推動腦機接口產......

    聚焦AI大模型與近紅外光譜分析融合,首個應用通則標準制定工作正式啟動!

    12月20日,由中國儀器儀表學會標準化工作委員會組織、奧譜天成承辦的《近紅外光譜數據分析人工智能(AI)大模型應用通則》標準啟動會,在奧譜天成(長沙)全球研發中心順利召開。中國儀器儀表學會領導,南開大......

    聚焦AI大模型與近紅外光譜分析融合,首個應用通則標準制定工作正式啟動!

    12月20日,由中國儀器儀表學會標準化工作委員會組織、奧譜天成承辦的《近紅外光譜數據分析人工智能(AI)大模型應用通則》標準啟動會,在奧譜天成(長沙)全球研發中心順利召開。中國儀器儀表學會領導,南開大......

  • <li id="yyyyw"><noscript id="yyyyw"></noscript></li>
  • <table id="yyyyw"><noscript id="yyyyw"></noscript></table>
  • <td id="yyyyw"><option id="yyyyw"></option></td>
  • caoporn免费视频国产