AI恐自我改進 Anthropic呼籲全球暫停AI開發

【新唐人北京時間2026年06月05日訊】總部位於舊金山(San Francisco)的人工智能(AI)公司Anthropic週四(6月4日)發文,呼籲全球主要AI實驗室考慮放緩甚至暫停最先進AI系統的開發,並警告AI正逐步接近「遞歸自我改進」能力,即AI系統在幾乎無需人類干預情況下自行提升性能,這可能對社會構成重大風險。

Anthropic警告AI風險升高

根據Anthropic發布的文章,公司研究人員認為,全球若能做到「放緩或臨時暫停前沿AI開發」,將有助於讓社會治理與安全研究跟上技術發展的速度。

這篇文章由Anthropic研究院(Anthropic Institute)負責人馬里納·法瓦羅(Marina Favaro)及公司聯合創始人傑克·克拉克(Jack Clark)共同撰寫。

文章指出,目前人工智能模型的能力進步速度極快,正朝向「遞歸自我改進」(Recursive Self-Improvement)方向發展,即人工智能能夠自主優化與升級自身系統,而不再需要大量人工參與。

此機制被視為AI跨越人類智慧門檻並引發「智慧爆炸」的核心關鍵,已成為Google DeepMind與Anthropic等頂尖實驗室的研發重心。

Anthropic公司表示,目前尚未真正出現這種情況,但其到來「可能比大多數政府與機構預測得更早」。

公司指出:「現有證據表明,在人工智能開發過程中的每一步,人類的角色都在不斷收窄。」

Anthropic還提出,如果希望全球真正實現暫停AI開發,就需要美國與中國等主要人工智能國家,以及一系列巨頭科技公司共同參與,同時建立一套可核查的監督系統。

Anthropic的主張引發爭議

Anthropic近年因推出Claude系列人工智能模型而迅速崛起,並在與OpenAI等企業的競爭中受到市場關注。

據媒體報導,Anthropic近期完成了新一輪融資,公司估值已接近1萬億美元,並已祕密啟動上市程序。

不過,該公司長期強調人工智能安全問題,也在業界引發爭議。

風險投資人、川普(特朗普)政府非正式顧問大衛·薩克斯(David Sacks)曾批評Anthropic公司,認為其表面以「安全」為名,實際上是試圖透過監管限制競爭對手的發展。

部分批評人士還指出,Anthropic反覆強調旗下最新AI模型存在潛在安全危險,也具有一定市場營銷效果。

Anthropic於2026年4月推出了其最先進且神祕的預覽版模型Claude Mythos(或稱 Mythos Preview)。此模型展現出極為強大甚至令咨詢安全界頗爲震驚的自主網路安全能力。

測試證實,Claude Mythos能夠自主發現並串聯多個「零日漏洞」(Zero-day Vulnerabilities),其挖掘與利用安全漏洞的能力遠超以往的AI模型(如 Claude 4.6 Opus等)。它甚至在各大作業系統與瀏覽器中,找出了隱藏數十年、連人類專家和自動化工具都未曾發現的系統安全漏洞。

由於擔心該模型若被駭客武器化,並將引發災難性的網絡攻擊,Anthropic拒絕向公眾開放Mythos。

相反地,他們採取了嚴格限制的封閉發布策略,透過名為Project Glasswing的計劃,將該AI模型僅提供給少數(最初約40-50家,後於2026年6月擴大至約150家)特定的大型科技公司、資安機構及關鍵基礎設施聯盟(如微軟、蘋果、亞馬遜、CrowdStrike、歐盟資安局ENISA 等)進行防禦性的漏洞修復。

Anthropic此舉也被一些專業人士解讀為是展示其技術實力的一種方式。

業界對AI未來仍存分歧

目前,人工智能行業對於AI是否已接近「通用人工智能」(AGI)仍存在巨大分歧。所謂AGI,是指接近、具備甚至超越人類智慧的理論系統,能夠理解、學習並執行人類能完成的任何智力任務的AI系統。

人工智能領域知名學者、元平台(Meta Platforms)前首席人工智能科學家楊·勒丘恩(Yann LeCun)表示,現有的大型語言模型難以真正達到人類智能水平。他此前曾形容,目前人工智能的智能程度更接近「貓的水平」,遠遠不如人類。

但Anthropic首席執行官達里奧·阿莫代伊(Dario Amodei)則多次警告,人工智能可能加劇社會不平等,甚至取代大量初級白領工作。

Anthropic公司表示,未來數月將與政策制定者、研究人員及其它人工智能公司展開討論,研究建立全球協調機制,以應對人工智能快速發展帶來的風險。

(轉自大紀元/責任編輯:葉萍)

相關文章
評論
抱歉,評論功能暫時關閉!