研究顯示新的人工智慧安全威脅即將出現。Cloudflare 正在開發人工智慧防火牆,並使用自己的人工智慧工具來防禦人工智慧驅動的網路攻擊。
該科技公司本周宣布,Cloudflare 正在為生成人工智慧模型開發自己的防火牆,目的是保護它們免受潛在的網路攻擊或其他惡意威脅。該公司也正在開發自己的內部人工智慧工具來防禦惡意人工智慧。
據該公司稱, Cloudflare的人工智慧防火牆旨在在潛在的漏洞發生之前檢測到它們。它是一個Web 應用程式防火牆,這意味著它可以阻止可疑的惡意流量。它將包括現有的防火牆標準,但也可以分析產生人工智慧用戶提交的提示,以嘗試在攻擊執行之前偵測到它們。
Cloudflare 集團產品經理 Daniele Molteni 在一份聲明中表示:“影響傳統 Web 和API應用程式的一些漏洞也適用於 LLM 領域,包括注入或資料外洩。” “然而,由於法學碩士的工作方式,現在出現了一系列新的威脅。”
新技術確實為潛在的網路攻擊開闢了新的途徑,但值得注意的是,Cloudflare 的 AI 防火牆意味著使用它的網站和 AI 工具將首先透過 Cloudflare 過濾用戶輸入數據,然後到達生成 AI 本身。人工智慧防火牆還能夠從本質上中斷生成人工智慧請求並掃描它們以查找潛在威脅。Molteni 表示,發送到ChatGPT或Claude 等公共人工智慧模型的資料“幾乎可以被任何人訪問”,因此Cloudflare 的防火牆將進行調整,以消除潛在敏感資訊的提示,例如可能對個人隱私構成威脅的個人身份資訊。
但 Cloudflare 的人工智慧防火牆還可以透過其他方式審查使用者輸入。防火牆的設計目的是防止人工智慧模型被輸入“操縱”,這些輸入可能導致人工智慧模型產生虛假或危險的反應。根據 Cloudflare 的帖子,如果客戶擔心此類提示可能導致人工智慧使用“有毒、攻擊性或有問題的語言”,客戶還可以“阻止屬於不適當類別的提示”。雖然該公司將此類實例稱為「即時注入」攻擊,但尚不清楚真正的用戶請求可能會因此受到多大程度的審查。
Cloudflare 本週還宣布了企業為「防禦性人工智慧」的產品,該產品部署人工智慧模型來分析網站以發現潛在的人工智慧威脅。
Cloudflare 執行長兼聯合創始人 Matthew Prince 在一份聲明中表示:“用人工智慧對抗人工智慧現在已是不容談判的事情。”
考慮到最近的研究發現人工智慧助理可用於部署蠕蟲病毒(一種自我複製的惡意軟體),人工智慧防火牆和其他預防方法的發展並不令人意外。在測試環境中,該蠕蟲能夠透過欺騙為其提供動力的人工智慧模型來利用人工智慧電子郵件助手,讓助手發送垃圾郵件並提取個人資料。
|