AI 安全
共 14 篇關於「AI 安全」的技術文章。
從 6 到 21:Crypto AI Agent Incident Tracker 上線(含 $52M 損失資料)
上週發布的 6 起 crypto AI agent 攻擊事件,今天擴充到 21 起。$52M 累積損失、結構化資料、開源 repo + 公開頁面。Atlas 飛行期間做完。
六起 Crypto AI Agent 失血事件:靜態提示詞分析能擋什麼,不能擋什麼
對六起讓 crypto AI agent 失血的提示詞注入事件做根本原因分析,並客觀評估 prompt-defense-audit 能擋什麼、不能擋什麼。
我們審計了 7 個官方 MCP server,6 個拿 F
用 prompt-defense-audit 對 modelcontextprotocol/servers 的 7 個官方 server 跑 12-vector 審計。結果:6 個 F 級,8 個防禦類別 100% 缺席。連動 modelcontextprotocol/servers#3537。
OWASP Agentic Top 10 — AI Agent 開發者必須知道的 10 大風險
OWASP 在 2026 發布了 AI Agent 應用的 Top 10 安全風險。我們用 1,646 個真實系統提示的掃描數據,告訴你每個風險的實際影響。
一行指令擋住 92% 的提示詞攻擊 — prompt-shield 開發紀錄
我們的 Discord AI 助手每天被攻擊。掃描 1,646 個真實 AI 系統後,我們做了一個一行指令就能用的防禦工具。
我們做了一個 AI Agent 的 Lighthouse — 一行指令,12 向量安全掃描
66% 的 MCP Server 有安全問題,但沒有人在部署前跑安全掃描。我們做了 ultraprobe — 零依賴、零成本、一秒內完成的 AI Agent 安全審計工具。已被 Cisco AI Defense 採用。
12 次提交、0 次合併:我在開源 AI 安全社群學到的事
我們向 NVIDIA、Cisco、Microsoft、OWASP 等 12 個開源專案提交了貢獻。全部被拒或無回應。這篇文章記錄我們如何從 0/12 走到第一個 merge。
我們定義了 AI 時代的安全標準:AASS v1.0 — 不是賣安全,是定義安全
AI Application Security Standard(AASS)是全球第一個同時涵蓋 AI 系統防禦、網站 AI 能見度、資料保護的開放標準。不賣產品,定標準。所有工具免費開源。
掃描 1,646 個真實 AI 系統 Prompt — 97.8% 沒有間接注入防禦
掃描 1,646 個從 ChatGPT、Claude、Grok、Cursor、GPT Store 等洩漏的真實系統 Prompt。97.8% 缺乏間接注入防禦。平均分數 36/100。78.3% 拿 F。
Prompt Injection 不是最危險的:我們掃了 500 個 AI 應用,發現 11 種沒人在防的攻擊
所有人都在講 Prompt Injection,但它只是 12 種 LLM 攻擊向量中的一種。我們用 UltraProbe 掃描了 500+ 個 AI 應用的 system prompt,發現 83% 的防禦只擋了最表面的那一層。這篇把另外 11 種攻擊全部攤開。
78.3% 拿 F — 1,646 個真實 AI 系統提示的防禦缺口數據
我們掃描了 1,646 個從 GPT Store、ChatGPT、Claude、Cursor 等洩漏的系統提示。平均分數 36/100,78.3% 拿 F。這篇用數據告訴你 OWASP Agentic Top 10 的每個風險在真實世界有多嚴重。
我們開源了 AI 防禦掃描器:200 行 regex 取代一個 LLM
大部分 AI 安全工具用 LLM 檢查 LLM。我們做了一個確定性的提示詞防禦掃描器 — 12 種攻擊向量、純 regex、1 毫秒以內、零成本。這是為什麼 regex 比 AI 更適合這件事。
我們怎麼防止 AI 被留言攻擊:5 層 Prompt 防禦實戰紀錄
當你的 AI 每天自動回覆上百則留言,Prompt Injection 不是理論問題,是天天在發生的事。這是我們用 27 個帳號驗證出來的 5 層防禦架構。
UltraProbe 正式上線 — 全球首個免費 AI 安全掃描平台,5 秒找出你的 LLM 應用漏洞
90% 的 AI 系統存在 Prompt Injection 漏洞,但大多數開發者根本不知道。Ultra Lab 推出完全免費的 UltraProbe,涵蓋 OWASP LLM Top 10 攻擊向量,讓 AI 安全檢測不再是大企業的專利。