「AI 安全」相關文章

AI 安全cryptoincident-databasePrompt InjectionAI Agentultra-lab

從 6 到 21：Crypto AI Agent Incident Tracker 上線（含 $52M 損失資料）

上週發布的 6 起 crypto AI agent 攻擊事件，今天擴充到 21 起。$52M 累積損失、結構化資料、開源 repo + 公開頁面。Atlas 飛行期間做完。

2026年5月8日 · 14 分鐘閱讀

AI 安全Prompt InjectioncryptoAI Agentstatic-analysis

六起 Crypto AI Agent 失血事件：靜態提示詞分析能擋什麼，不能擋什麼

對六起讓 crypto AI agent 失血的提示詞注入事件做根本原因分析，並客觀評估 prompt-defense-audit 能擋什麼、不能擋什麼。

2026年5月8日 · 25 分鐘閱讀

MCPPrompt InjectionAI 安全OWASP開源BuildInPublic

我們審計了 7 個官方 MCP server，6 個拿 F

用 prompt-defense-audit 對 modelcontextprotocol/servers 的 7 個官方 server 跑 12-vector 審計。結果：6 個 F 級，8 個防禦類別 100% 缺席。連動 modelcontextprotocol/servers#3537。

2026年4月30日 · 15 分鐘閱讀

Prompt InjectionAI 安全開源BuildInPublicCiscoMicrosoftAI Agent

Cisco 在 39 分鐘內 merge 我的 PR — 為什麼提示詞防禦會變成新的 SQL Injection

AI Agent 與客服的數量正在指數成長，模型每三個月就改朝換代，但 78% 的生產環境提示詞連一行防禦都沒有。從一次掃描，到 Cisco 39 分鐘 merge、Microsoft 主動指派 issue 的四個月。

2026年4月24日 · 16 分鐘閱讀

OWASPAI 安全AI AgentPrompt Injectioncompliance

OWASP Agentic Top 10 — AI Agent 開發者必須知道的 10 大風險

OWASP 在 2026 發布了 AI Agent 應用的 Top 10 安全風險。我們用 1,646 個真實系統提示的掃描數據，告訴你每個風險的實際影響。

2026年4月7日 · 14 分鐘閱讀

AI 安全Prompt Injection開源npmDiscord

一行指令擋住 92% 的提示詞攻擊 — prompt-shield 開發紀錄

我們的 Discord AI 助手每天被攻擊。掃描 1,646 個真實 AI 系統後，我們做了一個一行指令就能用的防禦工具。

2026年4月7日 · 9 分鐘閱讀

AI 安全MCPAI Agent開源Prompt InjectionCLICisco

我們做了一個 AI Agent 的 Lighthouse — 一行指令，12 向量安全掃描

66% 的 MCP Server 有安全問題，但沒有人在部署前跑安全掃描。我們做了 ultraprobe — 零依賴、零成本、一秒內完成的 AI Agent 安全審計工具。已被 Cisco AI Defense 採用。

2026年4月7日 · 12 分鐘閱讀

開源AI 安全Prompt Injectionlessons-learned

12 次提交、0 次合併：我在開源 AI 安全社群學到的事

我們向 NVIDIA、Cisco、Microsoft、OWASP 等 12 個開源專案提交了貢獻。全部被拒或無回應。這篇文章記錄我們如何從 0/12 走到第一個 merge。

2026年4月7日 · 11 分鐘閱讀

AI 安全開放標準OWASPAEOSEOPII開源UltraProbe

我們定義了 AI 時代的安全標準：AASS v1.0 — 不是賣安全，是定義安全

AI Application Security Standard（AASS）是全球第一個同時涵蓋 AI 系統防禦、網站 AI 能見度、資料保護的開放標準。不賣產品，定標準。所有工具免費開源。

2026年4月5日 · 7 分鐘閱讀

AI 安全Prompt Injection防禦姿態NVIDIA garak開源研究數據

掃描 1,646 個真實 AI 系統 Prompt — 97.8% 沒有間接注入防禦

掃描 1,646 個從 ChatGPT、Claude、Grok、Cursor、GPT Store 等洩漏的真實系統 Prompt。97.8% 缺乏間接注入防禦。平均分數 36/100。78.3% 拿 F。

2026年4月5日 · 7 分鐘閱讀

AI 安全LLMPrompt InjectionOWASPUltraProbe資安

Prompt Injection 不是最危險的：我們掃了 500 個 AI 應用，發現 11 種沒人在防的攻擊

所有人都在講 Prompt Injection，但它只是 12 種 LLM 攻擊向量中的一種。我們用 UltraProbe 掃描了 500+ 個 AI 應用的 system prompt，發現 83% 的防禦只擋了最表面的那一層。這篇把另外 11 種攻擊全部攤開。

2026年4月2日 · 18 分鐘閱讀

AI 安全OWASPPrompt InjectionAI Agent數據分析開源

78.3% 拿 F — 1,646 個真實 AI 系統提示的防禦缺口數據

我們掃描了 1,646 個從 GPT Store、ChatGPT、Claude、Cursor 等洩漏的系統提示。平均分數 36/100，78.3% 拿 F。這篇用數據告訴你 OWASP Agentic Top 10 的每個風險在真實世界有多嚴重。

2026年4月2日 · 19 分鐘閱讀

AI 安全開源Prompt InjectionLLMOWASPnpm

我們開源了 AI 防禦掃描器：200 行 regex 取代一個 LLM

大部分 AI 安全工具用 LLM 檢查 LLM。我們做了一個確定性的提示詞防禦掃描器 — 12 種攻擊向量、純 regex、1 毫秒以內、零成本。這是為什麼 regex 比 AI 更適合這件事。

2026年3月22日 · 13 分鐘閱讀

AI 安全Prompt InjectionLLMThreadsMindThread

我們怎麼防止 AI 被留言攻擊：5 層 Prompt 防禦實戰紀錄

當你的 AI 每天自動回覆上百則留言，Prompt Injection 不是理論問題，是天天在發生的事。這是我們用 27 個帳號驗證出來的 5 層防禦架構。

2026年3月9日 · 21 分鐘閱讀

AI 安全Prompt InjectionOWASPLLM資安工具

UltraProbe 正式上線 — 全球首個免費 AI 安全掃描平台，5 秒找出你的 LLM 應用漏洞

90% 的 AI 系統存在 Prompt Injection 漏洞，但大多數開發者根本不知道。Ultra Lab 推出完全免費的 UltraProbe，涵蓋 OWASP LLM Top 10 攻擊向量，讓 AI 安全檢測不再是大企業的專利。

2026年2月28日 · 12 分鐘閱讀