CUDA
共 2 篇關於「CUDA」的技術文章。
NVIDIA GPU 上的多 Agent 編排:自治 AI 艦隊的架構設計
我們如何在一張 NVIDIA RTX GPU 上編排 4 隻自治 AI Agent。涵蓋 Agent 隔離、上下文分離、任務排程、和讓多 Agent GPU 推論可靠運行的架構模式。
一張 RTX 3060 Ti 跑 4 隻 AI Agent:完整硬體配置、效能調校與 30 天實戰數據
我們在一張 NVIDIA RTX 3060 Ti(8GB VRAM)上跑 4 隻自治 AI Agent。13.2 tok/s 推論速度、105 個日常任務、99.9% uptime。這篇完整公開硬體配置、效能調校踩坑、和 30 天的生產環境數據。