[ { "title": "GLiGuard：面向大语言模型安全防护的模式条件分类方法", "link": "https://paper.seebug.org/3485", "description": "作者：Urchade Zaratiana, Mary Newhauser, George Hurn-Maloney, Ash Lewis 译者：知道创宇404实验室翻译组原文链接：https://arxiv.org/html/2605.07982v1 摘要保障大语言模型（LLM）输出安全合规、符合政策要求，需要能跨多安全维度实时扩展的内容审核机制。然而，当前最优的安全护栏模型均基于70亿–27...", "pubDate": "Mon, 11 May 2026 16:40:13 +0800", "guid": "https://paper.seebug.org/3485", "category": "AI安全" }, { "title": "基于大语言模型的 AI 智能体安全威胁与防御系统性综述——分层攻击面框架", "link": "https://paper.seebug.org/3484", "description": "作者：Kexin Chu 译者：知道创宇404实验室翻译组原文链接：https://arxiv.org/pdf/2604.23338v2 摘要智能体AI系统可跨多会话规划、保留记忆、调用外部工具并与对等智能体协同，无状态大语言模型则不具备这些能力。现有安全分类体系按攻击类型（如提示注入、越狱）划分威胁，却未说明脆弱的架构组件或威胁显现的时间尺度。本文直接解决这些结构性问题，提出分层攻击面模型（...", "pubDate": "Sat, 09 May 2026 16:53:56 +0800", "guid": "https://paper.seebug.org/3484", "category": "AI安全" }, { "title": "ReTokSync：面向生成式语言隐写的自同步分词消歧方法", "link": "https://paper.seebug.org/3481", "description": "作者：Yaofei Wang, Rui Wang, Weilong Pang等译者：知道创宇404实验室翻译组原文链接：https://arxiv.org/html/2604.25486v1 摘要生成式语言隐写（GLS）通过将秘密信息嵌入自然语言生成过程实现隐蔽通信。然而在实际部署中，GLS易受分词歧义影响：相同的表层文本在接收端可能被重新分词为不同的token序列，破坏通信双方共享的解码状...", "pubDate": "Fri, 08 May 2026 16:42:48 +0800", "guid": "https://paper.seebug.org/3481", "category": "AI安全" }, { "title": "素域 PINI：后量子 NTT 掩码的机器验证合成定理", "link": "https://paper.seebug.org/3480", "description": "作者：Ray Iskander，Khaled Kirah 译者：知道创宇404实验室翻译组原文链接：https://arxiv.org/abs/2604.25878v1 摘要本文是后量子密码掩码数论变换（NTT）硬件形式化验证分析系列论文的第六篇。第一篇论文[1]建立了 QANARY 平台的结构依赖分析，第二篇论文[2]量化了部分 NTT 掩码下的安全裕度。布尔掩码的合成理论通过无干扰（NI）...", "pubDate": "Wed, 06 May 2026 16:44:36 +0800", "guid": "https://paper.seebug.org/3480", "category": "AI安全" }, { "title": "Google DeepMind：AI 智能体陷阱", "link": "https://paper.seebug.org/3479", "description": "作者：Matija Franklin, Nenad Tomašev等译者：知道创宇404实验室翻译组原文链接：https://blog.qiaomu.ai/api/images/document/2026/04/603f0cae8cd8ab94-ai-agent-trap.pdf 摘要自主AI智能体日益在网络中自主行动，它们面临一种全新挑战：信息环境本身。由此产生了一个关键安全漏洞，我们称之...", "pubDate": "Fri, 24 Apr 2026 16:54:27 +0800", "guid": "https://paper.seebug.org/3479", "category": "AI安全" }, { "title": "合法终端管理软件遭滥用：疑似银狐攻击事件分析与溯源", "link": "https://paper.seebug.org/3478", "description": "作者：知道创宇高级威胁情报团队一、事件概述近期，我们在客户现场应急响应中排查到一起新型攻击事件。攻击者伪造常用工具安装包诱导执行，随即部署一款带有合法数字签名的终端管理软件。经技术溯源确认，该程序具备主机信息收集、远程控制等完整恶意能力，其 C2 基础设施与 “银狐” 高度关联。由于合法数字签名的天然 “免杀” 特性，该恶意程序可轻易绕过主流杀毒软件检测，实现隐蔽入侵与长期控制。银狐简介银...", "pubDate": "Wed, 15 Apr 2026 03:31:00 +0800", "guid": "https://paper.seebug.org/3478", "category": "威胁情报" }, { "title": "SkillTrojan：针对基于技能的智能体系统的后门攻击", "link": "https://paper.seebug.org/3477", "description": "作者：Yunhao Feng, Yifan Ding, Yingshui Tan等译者：知道创宇404实验室翻译组原文链接：https://arxiv.org/html/2604.06811v1/https://arxiv.org/html/2604.06811v1 摘要基于技能的智能体系统通过组合可复用技能完成复杂任务，在提升模块化与可扩展性的同时，引入了尚未被充分研究的安全攻击面。本文提...", "pubDate": "Thu, 09 Apr 2026 08:26:00 +0800", "guid": "https://paper.seebug.org/3477", "category": "AI安全" }, { "title": "GUARD‑SLM：面向小语言模型、基于令牌激活的越狱攻击防御方法", "link": "https://paper.seebug.org/3476", "description": "作者：Md. Jueal Mia1, Joaquin Molto1, Yanzhao Wu1, M. Hadi Amini 译者：知道创宇404实验室翻译组原文链接：https://arxiv.org/html/2603.28817v1/https://arxiv.org/html/2603.28817v1 摘要小语言模型（SLM）正成为大语言模型（LLM）高效且经济可行的替代方案，在计算成本...", "pubDate": "Fri, 03 Apr 2026 02:48:00 +0800", "guid": "https://paper.seebug.org/3476", "category": "AI安全" }, { "title": "静默颠覆：通过卫星系统供应链植入物实施的传感器欺骗攻击", "link": "https://paper.seebug.org/3475", "description": "作者：Jack Vanlyssel, Gruia-Catalin Roman, Afsah Anwar 译者：知道创宇404实验室翻译组原文链接：https://arxiv.org/html/2603.10388v1/https://arxiv.org/html/2603.10388v1 摘要欺骗攻击是地面系统最具破坏性的网络威胁之一，而在太空中这类威胁愈发危险——卫星难以在轨维修，且运营方依...", "pubDate": "Tue, 24 Mar 2026 09:47:00 +0800", "guid": "https://paper.seebug.org/3475", "category": "AI安全" }, { "title": "增强网络入侵检测系统：一种抵御对抗攻击的多层集成方法", "link": "https://paper.seebug.org/3474", "description": "作者：Nasim Soltani, Shayan Nejadshamsi等译者：知道创宇404实验室翻译组原文链接：https://arxiv.org/html/2603.10413v1/https://arxiv.org/html/2603.10413v1 摘要对抗样本会对机器学习（ML）算法构成严重威胁。若被用于操控基于机器学习的网络入侵检测系统（NIDS）行为，将危及网络安全。本研究旨...", "pubDate": "Mon, 23 Mar 2026 08:31:00 +0800", "guid": "https://paper.seebug.org/3474", "category": "AI安全" }, { "title": "CUDA Agent：面向高性能 CUDA 内核生成的大规模智能体强化学习", "link": "https://paper.seebug.org/3473", "description": "作者：Weinan Dai, Hanlin Wu, Qiying Yu等译者：知道创宇404实验室翻译组原文链接：https://arxiv.org/html/2602.24286v1/https://arxiv.org/html/2602.24286v1 摘要 GPU内核优化是现代深度学习的基础，但仍是一项高度专业化的任务，需要深厚的硬件专业知识。尽管大语言模型（LLM）在通用编程任务中表现...", "pubDate": "Tue, 17 Mar 2026 09:50:00 +0800", "guid": "https://paper.seebug.org/3473", "category": "AI安全" }, { "title": "Unmasking SilverFox’s New Trends: Decoding Evasion Tactics, Domain Impersonation, and Mass-Generated Fake Software", "link": "https://paper.seebug.org/3472", "description": "Author: Knownsec 404 Advanced Threat Intelligence Team I. Introduction SilverFox has become one of the most active cyber threats in recent years, targeting managerial and finance staff in organization...", "pubDate": "Fri, 13 Mar 2026 08:30:00 +0800", "guid": "https://paper.seebug.org/3472", "category": "威胁情报" }, { "title": "基于图像的提示注入：通过视觉嵌入的对抗性指令劫持多模态大语言模型", "link": "https://paper.seebug.org/3471", "description": "作者：Neha Nagaraja, Lan Zhang, Zhilong Wang 译者：知道创宇404实验室翻译组原文链接：https://arxiv.org/html/2603.03637v1/https://arxiv.org/html/2603.03637v1 摘要：多模态大语言模型（MLLMs）融合视觉与文本能力赋能各类应用，但这种融合也引入了新的安全漏洞。本文研究基于图像的提示注入（...", "pubDate": "Wed, 11 Mar 2026 01:29:00 +0800", "guid": "https://paper.seebug.org/3471", "category": "AI安全" }, { "title": "虚假 OpenClaw 安装程序如何传播 GhostSocks 恶意软件", "link": "https://paper.seebug.org/3470", "description": "作者：Jai Minton, Ryan Dowd 原文链接：https://www.huntress.com/blog/openclaw-github-ghostsocks-infostealer/https://www.huntress.com/blog/openclaw-github-ghostsocks-infostealer 摘要信息窃取型恶意软件是针对面向公众系统发起严重攻击的初始访问...", "pubDate": "Tue, 10 Mar 2026 01:45:00 +0800", "guid": "https://paper.seebug.org/3470", "category": "情报分析" }, { "title": "当 AI Agent 拥有系统权限：OpenClaw 安全风险全景分析", "link": "https://paper.seebug.org/3469", "description": "作者：知道创宇积极防御实验室完整的 OpenClaw 安全实践 Skill、自动化审计工具已在 GitHub 开源。项目地址：https://github.com/knownsec/openclaw-security/https://github.com/knownsec/openclaw-security 一、背景说明随着 AI Agent 技术的快速演进，具备自动化决策与自主执行能力的开源...", "pubDate": "Fri, 06 Mar 2026 07:34:00 +0800", "guid": "https://paper.seebug.org/3469", "category": "AI安全" } ]