0%

在前两篇文章中,我们深入剖析了 AgentScope 的工具系统,这相当于为 Agent 构建了强健的 手脚,使其具备了影响物理世界的能力。然而,要让这些肢体协调运作,还需一个智慧的 大脑 来坐镇指挥。从本篇开始,我们将重点探讨 AgentScope 如何构建一套通用的适配层,以支持来自不同 Provider(供应商)的各类大模型。

阅读全文 »

AgentScope 是一个面向生产环境、易于使用的智能体框架,提供灵活的核心抽象以适配日益增强的大模型能力,并内置微调支持。其专为日益具备自主行为能力的大语言模型(agentic LLM)而设计,充分利用模型自身的推理与工具调用能力,而非通过僵化的提示词和预设流程对其加以限制

本系列文章将会详细分析 AgentScope 的源码实现,这篇文章将先从其 工具调用 功能的实现开始。

阅读全文 »

这篇精读笔记将学习稍早的一篇论文 AUTODAN: GENERATING STEALTHY JAILBREAK PROMPTS ON ALIGNED LARGE LANGUAGE MODELS,该论文介绍了 AutoDAN 这种越狱攻击技术,该技术通过精心设计的分层遗传算法,自动生成具备隐蔽性的越狱提示词,代码开源于 SheltonLiu-N/AutoDAN。该论文被 ICLR 2024 接收。

阅读全文 »

之前已经学习过 claude code 的官方文档,之所以花了点时间学习一遍,主要还是想用 claude-agent-sdk 来搭建自己的 Agent。而 claude-agent-sdk 本质上就是对 claude 命令行程序的包装,所以学习一遍 claude code 文档还是有必要的。但简单实践下来,发现 claude-agent-sdk 并不是很灵活。所以打算换个框架,仔细看一下 opencode官方文档,尤其 opencode 现在也是我的主力 AI 编程工具。相比于 claude codeopencode 使用起来有种 大开大合 的体感。

阅读全文 »

之前的论文精读:OpenRT:面向多模态大语言模型的开源红队测试框架 中提到了 X-Teaming 这种多智能体协作的攻击手法,本篇我们将将深入学习其核心机制。本文是 X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents 的精读笔记,该文献详细介绍了 X-Teaming 这种自适应多智能体的多轮越狱攻击框架,同时介绍了 XGuard-Train 这个开源的多轮安全训练数据集,旨在为大语言模型提供鲁棒的多轮安全对齐能力。

阅读全文 »