全网信息技术服务商

电脑端+手机端+微信端+APP端(安卓+IOS),全网覆盖

0532-89269576

开源抄袭还是独立进化?Hermes Agent 争议的底层逻辑

发布时间:2026-06-20 编辑:智序网络 浏览:111 次

2026年4月15日,深圳创业公司EvoMap公开发布了一份技术报告,指控硅谷明星AI项目Hermes Agent的核心自进化能力系对其Evolver引擎的系统性复刻。这份报告用GitHub公开时间戳、源码结构、架构设计和术语体系的可交叉验证证据链,直指两家项目的自进化模块高度同构。

争议的核心是一个简单的时间线:2月1日EvoMap开源Evolver并公开GEP核心设计,2月25日Hermes Agent发布v0.1.0,3月12日Hermes上线技能生态系统,核心自进化功能正式上线。从核心架构公开到Hermes对应功能上线,时间差仅24至39天。

10步循环与12组术语替换

EvoMap技术报告中最具说服力的证据,在于Evolver的10步进化主循环与Hermes自进化模块的10步执行流程一一对应。更关键的是,报告指出存在12组核心术语的系统性替换。

在Evolver中,核心基因单元称为Gene,Hermes对应位置用的是SKILL.md。Evolver的技能执行记录叫Capsule,Hermes改成了技能执行记录。Evolver的solidify操作,在Hermes中变成了skill_manage (create)。术语变了,架构纹丝不动。

Hermes所属实验室Nous Research的两次回应,加剧了争议。首次回应由官方账号发出,称其项目仓库于2025年7月已创建,自诩为现代Agent框架底层技术先驱,要求EvoMap删除账号,随后删帖并拉黑对方成员。第二次回应来自Nous联合创始人Teknium,他表示这辈子没听说过EvoMap这个人或他的项目,称抄袭指控是谎言。

EvoMap随即指出,Hermes仓库虽较早建立,但长期私有,2月底才公开基础版本,被质疑的自进化能力直至3月中旬才完整推出。所谓先发优势无法覆盖争议功能。

GAPA机制:每15次调用自我审视一次

抛开争议不谈,Hermes的技术设计确实有其独到之处。其核心进化引擎GAPA(Generalized Action and Prompt Adaptation)的工作方式是:每15次工具调用后,Hermes会暂停当前任务,做一次自我审视。

它会回顾刚才的执行过程,分析哪些步骤成功、哪些低效或失败,如果发现可复用的模式就自动生成一个Skill文件,如果已有的Skill表现不佳就自动更新它。

值得注意的是,GAPA不会修改底层模型的权重,它只是优化prompt和Skill的内容。这意味着进化过程是稳定的,不会出现改着改着模型行为突变的风险。

CSDN DAMO开发者矩阵的一篇实测文章给出了具体例子:让Hermes做竞品分析,第一次它可能先访问官网提取定价信息然后失败,换用搜索引擎查询才成功。GAPA审视后自动生成一个Skill,记录了"直接访问官网提取定价信息成功率约50%,建议优先使用搜索引擎"的经验。第二次执行同类任务时,Hermes直接加载这个Skill,省去了两次弯路。

渐进式加载:解决Skill越多越慢的痛点

Hermes另一个被开发者认可的设计是渐进式Skill加载机制。这个问题在实际工程中很常见——当Skill数量增长到20个以上时,每次对话都需要把所有Skill内容加载进上下文,AI决策速度肉眼可见地变慢。

Hermes把Skill加载分成三级:

Level 0是skills_list(),只返回所有Skill的名称和描述,约3k token。AI看一眼就知道有哪些Skill可用。Level 1是skill_view(name),按需加载某个Skill的完整内容,只有AI判断这个任务需要用到时才加载。Level 2是skill_view(name, path),只加载Skill中的某个特定参考文件,实现更精细的按需加载。

对比全量加载方案,20个Skill场景下Hermes的token消耗从10000降到3500左右,节省约65%。文档中还提到它的内存架构是缓存感知的——系统prompt在会话初始化时会被冻结成快照,后续高频模型调用可以复用缓存的上下文窗口。

四层记忆系统:从笔记本到肌肉记忆

Hermes的记忆架构被划分为四层,每层承担不同功能。

持久存储层用Markdown文件(MEMORY.md)存放长期事实和偏好,类似笔记本。结构化存储层用SQLite加FTS5全文搜索存放会话历史和跨会话检索数据。程序性记忆层用Skill文件存放可复用的工作流程,相当于肌肉记忆。用户建模层用USER.md配合Honcho辩证建模算法,随着使用逐渐建立对用户理解模型,比如你喜欢什么输出格式、技术栈是什么、通常在什么时间段工作。

相比之下,很多自建Skill机器人的开发者只做到了程序性记忆这一层。每次对话从零开始,不会记住上次分析结论或用户偏好。

开源世界的归属困境

EvoMap把Evolver核心模块改为混淆发布,并将协议从MIT变更为GPL-3.0,理由是"从个人开发者到小团队,从国内大厂到海外巨头,开源代码不被尊重正在成为常态"。

这类事件在开源世界并非孤例。2024年斯坦福团队发布的Llama 3-V多模态模型被指抄袭面壁智能MiniCPM-Llama3-V 2.5,最终涉事作者公开道歉并下架模型。更早之前,Meta工程师被曝深度分析中国团队MoE架构试图复刻,却因技术细节缺失导致项目失败。

Hermes Agent在GitHub已斩获超8.5万星标,被视为下一代智能体的代表。EvoMap团队不到20人,创始人张昊阳14岁成为中国最小Unity开发者,17岁开始创业。两边体量悬殊,这也是争议传播后社区分化严重的原因之一。

Nous Research本身已完成5000万美元A轮融资,由Paradigm与North Island Ventures领投。Hermes首月GitHub Star突破2.2万,4月8日v0.8.0版本发布后单日新增超6400颗星,不到两个月总Star数突破4.7万,多日霸榜全球开源项目排行第一。

争议的本质不在于谁对谁错,而在于开源协作的边界在哪里。当两个团队基于相似学术前提独立推导出相近架构时,如何区分合理借鉴与不当复制?EvoMap给出的答案是时间线和术语替换的证据链,Nous给出的答案是仓库创建时间和学术开源项目的独立性。

社区还在等更多证据。EvoMap把Evolver闭源了,Hermes的代码仍在开源。时间会给出答案。

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。