Human-Like Agent
项目是什么
Human-Like Agent 是一个面向陪伴型 AI 社交产品的 Agent 架构探索项目。它想做的事情,不只是让 Agent 记住更多内容,而是让它在长期互动里逐渐形成更连贯的记忆、情绪反应和行为逻辑。这个方向主要服务于 AI 社交产品叽伴,也为后续陪伴类产品提供架构参考。
在实际体验里,很多角色类 Agent 的问题并不只是回答质量不稳定,而是聊久了之后会出现人格漂移、记忆断裂、情绪反应不自然、前后判断不一致。Human-Like 关注的就是这一层:当 Agent 进入长期关系场景后,怎样让它更像一个持续演化和互动的个体,而不只是一个能接话的对话系统。
它在解决什么
当时团队已经看到一条比较常见的行业路线:用快慢思考、RAG 记忆和角色设定来提升对话效果。这些方法对“记不记得住”很有帮助,但到了长期陪伴场景,问题会更快暴露出来。用户在意的不只是 Agent 能不能找回历史信息,还会在意它有没有自己的立场、会不会延续之前的情绪、能不能在复杂关系里表现出相对稳定的判断。
Human-Like Agent 想补上的,就是这部分更接近“人”的内部组织方式。团队希望把认知科学、心理学和脑科学里那些和高级认知相关的概念,整理成一套可以落到 Agent 架构上的模块设计,让记忆、情绪、价值判断和规划能力之间的关系更清楚,也让后续产品迭代有更稳的理论支点。
它是怎么工作的
Human-Like Agent 把一段互动拆成几个更清楚的内部环节:先感知输入里的情绪和语境,再结合相关记忆回看过去发生过什么,接着做目标与价值上的权衡,最后形成回复或行为倾向。大致可以理解成下面这条链路:
用户输入 / 外界事件
-> 识别情绪线索与即时动机
-> 检索并更新相关记忆
-> 结合长期倾向做目标与价值权衡
-> 生成回复 / 决策 / 行为表达
为了支撑这条链路,团队把核心能力拆成了几个互相配合的部分:
| 模块 | 生理或理论基础 | 作用 |
|---|---|---|
| Logic Module | 背外侧前额叶(DLPFC) | 负责工作记忆、逻辑推理和任务规划,对应更偏理性的思考过程。 |
| Impulse Module | 眶额叶皮层(OFC)和杏仁核(Amygdala) | 负责识别情绪信息、奖赏与风险线索,以及更即时的冲动反应。 |
| Value Module | 腹内侧前额叶(VMPFC) | 负责社会认知、价值取向和情感决策,让行为输出保持相对稳定的内在倾向。 |
| Memory System | 自我叙事理论 | 将信息组织为语义记忆与情境记忆,并用第一人称叙事的方式串联长期经历。 |
从研究视角看,这套分工参考了认知神经科学里对不同高级认知功能的理解;从产品视角看,它的意义在于让“记忆”“情绪”“判断”不再混在一起,而是能被分别观察、讨论和迭代。
我主要做了什么
我在这个项目里承担的是研究与产品之间的连接工作,主要做了三类事情。
第一是系统梳理相关理论。围绕心理学、认知科学、认知神经科学和脑科学,我阅读并整理了大量与认知架构、记忆、自我叙事、情绪加工和决策相关的文献,把分散在不同学科里的概念放到同一张图里,帮助团队更快判断哪些理论适合进入原型,哪些更适合当背景参考。
第二是把理论翻译成可落地的模块讨论。比如记忆该怎样分层、哪些状态适合长期保留、情绪与价值判断应该怎样影响回复风格、哪些能力需要独立建模,哪些能力更适合做成共享机制。这部分工作让我更多参与到 Agent 架构设计讨论中,而不是停留在资料整理本身。
第三是跟进原型测试和迭代。我会结合测试表现,把体验层面的问题重新映射回架构层面,例如人格一致性不稳、情绪反应偏平、长期记忆调用不自然、某些社交情境下判断跳变等,再把这些观察整理成更具体的优化建议,反馈给团队继续迭代。
产出结果
这段工作最后沉淀下来的,不只是一些文档,而是几类更能进入产品流程的结果。
一类是架构层面的收敛。团队对 Human-Like Agent 里哪些能力应该独立成模块、哪些应该作为共享记忆或内部状态来管理,逐渐形成了更清楚的边界。很多原本停留在抽象层面的讨论,也开始能落到更具体的模块关系和原型设计上。
一类是评估层面的收敛。围绕“像不像人”这件事,团队逐步把观察重点落在更具体的维度上,例如人格一致性、长期记忆连贯性、情绪反应合理性、社交情境下的价值判断,以及多轮互动后的稳定度。这些维度后来也成为原型测试时的重要参照。
另外,团队原型在 LongMem-Eval、LoCoMo、KnowMe-Bench、CloneMem 等多个测试集上的表现也验证了这条路线有现实价值,尤其在更贴近高级认知的维度上,能看出它和常见角色 Agent 方案之间的差异。
难点与复盘
这个项目最难的地方,在于怎样把理论压缩成真正能被实现和测试的东西。认知科学里的很多概念很丰富,也很迷人,但一旦进入产品和原型阶段,就必须面对模块边界、状态管理、交互成本和迭代效率这些更具体的问题。能写进文档的东西很多,真正能进入系统里的东西其实很有限。
我后来越来越明确的一点是,研究工作真正有价值的时刻,往往不是把术语和理论查得更仔细,而是对学术上的抽象概念和团队中能讨论、能实现、能验证的结构进行双向翻译。比如“更像人”本身就是一个很大的词,如果不能继续拆成记忆连贯性、情绪合理性、判断稳定度这些更可观察的维度,它很快就会停留在感觉层面,没法推动迭代。
这段经历也让我更清楚地理解了研究和产品之间的距离。理论能提供方向,但真正让方向站住脚的,还是那些能进入原型、能接受测试、能被团队反复修改的具体设计。
最后
Human-Like Agent 对我来说是一个很特别的项目,因为它让我第一次比较完整地站在“理论—架构—原型—测试”这条链路中间,去做连接工作。它认真地尝试把其中一部分内容变成 Agent 的内部组织方式。
到现在回头看,这个项目最有价值的地方,仍然是它在问一个很朴素但也是最有挑战性的问题:当一个 Agent 要经历长时间互动、陪用户经历很多情境时,它该怎样慢慢长成一个更连贯的个体。Human-Like 就是在沿着这个方向,一步步往前搭出来的。