实习项目

Human-Like Agent

AI 社交产品实习生·2025.11 — 2026.05·趣丸科技

认知科学Agent 架构记忆机制文献综述产品原型

项目是什么

Human-Like Agent 是一个面向陪伴型 AI 社交产品的 Agent 架构探索项目。它想做的事情，不只是让 Agent 记住更多内容，而是让它在长期互动里逐渐形成更连贯的记忆、情绪反应和行为逻辑。这个方向主要服务于 AI 社交产品叽伴，也为后续陪伴类产品提供架构参考。

在实际体验里，很多角色类 Agent 的问题并不只是回答质量不稳定，而是聊久了之后会出现人格漂移、记忆断裂、情绪反应不自然、前后判断不一致。Human-Like 关注的就是这一层：当 Agent 进入长期关系场景后，怎样让它更像一个持续演化和互动的个体，而不只是一个能接话的对话系统。

它在解决什么

当时团队已经看到一条比较常见的行业路线：用快慢思考、RAG 记忆和角色设定来提升对话效果。这些方法对“记不记得住”很有帮助，但到了长期陪伴场景，问题会更快暴露出来。用户在意的不只是 Agent 能不能找回历史信息，还会在意它有没有自己的立场、会不会延续之前的情绪、能不能在复杂关系里表现出相对稳定的判断。

Human-Like Agent 想补上的，就是这部分更接近“人”的内部组织方式。团队希望把认知科学、心理学和脑科学里那些和高级认知相关的概念，整理成一套可以落到 Agent 架构上的模块设计，让记忆、情绪、价值判断和规划能力之间的关系更清楚，也让后续产品迭代有更稳的理论支点。

它是怎么工作的

Human-Like Agent 把一段互动拆成几个更清楚的内部环节：先感知输入里的情绪和语境，再结合相关记忆回看过去发生过什么，接着做目标与价值上的权衡，最后形成回复或行为倾向。大致可以理解成下面这条链路：

用户输入 / 外界事件
  -> 识别情绪线索与即时动机
  -> 检索并更新相关记忆
  -> 结合长期倾向做目标与价值权衡
  -> 生成回复 / 决策 / 行为表达

为了支撑这条链路，团队把核心能力拆成了几个互相配合的部分：

模块	生理或理论基础	作用
Logic Module	背外侧前额叶（DLPFC）	负责工作记忆、逻辑推理和任务规划，对应更偏理性的思考过程。
Impulse Module	眶额叶皮层（OFC）和杏仁核（Amygdala）	负责识别情绪信息、奖赏与风险线索，以及更即时的冲动反应。
Value Module	腹内侧前额叶（VMPFC）	负责社会认知、价值取向和情感决策，让行为输出保持相对稳定的内在倾向。
Memory System	自我叙事理论	将信息组织为语义记忆与情境记忆，并用第一人称叙事的方式串联长期经历。

从研究视角看，这套分工参考了认知神经科学里对不同高级认知功能的理解；从产品视角看，它的意义在于让“记忆”“情绪”“判断”不再混在一起，而是能被分别观察、讨论和迭代。

我主要做了什么

我在这个项目里承担的是研究与产品之间的连接工作，主要做了三类事情。

第一是系统梳理相关理论。围绕心理学、认知科学、认知神经科学和脑科学，我阅读并整理了大量与认知架构、记忆、自我叙事、情绪加工和决策相关的文献，把分散在不同学科里的概念放到同一张图里，帮助团队更快判断哪些理论适合进入原型，哪些更适合当背景参考。

第二是把理论翻译成可落地的模块讨论。比如记忆该怎样分层、哪些状态适合长期保留、情绪与价值判断应该怎样影响回复风格、哪些能力需要独立建模，哪些能力更适合做成共享机制。这部分工作让我更多参与到 Agent 架构设计讨论中，而不是停留在资料整理本身。

第三是跟进原型测试和迭代。我会结合测试表现，把体验层面的问题重新映射回架构层面，例如人格一致性不稳、情绪反应偏平、长期记忆调用不自然、某些社交情境下判断跳变等，再把这些观察整理成更具体的优化建议，反馈给团队继续迭代。

产出结果

这段工作最后沉淀下来的，不只是一些文档，而是几类更能进入产品流程的结果。

一类是架构层面的收敛。团队对 Human-Like Agent 里哪些能力应该独立成模块、哪些应该作为共享记忆或内部状态来管理，逐渐形成了更清楚的边界。很多原本停留在抽象层面的讨论，也开始能落到更具体的模块关系和原型设计上。

一类是评估层面的收敛。围绕“像不像人”这件事，团队逐步把观察重点落在更具体的维度上，例如人格一致性、长期记忆连贯性、情绪反应合理性、社交情境下的价值判断，以及多轮互动后的稳定度。这些维度后来也成为原型测试时的重要参照。

另外，团队原型在 LongMem-Eval、LoCoMo、KnowMe-Bench、CloneMem 等多个测试集上的表现也验证了这条路线有现实价值，尤其在更贴近高级认知的维度上，能看出它和常见角色 Agent 方案之间的差异。

难点与复盘

这个项目最难的地方，在于怎样把理论压缩成真正能被实现和测试的东西。认知科学里的很多概念很丰富，也很迷人，但一旦进入产品和原型阶段，就必须面对模块边界、状态管理、交互成本和迭代效率这些更具体的问题。能写进文档的东西很多，真正能进入系统里的东西其实很有限。

我后来越来越明确的一点是，研究工作真正有价值的时刻，往往不是把术语和理论查得更仔细，而是对学术上的抽象概念和团队中能讨论、能实现、能验证的结构进行双向翻译。比如“更像人”本身就是一个很大的词，如果不能继续拆成记忆连贯性、情绪合理性、判断稳定度这些更可观察的维度，它很快就会停留在感觉层面，没法推动迭代。

这段经历也让我更清楚地理解了研究和产品之间的距离。理论能提供方向，但真正让方向站住脚的，还是那些能进入原型、能接受测试、能被团队反复修改的具体设计。

最后

Human-Like Agent 对我来说是一个很特别的项目，因为它让我第一次比较完整地站在“理论—架构—原型—测试”这条链路中间，去做连接工作。它认真地尝试把其中一部分内容变成 Agent 的内部组织方式。

到现在回头看，这个项目最有价值的地方，仍然是它在问一个很朴素但也是最有挑战性的问题：当一个 Agent 要经历长时间互动、陪用户经历很多情境时，它该怎样慢慢长成一个更连贯的个体。Human-Like 就是在沿着这个方向，一步步往前搭出来的。

← 返回项目列表