个人项目
角色记忆情境数据构建平台
独立全栈开发·2026.02 — 2026.04
项目背景
面向长篇叙事文本中的角色数据构建需求,开发一套本地化数据工作台,支持从原文中抽取角色记忆、人格特征与情境数据,用于辅助角色的长期记忆、人设建模与情境反应生成。
解决的问题
长篇叙事文本中的角色信息分散、隐含,手动提取角色记忆和人格特征耗时且易遗漏。现有工具缺乏从文本到结构化角色数据的半自动化生产流程,难以支持 Agent 的长期记忆和情境反应生成需求。
我的职责
独立负责产品流程设计、技术选型与前后端开发,搭建从文本输入、分步抽取、人工审核到结果导出的完整工作流。
核心设计
设计主链流程:文本预处理 → 人生节点抽取 → 事件扩展 → 术语映射 → 第一人称记忆转换 → 最终检查。设计人格分析与情境生成分支,支持人格画像合成、候选情境筛选、草案生成与人工审核。
技术或工具
FastAPI + React + Vite + Tailwind CSS + SQLite,接入真实 LLM 调用、任务状态管理与日志追踪。
产出结果
完成一套可运行的角色数据构建工具,实现长文本到结构化记忆、人格与情境数据的半自动化生产。沉淀了面向角色的数据构建流程,提升记忆数据生产的可追溯性、可审核性与可复用性。支持人工审核、局部重跑和日志查看,降低长文本抽取中的幻觉与不可追溯风险。
难点与复盘
<待补充>
可验证材料
- GitHub:https://github.com/ktdhhc
可追问问题
- 角色记忆抽取的分步流程是如何设计的?
- 如何控制 LLM 在长文本抽取中的幻觉?
- 人工审核闭环如何与半自动化流程结合?