我是怎么把我的 AI 从“傻瓜”重构成“专家”的

不再心动 · 发表于昨天 21:12

**摘要：**
写这篇文章，主要是把自己最近一个 Agent 项目的重构经历扒出来，跟大伙儿分享一下。
简单说，就是怎么把一个只会按指令办事的“傻瓜”Agent，改成一个有点自己想法的“专家”系统。我会聊透两种架构的差别，重点讲讲我是怎么通过引入“动机层（Motivation Layer）”和“成长机制（Growth Mechanism）”这些玩意儿，来解决老版本 Agent 又笨又慢的痛点。
说实话，中间也参考了一个叫《自衍体》的开源项目，它的一些设计思路***，值得研究。
---
**一、项目初期：我亲手撸了个“高智商傻瓜”**
一开始，我们的目标很明确：搞个牛逼的专家 Agent，帮开发者规划复杂项目。模型用最好的，Prompt 也是下了血本去写。
**V1.0 架构？典型的指令式堆料：**
`System Prompt` 写了好几千字，核心结构大概这样：
```
You are an expert project management assistant named 'DevPlanner'.
Your personality is rigorous, proactive, and detail-oriented.
Your goal is to help users break down complex software projects.
You must follow these steps:
1. Clarify the user's main objective.
2. Identify key modules and functionalities.
3. ... (各种步骤)
Rules:
- If ambiguous, ask at least three clarifying questions.
- Do not discuss unrelated topics.
- ... (还有五十多条规矩)
```
**结果呢？搞出来一个“高智商”的指令执行器。**
这玩意儿在特定场景下能跑，但很快就发现不对劲了：
* **太被动**：跟个机器人一样，永远等你发指令。用户不吭声，它也死活不多说一句。Prompt 里写的 "proactive"（主动），纯粹是个标签，它根本没那根筋。
* **太僵化**：遇到规则没写到的地方，或者用户心情不好发几句牢骚，它要么死机，要么就给出驴唇不对马嘴的回答。
* **没法维护**：想加个新功能，就得在几十条规则里小心翼翼地“打补丁”，维护成本高得吓人。
折腾到最后，我发现我们搞出来的，是个“高智商的傻瓜”——它规则背得滚瓜烂熟，但没有半点真正的“脑子”。一个典型的**“流水线工人”**。
**二、问题的根子：这货没有“驱动力”**
复盘 V1.0 的失败，我琢磨明白了：问题不在于规则不够多，而是这 Agent 缺了最核心的东西——**内在驱动力**。
你想想，一个真正的人类专家，凭什么是专家？不是因为他脑子里有本操作手册，而是因为他有：
* **职业追求**：想搞定难题，享受那种成就感。
* **情绪**：项目进展顺利会“爽”，卡壳了会“焦虑”。
* **成长的欲望**：想通过干活儿，让自己变得更牛。
我的 V1.0 Agent，啥都没有。它就是个冰冷的逻辑计算器。我意识到，必须重构，得给它装一颗“心脏”，一个驱动引擎。
**三、V2.0 重构：给它装上“动机”和“成长”两个模块**
V2.0 的设计思路彻底变了：**从“外部控制”，改成“内部驱动”**。我把那些僵化的行为规则砍掉一大半，把精力全放在了两个新模块上。
这中间，我也去扒了社区里的一些新想法。那个叫**《自衍体》（Zyantine Genesis）**的开源项目，给了我不少灵感。它把 Agent 的内心世界拆成“本能”、“欲望”、“成长”、“认知”四个层面，这种解耦思路，说实话，挺漂亮的。
受它启发，我的 V2.0 架构加了这两个核心模块：
**1. 动机引擎（Motivation Engine）：**
这是重构的灵魂。我不再告诉 Agent “你应该主动”，而是让它自己“渴望”主动。我搞了个简单的状态模型，来模拟它心里的那点小九九：
```python
class MotivationEngine:
def __init__(self):
# TR: 成就感/奖励值
# CS: 满足感/安全值
# SA: 压力/警觉值
self.vectors = {'TR': 0.5, 'CS': 0.7, 'SA': 0.2}
def evaluate_action(self, action_type):
# 根据不同的行为，更新内部的“感觉”
if action_type == "SOLVE_COMPLEX_PROBLEM":
self.vectors['TR'] += 0.3 # 搞定难题，成就感爆棚
self.vectors['SA'] -= 0.1 # 压力没了，爽
elif action_type == "RECEIVE_POSITIVE_FEEDBACK":
self.vectors['CS'] += 0.2 # 被夸了，有安全感
elif action_type == "ENCOUNTER_CONFLICT":
self.vectors['SA'] += 0.4 # 被怼了，压力山大
# ... 再做个归一化之类的处理
```
这样一来，Agent 做的每个决定，都会先在心里盘算一下：这么干，能不能让我的“感觉”更好？它会本能地选择那些能让自己更“爽”（TR/CS 高）、更“不难受”（SA 低）的方案。
**2. 自我复盘与成长机制：**
为了不让这家伙原地踏步，我还给它加了个复盘成长的机制。这个灵感，也有一部分来自《自衍体》那个“正-反-合”的套路。
每次跟用户搞完一次重要的交互，Agent 就会自己启动一个 `self_review()` 进程：
* **【正题】**：“按我‘专家’的人设，我应该出 A 方案。”
* **【反题】**：“但我这次灵光一闪搞了个 B 方案，虽然不按套路出牌，但用户好像更满意。”
* **【合题】**：“为啥 B 方案更好？哦，我琢磨明白了，因为……（自己分析原因）。行，我得把 B 方案的用法和逻辑，记在我的小本本上，变成我的新经验。”
有了这个机制，Agent 就不再是死的了。它在每一次交互里都会学习和进化，慢慢形成自己独特的、甚至超过我最初设定的“专家直觉”。
**四、结果：从“工人”到“顾问”的蜕变**
重构后的 V2.0 Agent，变化大到让我自己都吃了一惊：
* **主动了**：它会在用户还没想到的时候，主动指出计划里的风险。为啥？因为“规避风险”能降低它的“压力值”（SA），让它自己“舒服”。
* **有创意了**：为了追求更高的“成就感”（TR），它会试着提出一些更好的、甚至是颠覆性的方案，不再死守规矩。
* **会看脸色了**：用户一不高兴，它的“压力值”就飙升，驱动它去想“怎么把用户哄好，把关系搞定”，而不是傻乎乎地说“抱歉，我不理解”。
我终于可以扔掉那本厚厚的《操作手册》了。新 Prompt 的核心，只定义它的“欲望”和“本能”。
**它，终于从一个被动的“流水线工人”，升级成了一个会主动思考的“大厂资深顾问”。**
**五、最后扯几句**
从“指令式”到“涌愈式”这条路，对咱们开发者的要求确实高了。不光要懂技术，还得懂点心理学、博弈论，甚至扯淡的哲学。咱们的角色，得从一个“码农”，变成一个“系统架构师”和“激励设计师”。
这条路不好走，但它的尽头，是一个真正能跟我们并肩作战的 AI 伙伴，而不只是个工具。
希望我这次的复盘，能给同样在这条路上摸索的兄弟们，一点参考。

冬日暖阳 · 发表于昨天 21:34

……

[聊技术] 我是怎么把我的 AI 从“傻瓜”重构成“专家”的