feat: 工作流记忆与内置工具、知你客服脚本、Agent管理技能展示与能力配置、文档与Windows启动脚本；忽略 redis_temp 二进制目录

Made-with: Cursor
2026-04-08 11:44:24 +08:00
parent 599b8f2851
commit bd3f8be781
66 changed files with 10104 additions and 469 deletions
--- a/backend/scripts/create_zhini_kefu_9.py
+++ b/backend/scripts/create_zhini_kefu_9.py
@@ -0,0 +1,243 @@
+#!/usr/bin/env python3
+"""
+从「知你客服8号」复制为「知你客服9号」，强化「摘要 + 检索」可用性：
+
+1. 上下文 code-build-context：更长近期轮次、注入 conversation_summary、向量结果 + 关键词从历史中捞相关句。
+2. 摘要路径 code-build-memory-value：在原有摘要分支上合并进完整 conversation_history（追加而非仅 2 条），并写回 conversation_summary。
+3. cache-update-summary：显式 value 为「memory」表达式，避免整包 input_data 写入 Redis。
+4. 向量写入：为每条 turn 带 metadata.user_id；引擎侧检索已按 user_id 过滤。
+
+需平台可登录；默认源 8 号 ID 为上次创建结果，可用 ZHINI_8_AGENT_ID 覆盖。
+部署后请重启 Celery/API 以加载引擎向量过滤逻辑。
+"""
+from __future__ import annotations
+
+import json
+import os
+import sys
+
+import requests
+
+BASE = os.getenv("PLATFORM_BASE_URL", "http://127.0.0.1:8037").rstrip("/")
+SOURCE_AGENT_ID = os.getenv("ZHINI_8_AGENT_ID", "d7b64bf6-c8e3-4dc7-befc-03a98d5ff741")
+USER = os.getenv("PLATFORM_USERNAME", "admin")
+PWD = os.getenv("PLATFORM_PASSWORD", "123456")
+
+NEW_NAME = "知你客服9号"
+NEW_DESC = (
+    "在知你客服8号基础上强化摘要与检索："
+    "远期要点写入 conversation_summary；"
+    "当轮上下文含「近期对话 + 摘要 + 向量片段 + 关键词相关历史」；"
+    "向量库写入带 user_id 元数据，引擎检索按用户隔离。"
+    "仍依赖 MEMORY_PERSIST_DB_ENABLED 与固定 user_id。"
+)
+
+LLM_PROMPT = """你是客服助手。根据「用户当前输入」「已知用户信息」「远期摘要」「相关历史（检索）」和「最近几轮」完成：
+1）判断意图；
+2）生成一句自然、有帮助的回复；
+3）【强制】用户说出或暗示姓名、昵称时，必须在 user_profile.name 保存；合并已有字段勿丢失；
+4）用户问「我叫什么」等时，必须依据 user_profile.name 与对话/摘要回答；已有 name 时禁止说「还不知道」；
+5）「远期摘要」概括更早话题；「相关历史」可能含向量命中或关键词命中的旧轮次，请结合使用。
+
+只输出一行合法 JSON，不要 markdown。格式示例：
+{"intent":"greeting","reply":"你好！","user_profile":{"name":"小明"}}
+
+用户输入：{{user_input}}
+已知用户信息：{{memory.user_profile}}
+远期摘要：{{memory.conversation_summary}}
+相关历史（检索到的）：{{memory.relevant_from_retrieval}}
+最近几轮：{{memory.recent_turns}}
+
+要求：reply 简洁自然，200 字以内；user_profile 为对象。"""
+
+CODE_BUILD_CONTEXT = r"""left = input_data.get('left') or {}
+right = input_data.get('right') or []
+if not isinstance(right, list):
+    right = []
+mem = left.get('memory') or {}
+hist = mem.get('conversation_history') or []
+if not isinstance(hist, list):
+    hist = []
+summary = mem.get('conversation_summary') or ''
+recent_n = 16
+recent = hist[-recent_n:] if len(hist) > recent_n else hist
+recent_str = '\n'.join(f"{x.get('role', '')}: {x.get('content', '')}" for x in recent)
+vec_str = '\n'.join((rec.get('text') or rec.get('content') or '') for rec in right)
+query = (left.get('user_input') or left.get('query') or '').strip()
+older = hist[:-recent_n] if len(hist) > recent_n else []
+
+
+def _tok(s):
+    s = str(s)
+    ch = {c for c in s if '\u4e00' <= c <= '\u9fff'}
+    wd = set(s.lower().replace('\n', ' ').split())
+    return ch | wd
+
+
+qt = _tok(query) if query else set()
+scored = []
+for m in older:
+    c = str(m.get('content', ''))
+    if not c:
+        continue
+    sc = len(qt & _tok(c)) if qt else 0
+    if sc > 0:
+        scored.append((sc, str(m.get('role', '')), c[:240]))
+scored.sort(key=lambda x: -x[0])
+kw_lines = [f"{role}: {text}" for _, role, text in scored[:6]]
+kw_str = '\n'.join(kw_lines)
+relevant_str = vec_str.strip()
+if kw_str:
+    if relevant_str:
+        relevant_str = relevant_str + '\n---\n关键词相关历史：\n' + kw_str
+    else:
+        relevant_str = '关键词相关历史：\n' + kw_str
+result = {
+    'user_input': left.get('user_input') or left.get('query') or '',
+    'memory': {
+        'user_profile': mem.get('user_profile') or {},
+        'conversation_summary': summary,
+        'relevant_from_retrieval': relevant_str,
+        'recent_turns': recent_str,
+    },
+    'query': left.get('query') or '',
+    'user_id': left.get('user_id'),
+}
+"""
+
+CODE_BUILD_MEMORY_VALUE = r"""left = input_data.get('left') or {}
+right_out = input_data.get('right') or {}
+summary = ''
+if isinstance(right_out, dict):
+    summary = right_out.get('output') or right_out.get('result') or ''
+if not isinstance(summary, str):
+    summary = str(summary or '')
+summary = summary.strip()
+mem = left.get('memory') or {}
+user_input = left.get('user_input') or left.get('query') or ''
+reply = left.get('right') or ''
+if isinstance(reply, dict):
+    reply = reply.get('right') or reply.get('content') or str(reply)
+profile_update = left.get('user_profile_update') or {}
+if not isinstance(profile_update, dict):
+    profile_update = {}
+user_profile = dict(mem.get('user_profile') or {}, **profile_update)
+ts = datetime.now().isoformat()
+old_hist = mem.get('conversation_history') or []
+if not isinstance(old_hist, list):
+    old_hist = []
+new_hist = old_hist + [
+    {'role': 'user', 'content': user_input, 'timestamp': ts},
+    {'role': 'assistant', 'content': str(reply or ''), 'timestamp': ts},
+]
+max_len = 40
+if len(new_hist) > max_len:
+    new_hist = new_hist[-max_len:]
+prev_sum = (mem.get('conversation_summary') or '').strip()
+conversation_summary = summary if summary else prev_sum
+memory_value = {
+    'conversation_summary': conversation_summary,
+    'conversation_history': new_hist,
+    'user_profile': user_profile,
+    'context': mem.get('context') or {},
+}
+result = {
+    'memory': memory_value,
+    'user_id': left.get('user_id'),
+    'query': left.get('query'),
+    'user_input': user_input,
+    'right': reply,
+    'user_profile_update': profile_update,
+}
+"""
+
+CODE_BUILD_TURN_FOR_VECTOR = r"""reply = input_data.get('right') or ''
+if isinstance(reply, dict):
+    reply = reply.get('right') or reply.get('content') or str(reply)
+query = input_data.get('query') or ''
+user_id = str(input_data.get('user_id') or 'default')
+raw = (user_id + '\n' + str(query) + '\n' + str(reply)).encode('utf-8', errors='ignore')
+doc_id = 'turn_' + hashlib.sha256(raw).hexdigest()[:24]
+text = '用户：' + str(query) + '\n助手：' + str(reply)
+result = {
+    'text': text,
+    'user_id': user_id,
+    'id': doc_id,
+    'metadata': {'user_id': user_id},
+}
+"""
+
+
+def _patch_nodes(wf: dict) -> None:
+    nodes = wf.get("nodes") or []
+    for n in nodes:
+        nid = n.get("id")
+        if nid == "llm-unified":
+            n.setdefault("data", {})["prompt"] = LLM_PROMPT
+        elif nid == "code-build-context":
+            n.setdefault("data", {})["code"] = CODE_BUILD_CONTEXT
+        elif nid == "code-build-memory-value":
+            n.setdefault("data", {})["code"] = CODE_BUILD_MEMORY_VALUE
+        elif nid == "code-build-turn-for-vector":
+            n.setdefault("data", {})["code"] = CODE_BUILD_TURN_FOR_VECTOR
+        elif nid == "cache-update-summary":
+            d = n.setdefault("data", {})
+            d["value"] = "memory"
+        elif nid == "transform-for-vector-upsert":
+            m = n.setdefault("data", {}).setdefault("mapping", {})
+            m["metadata"] = "{{left.metadata}}"
+
+
+def main() -> int:
+    r = requests.post(
+        f"{BASE}/api/v1/auth/login",
+        data={"username": USER, "password": PWD},
+        headers={"Content-Type": "application/x-www-form-urlencoded"},
+        timeout=15,
+    )
+    if r.status_code != 200:
+        print("登录失败:", r.status_code, r.text[:500], file=sys.stderr)
+        return 1
+    token = r.json().get("access_token")
+    if not token:
+        print("无 access_token", file=sys.stderr)
+        return 1
+    h = {"Authorization": f"Bearer {token}", "Content-Type": "application/json"}
+
+    dup = requests.post(
+        f"{BASE}/api/v1/agents/{SOURCE_AGENT_ID}/duplicate",
+        headers=h,
+        json={"name": NEW_NAME},
+        timeout=30,
+    )
+    if dup.status_code != 201:
+        print("复制失败:", dup.status_code, dup.text[:800], file=sys.stderr)
+        return 1
+    new_id = dup.json()["id"]
+    print("已创建副本:", new_id, NEW_NAME)
+
+    g = requests.get(f"{BASE}/api/v1/agents/{new_id}", headers=h, timeout=30)
+    if g.status_code != 200:
+        print("读取 Agent 失败:", g.text, file=sys.stderr)
+        return 1
+    agent = g.json()
+    wf = agent["workflow_config"]
+    _patch_nodes(wf)
+
+    up = requests.put(
+        f"{BASE}/api/v1/agents/{new_id}",
+        headers=h,
+        json={"description": NEW_DESC, "workflow_config": wf},
+        timeout=60,
+    )
+    if up.status_code != 200:
+        print("更新失败:", up.status_code, up.text[:800], file=sys.stderr)
+        return 1
+    print("已更新：LLM 提示、code-build-context / memory-value / vector-turn、cache-update-summary.value、upsert.metadata")
+    print("Agent ID:", new_id)
+    print(json.dumps({"id": new_id, "name": NEW_NAME}, ensure_ascii=False))
+    return 0
+
+
+if __name__ == "__main__":
+    raise SystemExit(main())