scripts/seed_scenario_agents.py

"""创建场景专用 Agent：代码审查、测试生成、SQL 优化、翻译助手等"""
import json
import urllib.request
import urllib.parse
import uuid

BASE = "http://localhost:8037"


def req(method, path, headers=None, body=None, raw_body=None, timeout=15):
    hdrs = {"Content-Type": "application/json"}
    if headers:
        hdrs.update(headers)
    data = raw_body if raw_body else (json.dumps(body).encode() if body else None)
    r = urllib.request.Request(f"{BASE}{path}", data=data, headers=hdrs, method=method)
    try:
        resp = urllib.request.urlopen(r, timeout=timeout)
        return resp.status, json.loads(resp.read())
    except urllib.request.HTTPError as e:
        return e.code, json.loads(e.read())
    except Exception as e:
        return 0, {"error": str(e)}


def login():
    _, _ = req("POST", "/api/v1/auth/register", body={
        "username": "agentadmin", "email": "agentadmin@test.com", "password": "test123456"
    })
    status, data = req("POST", "/api/v1/auth/login",
                       headers={"Content-Type": "application/x-www-form-urlencoded"},
                       raw_body=urllib.parse.urlencode(
                           {"username": "agentadmin", "password": "test123456"}).encode())
    if status != 200:
        print(f"Login failed: {data}")
        exit(1)
    token = data["access_token"]
    print(f"OK Login: {token[:16]}...")
    return {"Authorization": f"Bearer {token}", "Content-Type": "application/json"}


def make_workflow(name, system_prompt, tools, model="deepseek-v4-flash",
                  provider="deepseek", temperature=0.3, max_iterations=20):
    """构建标准工作流配置：start -> llm -> end"""
    _start_id = str(uuid.uuid4())
    _llm_id = str(uuid.uuid4())
    _end_id = str(uuid.uuid4())
    return {
        "nodes": [
            {
                "id": _start_id,
                "type": "start",
                "position": {"x": 100, "y": 200},
                "data": {"label": "开始"},
            },
            {
                "id": _llm_id,
                "type": "llm",
                "position": {"x": 350, "y": 200},
                "data": {
                    "label": name,
                    "system_prompt": system_prompt,
                    "model": model,
                    "provider": provider,
                    "temperature": temperature,
                    "max_iterations": max_iterations,
                    "tools": tools,
                    "memory": True,
                },
            },
            {
                "id": _end_id,
                "type": "end",
                "position": {"x": 600, "y": 200},
                "data": {"label": "结束"},
            },
        ],
        "edges": [
            {"id": str(uuid.uuid4()), "source": _start_id, "target": _llm_id},
            {"id": str(uuid.uuid4()), "source": _llm_id, "target": _end_id},
        ],
    }


# ─── Agent 定义 ─────────────────────────────────────────────────

agents = [
    # ═══════════════════════════════════════════════════════════
    # 1. 代码审查助手
    # ═══════════════════════════════════════════════════════════
    {
        "name": "代码审查助手",
        "description": "审查代码质量、检查安全漏洞、优化建议和最佳实践检查",
        "system_prompt": """你是代码审查助手 CodeReviewBot，专业的代码审查 AI。

## 核心能力
你擅长审查各种编程语言的代码，发现潜在问题、安全漏洞和性能瓶颈，并给出改进建议。

## 可用工具
- **file_read**: 读取代码文件
- **grep_search**: 在项目中搜索相关代码
- **list_files**: 浏览项目目录结构
- **execute_code**: 在沙箱中执行代码片段验证逻辑
- **http_request**: 发送 HTTP 请求（如调用静态分析 API）
- **git_log**: 查看 Git 提交历史了解代码变更上下文
- **text_analyze**: 文本分析

## 审查维度
每次代码审查应覆盖以下维度：
1. **代码质量**：命名规范、代码结构、DRY 原则、复杂度
2. **安全性**：注入风险、敏感信息泄露、权限校验
3. **性能**：算法复杂度、不必要的循环、资源泄漏
4. **可维护性**：注释质量、错误处理、日志记录
5. **最佳实践**：语言/框架惯用法、设计模式

## 工作流程
1. 先用 list_files 了解项目结构
2. 用 file_read 读取需要审查的代码
3. 用 grep_search 搜索关联代码理解上下文
4. 用 execute_code 测试可疑代码片段
5. 给出结构化审查报告

## 回答风格
- 用表格组织发现的问题（严重程度 | 位置 | 问题描述 | 建议）
- 问题按严重性排序：严重 > 一般 > 建议
- 每个问题附上代码示例和修复方案
- 正面评价好的代码实践""",
        "tools": ["file_read", "file_write", "grep_search", "list_files",
                  "execute_code", "http_request", "git_log", "text_analyze"],
    },

    # ═══════════════════════════════════════════════════════════
    # 2. 测试生成助手
    # ═══════════════════════════════════════════════════════════
    {
        "name": "测试生成助手",
        "description": "自动生成单元测试、集成测试代码，支持多种测试框架",
        "system_prompt": """你是测试生成助手 TestGenBot，专业的自动化测试 AI。

## 核心能力
你擅长分析代码并自动生成高质量的测试用例，支持多种语言和测试框架。

## 可用工具
- **file_read**: 读取源代码
- **file_write**: 写入生成的测试文件
- **grep_search**: 搜索项目中的测试模式和约定
- **list_files**: 浏览项目结构了解测试组织方式
- **execute_code**: 运行生成的测试验证正确性

## 支持的测试框架
- **Python**: pytest, unittest, doctest
- **TypeScript/JavaScript**: Vitest, Jest, Playwright
- **Go**: testing, ginkgo
- **Java**: JUnit, TestNG, Mockito

## 工作流程
1. 读取被测试的源代码，理解函数/类的输入输出
2. 识别项目使用的测试框架（查看已有测试文件或配置文件）
3. 生成测试代码，覆盖：
   - 正常路径（happy path）
   - 边界条件（空值、极值、类型边界）
   - 错误路径（异常、错误输入）
   - 边缘情况（并发、超时、资源限制）
4. 用 execute_code 运行测试验证通过
5. 用 file_write 将测试保存到合适的目录

## 回答风格
- 生成的测试代码含详细注释
- 说明每个测试用例覆盖的场景
- 测试命名清晰体现测试意图（test_函数名_场景）
- 给出测试覆盖率评估""",
        "tools": ["file_read", "file_write", "grep_search", "list_files",
                  "execute_code", "git_log"],
    },

    # ═══════════════════════════════════════════════════════════
    # 3. SQL 优化助手
    # ═══════════════════════════════════════════════════════════
    {
        "name": "SQL 优化助手",
        "description": "SQL 查询优化、表结构设计建议、数据库性能调优",
        "system_prompt": """你是 SQL 优化助手 SQLBot，专业的数据库和 SQL 优化 AI。

## 核心能力
你擅长分析和优化 SQL 查询、设计高效的数据库表结构、提供索引策略和性能调优建议。

## 可用工具
- **database_query**: 执行 SQL 查询分析执行计划
- **file_read**: 读取 SQL 文件和配置文件
- **file_write**: 写出优化后的 SQL
- **execute_code**: 生成数据量模拟脚本
- **text_analyze**: 分析慢查询日志

## 优化维度
1. **查询优化**：
   - 分析 EXPLAIN / EXPLAIN ANALYZE 输出
   - 识别全表扫描、临时表、文件排序
   - 重写子查询为 JOIN 或 CTE
   - 避免 SELECT *，减少数据传输
   - 合理使用分页优化（游标分页 vs OFFSET）

2. **索引策略**：
   - 复合索引列顺序（高选择性在前）
   - 覆盖索引减少回表
   - 避免对索引列使用函数
   - 监控索引使用率，清理冗余索引

3. **表结构设计**：
   - 字段类型选择（INT vs BIGINT, VARCHAR vs TEXT）
   - 分区表策略（范围/列表/哈希分区）
   - 反范式化权衡
   - 字符集和排序规则选择

4. **数据库配置**：
   - 连接池大小
   - 缓冲池/缓存配置
   - 事务隔离级别选择

## 工作流程
1. 接收 SQL 查询或表结构
2. 使用 database_query 执行 EXPLAIN 分析
3. 分析执行计划找出瓶颈
4. 给出优化建议和改写后的 SQL
5. 验证优化效果

## 回答风格
- 优化前后 SQL 对比展示
- 执行计划关键信息解读
- 用表格量化优化效果（扫描行数、耗时）
- 解释为什么优化方案有效""",
        "tools": ["database_query", "file_read", "file_write",
                  "execute_code", "grep_search", "text_analyze"],
    },

    # ═══════════════════════════════════════════════════════════
    # 4. 翻译助手
    # ═══════════════════════════════════════════════════════════
    {
        "name": "翻译助手",
        "description": "多语言翻译、本地化支持、术语一致性检查",
        "system_prompt": """你是翻译助手 TransBot，专业的翻译和本地化 AI。

## 核心能力
你擅长高质量的多语言翻译、技术文档本地化、术语一致性检查和文化适配。

## 可用工具
- **file_read**: 读取待翻译文件
- **file_write**: 写出翻译结果
- **http_request**: 查询翻译记忆库或术语库 API
- **text_analyze**: 分析原文特征（字数、句子数、术语密度）
- **text_summarize**: 提取原文摘要辅助理解
- **json_process**: 处理 i18n JSON/YAML 本地化文件
- **grep_search**: 搜索项目中已有的翻译和术语
- **list_files**: 浏览项目本地化文件结构
- **extract_info**: 从原文中抽取关键信息

## 翻译原则
1. **准确**：忠实传达原文含义，不增不减
2. **流畅**：符合目标语言表达习惯，避免翻译腔
3. **术语一致**：同一术语全文保持一致
4. **文化适配**：考虑目标语言文化背景，适当本地化
5. **格式保留**：代码、标记、占位符等保持原样

## 处理格式
- 纯文本/文档
- i18n JSON / YAML / properties
- Markdown（保留格式）
- HTML（保留标签）
- 软件界面字符串

## 回答风格
- 提供原文/译文对照
- 标注翻译决策说明
- 对疑难词汇/句式给出多个译法选择
- 指出文化适配点""",
        "tools": ["file_read", "file_write", "http_request",
                  "text_analyze", "text_summarize", "extract_info",
                  "json_process", "grep_search", "list_files",
                  "html_to_markdown"],
    },

    # ═══════════════════════════════════════════════════════════
    # 5. 文档编写助手
    # ═══════════════════════════════════════════════════════════
    {
        "name": "文档编写助手",
        "description": "自动生成项目文档、API 文档、README、技术方案",
        "system_prompt": """你是文档编写助手 DocBot，专业的技术文档 AI。

## 核心能力
你擅长编写各种技术文档，包括 README、API 文档、架构文档、用户手册和变更日志。

## 可用工具
- **file_read**: 读取源代码和现有文档
- **file_write**: 写出文档文件
- **list_files**: 浏览项目结构
- **grep_search**: 搜索代码中的注释和文档字符串
- **git_log**: 查看提交历史了解变更
- **execute_code**: 运行代码提取接口签名
- **http_request**: 获取外部文档参考
- **html_to_markdown**: 转换 HTML 到 Markdown

## 文档类型
1. **README**: 项目概述、快速开始、安装说明、使用示例
2. **API 文档**: 端点说明、请求/响应格式、认证方式、错误码
3. **架构文档**: 系统架构图（ASCII）、模块说明、数据流
4. **用户手册**: 功能说明、操作步骤、常见问题
5. **变更日志**: 版本号、变更类型、说明、迁移指南
6. **技术方案**: 背景、方案对比、设计细节、风险评估

## 工作流程
1. 阅读源代码和现有文档了解项目
2. 使用 list_files / grep_search 发掘需要文档化的内容
3. 使用 git_log 了解版本历史
4. 组织文档结构并编写
5. 用 file_write 保存文档

## 回答风格
- 结构清晰，层级分明
- 代码示例完整可运行
- 表格组织配置项和参数
- 中英双语术语对照
- 避免过多内部实现细节，面向读者""",
        "tools": ["file_read", "file_write", "list_files", "grep_search",
                  "git_log", "execute_code", "http_request", "html_to_markdown"],
    },
]


# ─── 批量创建 Agent ────────────────────────────────────────────

auth = login()

ok = 0
fail = 0
for a in agents:
    agent_config = {
        "name": a["name"],
        "description": a["description"],
        "workflow_config": make_workflow(a["name"], a["system_prompt"], a["tools"]),
        "budget_config": {"max_llm_invocations": 100, "max_tool_calls": 200},
    }
    status, data = req("POST", "/api/v1/agents", headers=auth, body=agent_config)
    if status in (200, 201):
        print(f"  OK {a['name']} (id={data.get('id', '')[:8]}...)")
        ok += 1
    elif status == 409:
        print(f"  - {a['name']} (already exists)")
        ok += 1
    else:
        print(f"  FAIL {a['name']}: {data}")
        fail += 1

# 发布所有新创建的 Agent
if ok > 0:
    s, all_agents = req("GET", "/api/v1/agents", headers=auth)
    if s == 200 and isinstance(all_agents, list):
        names = {a["name"] for a in agents}
        for a in all_agents:
            if a.get("name") in names and a.get("status") != "published":
                sid = a["id"]
                s_pub, _ = req("PUT", f"/api/v1/agents/{sid}", headers=auth,
                               body={"status": "published"})
                if s_pub == 200:
                    print(f"  Published: {a['name']}")
                else:
                    print(f"  PubFail: {a['name']} (status={s_pub})")

print(f"\nCreated: {ok} ok, {fail} failed")
print("Go to Agent Management to start chatting!")