后端新增 4 个内置工具: image_ocr (Tesseract OCR)、image_vision (GPT-4o 多模态视觉)、 speech_to_text (Whisper API)、text_to_speech (TTS API)。 前端 AgentChatPreview 增加录音上传和语音朗读交互。 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
后端新增 4 个内置工具: image_ocr (Tesseract OCR)、image_vision (GPT-4o 多模态视觉)、 speech_to_text (Whisper API)、text_to_speech (TTS API)。 前端 AgentChatPreview 增加录音上传和语音朗读交互。 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>