foxhui
diff --git a/‎src/backend/adapter/chatgpt.js‎
Lines changed: 95 additions & 7 deletions b/‎src/backend/adapter/chatgpt.js‎
Lines changed: 95 additions & 7 deletions
diff --git a/‎src/backend/adapter/deepseek_text.js‎
Lines changed: 41 additions & 5 deletions b/‎src/backend/adapter/deepseek_text.js‎
Lines changed: 41 additions & 5 deletions
diff --git a/‎src/backend/adapter/gemini.js‎
Lines changed: 63 additions & 3 deletions b/‎src/backend/adapter/gemini.js‎
Lines changed: 63 additions & 3 deletions
@@ -110,12 +110,79 @@ async function generate(context, prompt, imgPaths, modelId, meta = {}) {
             return { error: `API 返回错误: HTTP ${conversationResponse.status()}` };
         }
 
+        // 5.5 解析 conversation 响应，检查是否是纯文本回复（拒绝/限流场景）
+        let conversationText = '';
+        let isImageGenerationStarted = false;
+        let conversationBody = '';
+        try {
+            conversationBody = await conversationResponse.text();
+
+            // 检查是否有图片生成相关的内容 (dalle 工具调用或 file_ 文件引用)
+            // 注意：不使用 'image' 关键词，因为拒绝消息也会包含这个词
+            isImageGenerationStarted = conversationBody.includes('dalle') || conversationBody.includes('file_');
+            logger.debug('适配器', `isImageGenerationStarted: ${isImageGenerationStarted}`, meta);
+
+            // 提取文本内容
+            const lines = conversationBody.split('\n');
+            for (const line of lines) {
+                if (!line.startsWith('data: ')) continue;
+                const dataStr = line.slice(6).trim();
+                if (dataStr === '[DONE]') continue;
+                try {
+                    const data = JSON.parse(dataStr);
+                    // 提取初始文本 (channel=final 的 assistant 消息)
+                    if (data.v?.message?.channel === 'final' &&
+                        data.v?.message?.author?.role === 'assistant' &&
+                        data.v?.message?.content?.parts?.length > 0) {
+                        const part = data.v.message.content.parts[0];
+                        if (typeof part === 'string') {
+                            conversationText = part;
+                        }
+                    }
+                    // patch 格式累加 (data.v 是 patch 操作数组)
+                    if (Array.isArray(data.v)) {
+                        for (const patch of data.v) {
+                            if (patch.o === 'append' && patch.p === '/message/content/parts/0' && patch.v) {
+                                conversationText += patch.v;
+                            }
+                        }
+                    }
+                } catch { }
+            }
+            logger.debug('适配器', `提取到文本 (${conversationText.length} 字符): ${conversationText.substring(0, 200)}...`, meta);
+        } catch (e) {
+            logger.warn('适配器', `解析 conversation 响应失败: ${e.message}`, meta);
+        }
+
+        // 早期检测：如果文本表明是拒绝/限流，立即返回，不等待图片超时
+        if (conversationText) {
+            // 检查是否是速率限制错误 (不重试，同账号重试也没用)
+            const isRateLimit = conversationBody.includes('RateLimitException') ||
+                conversationBody.includes('rate limit') ||
+                /limit.*reset/i.test(conversationText);
+
+            if (isRateLimit) {
+                logger.warn('适配器', `早期检测到速率限制: ${conversationText.substring(0, 200)}...`, meta);
+                return { error: `触发速率限制: ${conversationText.substring(0, 200)}`, retryable: false };
+            }
+
+            // 如果没有图片生成迹象，检查是否是内容被拒���
+            if (!isImageGenerationStarted) {
+                const isContentRejection = /cannot|can't|unable|sorry|policy|violat/i.test(conversationText);
+                if (isContentRejection) {
+                    logger.warn('适配器', `早期检测到内容拒绝: ${conversationText.substring(0, 200)}...`, meta);
+                    return { error: `内容被拒绝: ${conversationText.substring(0, 200)}`, retryable: false };
+                }
+            }
+        }
+
         logger.info('适配器', '生成中，等待图片就绪...', meta);
 
         // 6. 监听文件状态接口，等待图片生成完成
-        // 通过 file_name 是否包含 .part 判断是否生成完成
+        // 如果 conversation 响应中没有图片生成迹象，使用较短超时
         let downloadUrl = null;
         let fileName = null;
+        const imageTimeout = isImageGenerationStarted ? 120000 : 30000;
 
         try {
             await page.waitForResponse(async (response) => {
@@ -128,11 +195,6 @@ async function generate(context, prompt, imgPaths, modelId, meta = {}) {
                     const fn = json.file_name;
                     const dl = json.download_url;
 
-                    // 检查是否生成完成：
-                    // 1. 必须有 file_name
-                    // 2. file_name 开头必须是 user- (生成的图片)
-                    // 3. file_name 不能包含 .part（表示中间状态）
-                    // 4. 必须有 download_url
                     if (fn && fn.startsWith('user-') && !fn.includes('.part') && dl) {
                         fileName = fn;
                         downloadUrl = dl;
@@ -145,8 +207,34 @@ async function generate(context, prompt, imgPaths, modelId, meta = {}) {
                 } catch {
                     return false;
                 }
-            }, { timeout: waitTimeout });
+            }, { timeout: imageTimeout });
         } catch (e) {
+            logger.debug('适配器', `等待图片超时, conversationText长度: ${conversationText.length}, downloadUrl: ${downloadUrl}`, meta);
+
+            // 超时时检查是否有 conversation 中的文本内容
+            if (conversationText && !downloadUrl) {
+                const isRateLimit = conversationBody.includes('RateLimitException') ||
+                    conversationBody.includes('rate limit') ||
+                    /limit.*reset/i.test(conversationText);
+
+                if (isRateLimit) {
+                    logger.warn('适配器', `触发速率限制: ${conversationText.substring(0, 200)}...`, meta);
+                    return { error: `触发速率限制: ${conversationText.substring(0, 200)}`, retryable: false };
+                }
+
+                logger.warn('适配器', `模型返回文本而非图片: ${conversationText.substring(0, 200)}...`, meta);
+                return { error: `模型返回文本而非图片: ${conversationText.substring(0, 200)}`, retryable: false };
+            }
+
+            // 如果没有提取到文本，但有原始响应体，尝试用简单方式提取
+            if (!conversationText && conversationBody) {
+                const partsMatch = conversationBody.match(/"parts":\s*\["([^"]+)"\]/);
+                if (partsMatch && partsMatch[1]) {
+                    logger.warn('适配器', `通过正则提取到文本: ${partsMatch[1].substring(0, 200)}...`, meta);
+                    return { error: `模型返回文本而非图片: ${partsMatch[1].substring(0, 200)}`, retryable: false };
+                }
+            }
+
             const pageError = normalizePageError(e, meta);
             if (pageError) return pageError;
             throw e;
 
@@ -79,7 +79,7 @@ async function configureModel(page, modelConfig, meta = {}) {
  * @param {string[]} imgPaths - 图片路径数组 (此适配器不支持)
  * @param {string} [modelId] - 模型 ID
  * @param {object} [meta={}] - 日志元数据
- * @returns {Promise<{text?: string, error?: string}>}
+ * @returns {Promise<{text?: string, reasoning?: string, error?: string}>}
  */
 async function generate(context, prompt, imgPaths, modelId, meta = {}) {
     const { page, config } = context;
@@ -108,8 +108,10 @@ async function generate(context, prompt, imgPaths, modelId, meta = {}) {
         logger.debug('适配器', '启动 API 监听...', meta);
 
         let textContent = '';
+        let thinkingContent = '';  // thinking 内容
         let isComplete = false;
         let isCollecting = false;  // 当前最后一个 fragment 是否为 RESPONSE 类型
+        let isCollectingThinking = false;  // 是否正在收集 thinking
 
         const responsePromise = page.waitForResponse(async (response) => {
             const url = response.url();
@@ -133,14 +135,21 @@ async function generate(context, prompt, imgPaths, modelId, meta = {}) {
 
                         // --- 处理 fragment 列表变更，更新 isCollecting 状态 ---
 
-                        // 初始响应中可能已有 fragments (如 SEARCH / RESPONSE)
+                        // 初始响应中可能已有 fragments (如 THINK / SEARCH / RESPONSE)
                         if (data.v?.response?.fragments && Array.isArray(data.v.response.fragments)) {
                             for (const fragment of data.v.response.fragments) {
                                 if (fragment.type === 'RESPONSE') {
                                     isCollecting = true;
+                                    isCollectingThinking = false;
                                     if (fragment.content) textContent += fragment.content;
+                                } else if (fragment.type === 'THINK') {
+                                    // DeepSeek 使用 THINK (不是 THINKING)
+                                    isCollectingThinking = true;
+                                    isCollecting = false;
+                                    if (fragment.content) thinkingContent += fragment.content;
                                 } else {
                                     isCollecting = false;
+                                    isCollectingThinking = false;
                                 }
                             }
                         }
@@ -150,9 +159,15 @@ async function generate(context, prompt, imgPaths, modelId, meta = {}) {
                             for (const fragment of data.v) {
                                 if (fragment.type === 'RESPONSE') {
                                     isCollecting = true;
+                                    isCollectingThinking = false;
                                     if (fragment.content) textContent += fragment.content;
+                                } else if (fragment.type === 'THINK') {
+                                    isCollectingThinking = true;
+                                    isCollecting = false;
+                                    if (fragment.content) thinkingContent += fragment.content;
                                 } else {
                                     isCollecting = false;
+                                    isCollectingThinking = false;
                                 }
                             }
                         }
@@ -164,9 +179,15 @@ async function generate(context, prompt, imgPaths, modelId, meta = {}) {
                                     for (const fragment of item.v) {
                                         if (fragment.type === 'RESPONSE') {
                                             isCollecting = true;
+                                            isCollectingThinking = false;
                                             if (fragment.content) textContent += fragment.content;
+                                        } else if (fragment.type === 'THINK') {
+                                            isCollectingThinking = true;
+                                            isCollecting = false;
+                                            if (fragment.content) thinkingContent += fragment.content;
                                         } else {
                                             isCollecting = false;
+                                            isCollectingThinking = false;
                                         }
                                     }
                                 }
@@ -182,15 +203,21 @@ async function generate(context, prompt, imgPaths, modelId, meta = {}) {
                         // 带路径的 content 操作 (如 response/fragments/-1/content)
                         if (data.p && typeof data.v === 'string') {
                             const match = data.p.match(/response\/fragments\/(-?\d+)\/content/);
-                            if (match && isCollecting) {
-                                textContent += data.v;
+                            if (match) {
+                                if (isCollecting) {
+                                    textContent += data.v;
+                                } else if (isCollectingThinking) {
+                                    thinkingContent += data.v;
+                                }
                             }
                         }
 
                         // 纯文本追加 (只有 v 字符串，没有 p 和 o)
                         if (data.v && typeof data.v === 'string' && !data.p && !data.o) {
                             if (isCollecting) {
                                 textContent += data.v;
+                            } else if (isCollectingThinking) {
+                                thinkingContent += data.v;
                             }
                         }
 
@@ -233,7 +260,16 @@ async function generate(context, prompt, imgPaths, modelId, meta = {}) {
 
         logger.info('适配器', `已获取文本内容 (${textContent.length} 字符)`, meta);
         logger.info('适配器', '文本生成完成，任务完成', meta);
-        return { text: textContent.trim() };
+
+        const trimmedThinking = thinkingContent.trim();
+        const result = { text: textContent.trim() };
+
+        // 返回结果（如果有 thinking 则包含 reasoning）
+        if (trimmedThinking) {
+            logger.info('适配器', `已获取思考过程 (${trimmedThinking.length} 字符)`, meta);
+            result.reasoning = trimmedThinking;
+        }
+        return result;
 
     } catch (err) {
         // 顶层错误处理
 
@@ -175,10 +175,16 @@ async function generate(context, prompt, imgPaths, modelId, meta = {}) {
                 return { error: errorMsg };
             }
 
-            // 取第一张图片，追加 =s1024-rj 获取高分辨率
-            const imageUrl = imageUrls[0] + '=s1024-rj';
+            // 取第一张图片，追加 =d-I 获取全尺寸原图（而非 =s1024-rj 的缩略图）
+            const imageUrl = imageUrls[0] + '=d-I';
             logger.info('适配器', `找到 ${imageUrls.length} 张图片，开始下载...`, meta);
 
+            // 提取图片生成的详细描述（thinking）
+            const thinking = extractImageThinking(bodyBuffer);
+            if (thinking) {
+                logger.info('适配器', `提取到详细描述，长度: ${thinking.length}`, meta);
+            }
+
             // 使用封装的下载函数
             const imgDlCfg = config?.backend?.pool?.failover || {};
             const result = await useContextDownload(imageUrl, page, {
@@ -190,7 +196,8 @@ async function generate(context, prompt, imgPaths, modelId, meta = {}) {
             }
 
             logger.info('适配器', '已获取图片，任务完成', meta);
-            return result;
+            // 返回图片和 thinking（如果有）
+            return thinking ? { ...result, reasoning: thinking } : result;
         }
 
     } catch (err) {
@@ -428,4 +435,57 @@ function extractAiTextFromResponse(bodyBuffer) {
         }
     }
     return best;
+}
+
+/**
+ * 深度遍历，查找长文本描述（图片生成的 thinking/详细描述）
+ * 排除 URL、base64、分类器名称等非描述性长字符串
+ * @param {any} root - 要遍历的对象
+ * @returns {string} 最长的描述文本，未找到则返回空字符串
+ */
+function findLongDescriptionDeep(root) {
+    const candidates = [];
+    const stack = [root];
+
+    while (stack.length) {
+        const cur = stack.pop();
+        if (!cur) continue;
+
+        if (typeof cur === 'string') {
+            if (cur.length > 200 &&
+                !cur.startsWith('http') &&
+                !cur.startsWith('data:') &&
+                !cur.includes('googleapis.com') &&
+                !cur.includes('googleusercontent.com') &&
+                !/^[A-Za-z0-9+/=]{100,}$/.test(cur)) {
+                candidates.push(cur);
+            }
+        } else if (Array.isArray(cur)) {
+            for (const v of cur) stack.push(v);
+        } else if (typeof cur === 'object') {
+            for (const v of Object.values(cur)) stack.push(v);
+        }
+    }
+
+    if (candidates.length === 0) return '';
+    return candidates.reduce((a, b) => a.length >= b.length ? a : b, '');
+}
+
+/**
+ * 从响应体 Buffer 中提取图片生成的详细描述（thinking）
+ * @param {Buffer} bodyBuffer - 响应体 Buffer
+ * @returns {string} 详细描述文本，未找到则返回空字符串
+ */
+function extractImageThinking(bodyBuffer) {
+    const frames = parseLenFramedResponse(bodyBuffer);
+    const payloads = extractPayloads(frames);
+
+    let best = '';
+    for (const payload of payloads) {
+        const text = findLongDescriptionDeep(payload);
+        if (text.length > best.length) {
+            best = text;
+        }
+    }
+    return best;
 }