From a0d657ee188f52f8a4ceaad1658c81343a32fdad Mon Sep 17 00:00:00 2001
From: chioarub <59725767+chioarub@users.noreply.github.com>
Date: Sun, 26 Apr 2026 03:18:59 +0300
Subject: [PATCH] feat(zai): add Z.AI GLM Coding Plan provider preset (#896)

* feat(zai): add Z.AI GLM Coding Plan provider preset

Add dedicated Z.AI provider support for the GLM Coding Plan, enabling
use of GLM-5.1, GLM-5-Turbo, GLM-4.7, and GLM-4.5-Air models through
the OpenAI-compatible shim with proper thinking mode (reasoning_content),
max_tokens handling, and context window sizing.

* fix(zai): unify GLM max output token limits across casing variants

glm-5/glm-4.7 had conservative 16K max output while GLM-5/GLM-4.7
had 131K. Use consistent Z.AI coding plan limits for all GLM variants.

* fix(zai): restore DashScope GLM limits, enable GLM thinking support

- Restore lowercase glm-5/glm-4.7 to 16_384 max output (DashScope limits)
  while keeping Z.AI coding plan high limits on uppercase GLM-* keys only
- Add GLM model support to modelSupportsThinking() so reasoning_content
  is enabled when using GLM-5.x/GLM-4.7 models on Z.AI

* fix(zai): tighten GLM regexes, fix misleading context window comment

- Use precise regex in thinking.ts: exact GLM model matches only,
  no false positives on glm-50/glm-4, includes glm-4.5-air
- Use uppercase-only match in StartupScreen rawModel fallback so
  DashScope lowercase glm-* models aren't mislabeled as Z.AI
- Clarify context window comment: lowercase glm-5.1/glm-5-turbo/
  glm-4.5-air are Z.AI-specific aliases, not DashScope

* fix(zai): scope GLM detection to Z.AI

* improve readability of max_completion_tokens check

Co-authored-by: Copilot Autofix powered by AI <175728472+Copilot@users.noreply.github.com>

---------

Co-authored-by: Copilot Autofix powered by AI <175728472+Copilot@users.noreply.github.com>
---
 .env.example                            |  4 ++
 src/components/ProviderManager.test.tsx |  1 +
 src/components/ProviderManager.tsx      |  5 ++
 src/components/StartupScreen.test.ts    | 20 +++++++
 src/components/StartupScreen.ts         |  3 +
 src/services/api/openaiShim.test.ts     | 76 +++++++++++++++++++++++++
 src/services/api/openaiShim.ts          | 33 +++++++++--
 src/utils/context.test.ts               | 46 ++++++++++++++-
 src/utils/model/openaiContextWindows.ts | 19 +++++++
 src/utils/providerDiscovery.ts          |  5 ++
 src/utils/providerFlag.ts               |  8 +++
 src/utils/providerProfiles.test.ts      | 12 ++++
 src/utils/providerProfiles.ts           | 10 ++++
 src/utils/thinking.test.ts              | 64 +++++++++++++++++++++
 src/utils/thinking.ts                   |  8 +++
 src/utils/zaiProvider.ts                | 34 +++++++++++
 16 files changed, 342 insertions(+), 6 deletions(-)
 create mode 100644 src/utils/thinking.test.ts
 create mode 100644 src/utils/zaiProvider.ts

diff --git a/.env.example b/.env.example
index 14192e8d..695d77c6 100644
--- a/.env.example
+++ b/.env.example
@@ -150,6 +150,10 @@ ANTHROPIC_API_KEY=sk-ant-your-key-here
 # OPENAI_MODEL=deepseek-v4-flash
 # Optional: OPENAI_MODEL=deepseek-v4-pro
 # Legacy aliases also work: deepseek-chat and deepseek-reasoner
+# For Z.AI GLM Coding Plan, set:
+# OPENAI_BASE_URL=https://api.z.ai/api/coding/paas/v4
+# OPENAI_MODEL=GLM-5.1
+# Optional: OPENAI_MODEL=GLM-5-Turbo, GLM-4.7, or GLM-4.5-Air
 
 # Use a custom OpenAI-compatible endpoint (optional — defaults to api.openai.com)
 # OPENAI_BASE_URL=https://api.openai.com/v1
diff --git a/src/components/ProviderManager.test.tsx b/src/components/ProviderManager.test.tsx
index cacfd190..8dddf80e 100644
--- a/src/components/ProviderManager.test.tsx
+++ b/src/components/ProviderManager.test.tsx
@@ -125,6 +125,7 @@ const PRESET_ORDER = [
   'OpenAI',
   'OpenRouter',
   'Together AI',
+  'Z.AI - GLM Coding Plan',
   'Custom',
 ] as const
 
diff --git a/src/components/ProviderManager.tsx b/src/components/ProviderManager.tsx
index 3226cfd4..e72883e9 100644
--- a/src/components/ProviderManager.tsx
+++ b/src/components/ProviderManager.tsx
@@ -1345,6 +1345,11 @@ export function ProviderManager({ mode, onDone }: Props): React.ReactNode {
         label: 'Together AI',
         description: 'Together chat/completions endpoint',
       },
+      {
+        value: 'zai',
+        label: 'Z.AI - GLM Coding Plan',
+        description: 'Z.AI GLM coding subscription endpoint',
+      },
       {
         value: 'custom',
         label: 'Custom',
diff --git a/src/components/StartupScreen.test.ts b/src/components/StartupScreen.test.ts
index b5639c28..9b83b108 100644
--- a/src/components/StartupScreen.test.ts
+++ b/src/components/StartupScreen.test.ts
@@ -116,6 +116,11 @@ describe('detectProvider — direct vendor endpoints', () => {
     expect(detectProvider().name).toBe('Mistral')
   })
 
+  test('api.z.ai labels as Z.AI GLM', () => {
+    setupOpenAIMode('https://api.z.ai/api/coding/paas/v4', 'GLM-5.1')
+    expect(detectProvider().name).toBe('Z.AI - GLM')
+  })
+
   test('default OpenAI URL + gpt-4o labels as OpenAI', () => {
     setupOpenAIMode('https://api.openai.com/v1', 'gpt-4o')
     expect(detectProvider().name).toBe('OpenAI')
@@ -149,6 +154,21 @@ describe('detectProvider — rawModel fallback when URL is generic', () => {
     setupOpenAIMode('https://my-proxy.internal/v1', 'mistral-large-latest')
     expect(detectProvider().name).toBe('Mistral')
   })
+
+  test('custom proxy + exact uppercase GLM ID falls back to Z.AI GLM', () => {
+    setupOpenAIMode('https://my-proxy.internal/v1', 'GLM-5.1')
+    expect(detectProvider().name).toBe('Z.AI - GLM')
+  })
+
+  test('custom proxy + lowercase glm ID stays generic OpenAI', () => {
+    setupOpenAIMode('https://my-proxy.internal/v1', 'glm-5.1')
+    expect(detectProvider().name).toBe('OpenAI')
+  })
+
+  test('DashScope lowercase glm ID is not mislabeled as Z.AI', () => {
+    setupOpenAIMode('https://dashscope.aliyuncs.com/compatible-mode/v1', 'glm-5.1')
+    expect(detectProvider().name).toBe('OpenAI')
+  })
 })
 
 // --- Explicit env flags win over URL heuristics ---
diff --git a/src/components/StartupScreen.ts b/src/components/StartupScreen.ts
index 380b71b4..6014335e 100644
--- a/src/components/StartupScreen.ts
+++ b/src/components/StartupScreen.ts
@@ -9,6 +9,7 @@ import { isLocalProviderUrl, resolveProviderRequest } from '../services/api/prov
 import { getLocalOpenAICompatibleProviderLabel } from '../utils/providerDiscovery.js'
 import { getSettings_DEPRECATED } from '../utils/settings/settings.js'
 import { parseUserSpecifiedModel } from '../utils/model/model.js'
+import { containsExactZaiGlmModelId, isZaiBaseUrl } from '../utils/zaiProvider.js'
 
 declare const MACRO: { VERSION: string; DISPLAY_VERSION?: string }
 
@@ -137,6 +138,7 @@ export function detectProvider(): { name: string; model: string; baseUrl: string
     else if (/api\.kimi\.com/i.test(baseUrl)) name = 'Moonshot AI - Kimi Code'
     else if (/moonshot/i.test(baseUrl)) name = 'Moonshot AI - API'
     else if (/deepseek/i.test(baseUrl)) name = 'DeepSeek'
+    else if (isZaiBaseUrl(baseUrl)) name = 'Z.AI - GLM'
     else if (/mistral/i.test(baseUrl)) name = 'Mistral'
     // rawModel fallback — fires only when base URL is generic/custom.
     else if (/nvidia/i.test(rawModel)) name = 'NVIDIA NIM'
@@ -146,6 +148,7 @@ export function detectProvider(): { name: string; model: string; baseUrl: string
     else if (/\bkimi-k/i.test(rawModel) || /moonshot/i.test(rawModel))
       name = 'Moonshot AI - API'
     else if (/deepseek/i.test(rawModel)) name = 'DeepSeek'
+    else if (containsExactZaiGlmModelId(rawModel)) name = 'Z.AI - GLM'
     else if (/mistral/i.test(rawModel)) name = 'Mistral'
     else if (/llama/i.test(rawModel)) name = 'Meta Llama'
     else if (/bankr/i.test(baseUrl)) name = 'Bankr'
diff --git a/src/services/api/openaiShim.test.ts b/src/services/api/openaiShim.test.ts
index 38d6e65a..28bc7580 100644
--- a/src/services/api/openaiShim.test.ts
+++ b/src/services/api/openaiShim.test.ts
@@ -3991,3 +3991,79 @@ test('preserves mixed text and image tool results as multipart content', async (
   expect(content[0].type).toBe('text')
   expect(content[1].type).toBe('image_url')
 })
+
+test('Z.AI: uses max_tokens (not max_completion_tokens) and strips store', async () => {
+  process.env.OPENAI_BASE_URL = 'https://api.z.ai/api/coding/paas/v4'
+  process.env.OPENAI_API_KEY = 'sk-zai-test'
+
+  let requestBody: Record<string, unknown> | undefined
+  globalThis.fetch = (async (_input, init) => {
+    requestBody = JSON.parse(String(init?.body))
+    return new Response(
+      JSON.stringify({
+        id: 'chatcmpl-1',
+        model: 'GLM-5.1',
+        choices: [
+          { message: { role: 'assistant', content: 'ok' }, finish_reason: 'stop' },
+        ],
+        usage: { prompt_tokens: 3, completion_tokens: 1, total_tokens: 4 },
+      }),
+      { headers: { 'Content-Type': 'application/json' } },
+    )
+  }) as FetchType
+
+  const client = createOpenAIShimClient({}) as OpenAIShimClient
+  await client.beta.messages.create({
+    model: 'GLM-5.1',
+    system: 'you are glm',
+    messages: [{ role: 'user', content: 'hi' }],
+    max_tokens: 256,
+    stream: false,
+  })
+
+  expect(requestBody?.max_tokens).toBe(256)
+  expect(requestBody?.max_completion_tokens).toBeUndefined()
+  expect(requestBody?.store).toBeUndefined()
+})
+
+test('Z.AI: thinking mode enabled when requested', async () => {
+  process.env.OPENAI_BASE_URL = 'https://api.z.ai/api/coding/paas/v4'
+  process.env.OPENAI_API_KEY = 'sk-zai-test'
+
+  let requestBody: Record<string, unknown> | undefined
+  globalThis.fetch = (async (_input, init) => {
+    requestBody = JSON.parse(String(init?.body))
+    return new Response(
+      JSON.stringify({
+        id: 'chatcmpl-1',
+        model: 'GLM-5.1',
+        choices: [
+          {
+            message: {
+              role: 'assistant',
+              content: null,
+              reasoning_content: 'Let me think...',
+            },
+            finish_reason: 'stop',
+          },
+        ],
+        usage: { prompt_tokens: 3, completion_tokens: 1, total_tokens: 4 },
+      }),
+      { headers: { 'Content-Type': 'application/json' } },
+    )
+  }) as FetchType
+
+  const client = createOpenAIShimClient({}) as OpenAIShimClient
+  await client.beta.messages.create({
+    model: 'GLM-5.1',
+    system: 'you are glm',
+    messages: [{ role: 'user', content: 'think hard' }],
+    max_tokens: 1024,
+    stream: false,
+    thinking: { type: 'enabled', budget_tokens: 1024 },
+  })
+
+  expect((requestBody?.thinking as Record<string, string>)?.type).toBe('enabled')
+  expect(requestBody?.max_completion_tokens).toBeUndefined()
+  expect(requestBody?.max_tokens).toBe(1024)
+})
diff --git a/src/services/api/openaiShim.ts b/src/services/api/openaiShim.ts
index 1c0d1392..a5f024f9 100644
--- a/src/services/api/openaiShim.ts
+++ b/src/services/api/openaiShim.ts
@@ -64,6 +64,7 @@ import {
 } from './openaiErrorClassification.js'
 import { sanitizeSchemaForOpenAICompat } from '../../utils/schemaSanitizer.js'
 import { redactSecretValueForDisplay } from '../../utils/providerProfile.js'
+import { isZaiBaseUrl } from '../../utils/zaiProvider.js'
 import {
   normalizeToolArguments,
   hasToolFieldMapping,
@@ -93,7 +94,6 @@ const KIMI_CODE_API_HOST = 'api.kimi.com'
 const DEEPSEEK_API_HOSTS = new Set([
   'api.deepseek.com',
 ])
-
 const COPILOT_HEADERS: Record<string, string> = {
   'User-Agent': 'GitHubCopilotChat/0.26.7',
   'Editor-Version': 'vscode/1.99.3',
@@ -1514,7 +1514,8 @@ class OpenAIShimMessages {
       // thinking block we captured on the inbound response.
       preserveReasoningContent:
         isMoonshotCompatibleBaseUrl(request.baseUrl) ||
-        isDeepSeekBaseUrl(request.baseUrl),
+        isDeepSeekBaseUrl(request.baseUrl) ||
+        isZaiBaseUrl(request.baseUrl),
     })
 
     const body: Record<string, unknown> = {
@@ -1553,8 +1554,19 @@ class OpenAIShimMessages {
 
     const isMoonshot = isMoonshotCompatibleBaseUrl(request.baseUrl)
     const isDeepSeek = isDeepSeekBaseUrl(request.baseUrl)
+    const isZai = isZaiBaseUrl(request.baseUrl)
 
-    if ((isGithub || isMistral || isLocal || isMoonshot || isDeepSeek) && body.max_completion_tokens !== undefined) {
+    if (
+      (
+        isGithub ||
+        isMistral ||
+        isLocal ||
+        isMoonshot ||
+        isDeepSeek ||
+        isZai
+      ) &&
+      body.max_completion_tokens !== undefined
+    ) {
       body.max_tokens = body.max_completion_tokens
       delete body.max_completion_tokens
     }
@@ -1562,10 +1574,10 @@ class OpenAIShimMessages {
     // mistral and gemini don't recognize body.store — Gemini returns 400
     // "Invalid JSON payload received. Unknown name 'store': Cannot find field."
     // Moonshot direct API, Kimi Code's OpenAI-compatible coding endpoint,
-    // and DeepSeek have not published support for the parameter either;
+    // DeepSeek, and Z.AI have not published support for the parameter either;
     // strip it preemptively to avoid the same class of error on strict-parse
     // providers.
-    if (isMistral || isGeminiMode() || isMoonshot || isDeepSeek) {
+    if (isMistral || isGeminiMode() || isMoonshot || isDeepSeek || isZai) {
       delete body.store
     }
 
@@ -1593,6 +1605,17 @@ class OpenAIShimMessages {
       }
     }
 
+    // Z.AI uses the same thinking format as DeepSeek: { type: "enabled" | "disabled" }
+    // with reasoning_content in responses.
+    if (isZai) {
+      const requestedThinkingType = (params.thinking as { type?: string } | undefined)?.type
+      if (requestedThinkingType && requestedThinkingType !== 'disabled') {
+        body.thinking = { type: 'enabled' }
+      } else if (requestedThinkingType === 'disabled') {
+        body.thinking = { type: 'disabled' }
+      }
+    }
+
     if (params.tools && params.tools.length > 0) {
       const converted = convertTools(
         params.tools as Array<{
diff --git a/src/utils/context.test.ts b/src/utils/context.test.ts
index 3c83b194..d71b07b8 100644
--- a/src/utils/context.test.ts
+++ b/src/utils/context.test.ts
@@ -1,4 +1,4 @@
-import { afterEach, expect, test } from 'bun:test'
+import { afterEach, beforeEach, expect, test } from 'bun:test'
 
 import { getMaxOutputTokensForModel } from '../services/api/claude.ts'
 import {
@@ -12,6 +12,12 @@ const originalEnv = {
   OPENAI_MODEL: process.env.OPENAI_MODEL,
 }
 
+beforeEach(() => {
+  delete process.env.CLAUDE_CODE_USE_OPENAI
+  delete process.env.CLAUDE_CODE_MAX_OUTPUT_TOKENS
+  delete process.env.OPENAI_MODEL
+})
+
 afterEach(() => {
   if (originalEnv.CLAUDE_CODE_USE_OPENAI === undefined) {
     delete process.env.CLAUDE_CODE_USE_OPENAI
@@ -265,6 +271,43 @@ test('DashScope glm-4.7 uses provider-specific context and output caps', () => {
   })
 })
 
+test('Z.AI uppercase GLM models use Coding Plan output caps', () => {
+  process.env.CLAUDE_CODE_USE_OPENAI = '1'
+  delete process.env.CLAUDE_CODE_MAX_OUTPUT_TOKENS
+
+  expect(getContextWindowForModel('GLM-5.1')).toBe(202_752)
+  expect(getModelMaxOutputTokens('GLM-5.1')).toEqual({
+    default: 131_072,
+    upperLimit: 131_072,
+  })
+  expect(getModelMaxOutputTokens('GLM-5-Turbo')).toEqual({
+    default: 131_072,
+    upperLimit: 131_072,
+  })
+  expect(getModelMaxOutputTokens('GLM-4.5-Air')).toEqual({
+    default: 65_536,
+    upperLimit: 65_536,
+  })
+})
+
+test('lowercase GLM aliases keep conservative output caps', () => {
+  process.env.CLAUDE_CODE_USE_OPENAI = '1'
+  delete process.env.CLAUDE_CODE_MAX_OUTPUT_TOKENS
+
+  expect(getModelMaxOutputTokens('glm-5.1')).toEqual({
+    default: 16_384,
+    upperLimit: 16_384,
+  })
+  expect(getModelMaxOutputTokens('glm-5-turbo')).toEqual({
+    default: 16_384,
+    upperLimit: 16_384,
+  })
+  expect(getModelMaxOutputTokens('glm-4.5-air')).toEqual({
+    default: 16_384,
+    upperLimit: 16_384,
+  })
+})
+
 test('DashScope models clamp oversized max output overrides to the provider limit', () => {
   process.env.CLAUDE_CODE_USE_OPENAI = '1'
   process.env.CLAUDE_CODE_MAX_OUTPUT_TOKENS = '100000'
@@ -275,4 +318,5 @@ test('DashScope models clamp oversized max output overrides to the provider limi
   expect(getMaxOutputTokensForModel('qwen3-max')).toBe(32_768)
   expect(getMaxOutputTokensForModel('kimi-k2.5')).toBe(32_768)
   expect(getMaxOutputTokensForModel('glm-5')).toBe(16_384)
+  expect(getMaxOutputTokensForModel('glm-5.1')).toBe(16_384)
 })
diff --git a/src/utils/model/openaiContextWindows.ts b/src/utils/model/openaiContextWindows.ts
index c4211612..05a99d3d 100644
--- a/src/utils/model/openaiContextWindows.ts
+++ b/src/utils/model/openaiContextWindows.ts
@@ -232,6 +232,15 @@ const OPENAI_CONTEXT_WINDOWS: Record<string, number> = {
   'kimi-k2.5':                262_144,
   'glm-5':                    202_752,
   'glm-4.7':                  202_752,
+  'glm-5.1':                  202_752,
+  'glm-5-turbo':              202_752,
+  'glm-4.5-air':              128_000,
+  // Z.AI Coding Plan models (uppercase variants)
+  'GLM-5.1':                  202_752,
+  'GLM-5-Turbo':              202_752,
+  'GLM-5':                    202_752,
+  'GLM-4.7':                  202_752,
+  'GLM-4.5-Air':              128_000,
 
   // Moonshot AI direct API (api.moonshot.ai/v1). Values from Moonshot's
   // published model card — all K2 tier share 256K context. Prefix matching
@@ -420,8 +429,18 @@ const OPENAI_MAX_OUTPUT_TOKENS: Record<string, number> = {
   'qwen3-max':                 32_768,
   'qwen3-max-2026-01-23':      32_768,
   'kimi-k2.5':                 32_768,
+  // GLM models — lowercase aliases stay on conservative DashScope-style
+  // limits; Z.AI Coding Plan's exact uppercase GLM-* IDs use higher limits.
   'glm-5':                     16_384,
   'glm-4.7':                   16_384,
+  'glm-5.1':                    16_384,
+  'glm-5-turbo':                16_384,
+  'glm-4.5-air':                16_384,
+  'GLM-5':                     131_072,
+  'GLM-5.1':                   131_072,
+  'GLM-5-Turbo':               131_072,
+  'GLM-4.7':                   131_072,
+  'GLM-4.5-Air':                65_536,
 
   // Moonshot AI direct API
   'kimi-for-coding':           32_768,
diff --git a/src/utils/providerDiscovery.ts b/src/utils/providerDiscovery.ts
index 93444806..eba7198d 100644
--- a/src/utils/providerDiscovery.ts
+++ b/src/utils/providerDiscovery.ts
@@ -1,5 +1,6 @@
 import type { OllamaModelDescriptor } from './providerRecommendation.ts'
 import { DEFAULT_OPENAI_BASE_URL } from '../services/api/providerConfig.js'
+import { isZaiBaseUrl } from './zaiProvider.js'
 
 export const DEFAULT_OLLAMA_BASE_URL = 'http://localhost:11434'
 export const DEFAULT_ATOMIC_CHAT_BASE_URL = 'http://127.0.0.1:1337'
@@ -205,6 +206,10 @@ export function getLocalOpenAICompatibleProviderLabel(baseUrl?: string): string
     if (host.includes('bankr') || haystack.includes('bankr')) {
       return 'Bankr'
     }
+    // Z.AI GLM Coding Plan
+    if (isZaiBaseUrl(parsed.href)) {
+      return 'Z.AI - GLM'
+    }
     // Moonshot AI direct API
     if (
       host.includes('moonshot') ||
diff --git a/src/utils/providerFlag.ts b/src/utils/providerFlag.ts
index 8801c6b6..14a658bb 100644
--- a/src/utils/providerFlag.ts
+++ b/src/utils/providerFlag.ts
@@ -15,6 +15,7 @@
 export const VALID_PROVIDERS = [
   'anthropic',
   'bankr',
+  'zai',
   'openai',
   'gemini',
   'mistral',
@@ -159,6 +160,13 @@ export function applyProviderFlag(
         process.env.OPENAI_API_KEY = process.env.BNKR_API_KEY
       }
       break
+
+    case 'zai':
+      process.env.CLAUDE_CODE_USE_OPENAI = '1'
+      process.env.OPENAI_BASE_URL ??= 'https://api.z.ai/api/coding/paas/v4'
+      process.env.OPENAI_MODEL ??= 'GLM-5.1'
+      if (model) process.env.OPENAI_MODEL = model
+      break
   }
 
   return {}
diff --git a/src/utils/providerProfiles.test.ts b/src/utils/providerProfiles.test.ts
index c7698a7a..92b153bf 100644
--- a/src/utils/providerProfiles.test.ts
+++ b/src/utils/providerProfiles.test.ts
@@ -625,6 +625,18 @@ describe('getProviderPresetDefaults', () => {
     )
     expect(defaults.requiresApiKey).toBe(true)
   })
+
+  test('zai preset defaults to Z.AI GLM Coding Plan endpoint', async () => {
+    const { getProviderPresetDefaults } = await importFreshProviderProfileModules()
+
+    const defaults = getProviderPresetDefaults('zai')
+
+    expect(defaults.provider).toBe('openai')
+    expect(defaults.name).toBe('Z.AI - GLM Coding Plan')
+    expect(defaults.baseUrl).toBe('https://api.z.ai/api/coding/paas/v4')
+    expect(defaults.model).toBe('GLM-5.1, GLM-5-Turbo, GLM-4.7, GLM-4.5-Air')
+    expect(defaults.requiresApiKey).toBe(true)
+  })
 })
 
 describe('setActiveProviderProfile', () => {
diff --git a/src/utils/providerProfiles.ts b/src/utils/providerProfiles.ts
index e226c6da..ee917d8d 100644
--- a/src/utils/providerProfiles.ts
+++ b/src/utils/providerProfiles.ts
@@ -36,6 +36,7 @@ export type ProviderPreset =
   | 'custom'
   | 'nvidia-nim'
   | 'minimax'
+  | 'zai'
   | 'bankr'
   | 'atomic-chat'
 
@@ -317,6 +318,15 @@ export function getProviderPresetDefaults(
         apiKey: process.env.BNKR_API_KEY ?? '',
         requiresApiKey: true,
       }
+    case 'zai':
+      return {
+        provider: 'openai',
+        name: 'Z.AI - GLM Coding Plan',
+        baseUrl: 'https://api.z.ai/api/coding/paas/v4',
+        model: 'GLM-5.1, GLM-5-Turbo, GLM-4.7, GLM-4.5-Air',
+        apiKey: '',
+        requiresApiKey: true,
+      }
     case 'ollama':
     default:
       return {
diff --git a/src/utils/thinking.test.ts b/src/utils/thinking.test.ts
new file mode 100644
index 00000000..8dd5348f
--- /dev/null
+++ b/src/utils/thinking.test.ts
@@ -0,0 +1,64 @@
+import { afterEach, beforeEach, describe, expect, test } from 'bun:test'
+import { modelSupportsThinking } from './thinking.js'
+
+const ENV_KEYS = [
+  'CLAUDE_CODE_USE_OPENAI',
+  'CLAUDE_CODE_USE_GEMINI',
+  'CLAUDE_CODE_USE_GITHUB',
+  'CLAUDE_CODE_USE_MISTRAL',
+  'CLAUDE_CODE_USE_BEDROCK',
+  'CLAUDE_CODE_USE_VERTEX',
+  'CLAUDE_CODE_USE_FOUNDRY',
+  'OPENAI_BASE_URL',
+  'OPENAI_API_BASE',
+  'OPENAI_MODEL',
+  'NVIDIA_NIM',
+  'MINIMAX_API_KEY',
+  'USER_TYPE',
+]
+
+const originalEnv: Record<string, string | undefined> = {}
+
+beforeEach(() => {
+  for (const key of ENV_KEYS) {
+    originalEnv[key] = process.env[key]
+    delete process.env[key]
+  }
+})
+
+afterEach(() => {
+  for (const key of ENV_KEYS) {
+    if (originalEnv[key] === undefined) {
+      delete process.env[key]
+    } else {
+      process.env[key] = originalEnv[key]
+    }
+  }
+})
+
+describe('modelSupportsThinking — Z.AI GLM', () => {
+  test('enables thinking for exact GLM models on api.z.ai', () => {
+    process.env.CLAUDE_CODE_USE_OPENAI = '1'
+    process.env.OPENAI_BASE_URL = 'https://api.z.ai/api/coding/paas/v4'
+
+    expect(modelSupportsThinking('GLM-5.1')).toBe(true)
+    expect(modelSupportsThinking('GLM-5-Turbo')).toBe(true)
+    expect(modelSupportsThinking('GLM-4.7')).toBe(true)
+    expect(modelSupportsThinking('GLM-4.5-Air')).toBe(true)
+  })
+
+  test('does not enable GLM thinking on non-Z.AI OpenAI-compatible endpoints', () => {
+    process.env.CLAUDE_CODE_USE_OPENAI = '1'
+    process.env.OPENAI_BASE_URL = 'https://dashscope.aliyuncs.com/compatible-mode/v1'
+
+    expect(modelSupportsThinking('glm-5.1')).toBe(false)
+    expect(modelSupportsThinking('GLM-5.1')).toBe(false)
+  })
+
+  test('does not match unrelated GLM-looking model names', () => {
+    process.env.CLAUDE_CODE_USE_OPENAI = '1'
+    process.env.OPENAI_BASE_URL = 'https://api.z.ai/api/coding/paas/v4'
+
+    expect(modelSupportsThinking('glm-50')).toBe(false)
+  })
+})
\ No newline at end of file
diff --git a/src/utils/thinking.ts b/src/utils/thinking.ts
index 824a3f60..414c7f88 100644
--- a/src/utils/thinking.ts
+++ b/src/utils/thinking.ts
@@ -6,6 +6,7 @@ import { getCanonicalName } from './model/model.js'
 import { get3PModelCapabilityOverride } from './model/modelSupportOverrides.js'
 import { getAPIProvider } from './model/providers.js'
 import { getSettingsWithErrors } from './settings/settings.js'
+import { isZaiBaseUrl, isZaiGlmModel } from './zaiProvider.js'
 
 export type ThinkingConfig =
   | { type: 'adaptive' }
@@ -111,6 +112,13 @@ export function modelSupportsThinking(model: string): boolean {
   ) {
     return true
   }
+  if (
+    provider === 'openai' &&
+    isZaiBaseUrl(process.env.OPENAI_BASE_URL ?? process.env.OPENAI_API_BASE) &&
+    isZaiGlmModel(canonical)
+  ) {
+    return true
+  }
   // 3P (Bedrock/Vertex): only Opus 4+ and Sonnet 4+
   return canonical.includes('sonnet-4') || canonical.includes('opus-4')
 }
diff --git a/src/utils/zaiProvider.ts b/src/utils/zaiProvider.ts
new file mode 100644
index 00000000..6d6fdd1e
--- /dev/null
+++ b/src/utils/zaiProvider.ts
@@ -0,0 +1,34 @@
+const ZAI_API_HOSTS = new Set([
+  'api.z.ai',
+])
+
+const ZAI_GLM_MODEL_IDS = new Set([
+  'GLM-5.1',
+  'GLM-5-Turbo',
+  'GLM-5',
+  'GLM-4.7',
+  'GLM-4.5-Air',
+])
+
+const ZAI_GLM_MODEL_IDS_LOWER = new Set(
+  [...ZAI_GLM_MODEL_IDS].map(model => model.toLowerCase()),
+)
+
+export function isZaiBaseUrl(baseUrl: string | undefined): boolean {
+  if (!baseUrl) return false
+  try {
+    return ZAI_API_HOSTS.has(new URL(baseUrl).hostname.toLowerCase())
+  } catch {
+    return false
+  }
+}
+
+export function isZaiGlmModel(model: string): boolean {
+  return ZAI_GLM_MODEL_IDS_LOWER.has(model.trim().toLowerCase())
+}
+
+export function containsExactZaiGlmModelId(model: string): boolean {
+  return model
+    .split(',')
+    .some(entry => ZAI_GLM_MODEL_IDS.has(entry.trim()))
+}
\ No newline at end of file