AI模型广场

开箱即用的大模型 API：统一接入、按量计费、弹性扩展。选购资源包即可调用多系列主流模型，专注业务而非基建

多系列模型一站式
兼容 OpenAI 风格接口
按需扩展与私有化选项

模型列表

热门系列：

推荐

GLM-5

18 元/百万 Token 或 0.05 元/次

智谱新一代旗舰对话模型，强化复杂推理、工具调用与长上下文一致性，适合企业客服、智能体与工作流编排；支持 Function Calling 与流式输出，便于对接现有业务系统。

Function Calling↑ 200K流式输出

DeepSeek-V3.2

3 元/百万 Token 或 0.03 元/次

高性价比通用大模型，支持深度思考模式与长文本理解，在代码、数学与逻辑题上表现均衡；适合研发辅助、数据分析、批量推理与 A/B 成本敏感场景。

Function Calling↑ 128K↓ 8K深度思考

Qwen3.5-122B-A10B

10 元/百万 Token 或 0.04 元/次

通义 MoE 架构大模型，在效果与成本之间取得平衡；支持工具调用、多轮对话与长上下文检索，适合高并发 API、RAG 与多租户 SaaS。

Function Calling↑ 256KApache-2.0

推荐

GLM-4.7-Flash

免费

GLM-4.7-Flash 作为 30B 级 SOTA 模型，在效率与效果之间提供新选择；面向 Agentic Coding 场景强化了代码与工具调用。轻量高速、首 Token 延迟低，适合对话、摘要、分类与简单工具调用；在免费额度内可快速验证原型与灰度上线。

Function Calling↑ 200K↓ 128K低延迟

Kimi-K2.5

21 元/百万 Token 或 0.08 元/次

Moonshot 长上下文与多模态能力突出，适合长文档理解、图文混合问答与复杂 Agent 流程；支持视觉输入与工具调用，便于构建企业知识助手。

Function Calling视觉↑ 256K

Qwen3-Coder-Next

4 元/百万 Token 或 0.02 元/次

面向代码生成、重构与仓库级语义理解的编程专用模型，支持多种语言与目录结构上下文，适合 IDE 插件、CI 生成与代码评审辅助。

编程↑ 128KFunction Calling

deepseek-coder-33b-instruct

8 元/百万 Token 或 0.03 元/次

DeepSeek 代码向指令模型，补全与跟随能力强，适合终端内联提示、脚本生成与单元测试草稿；兼容常见编程范式与注释风格。

Function Calling↑ 16K代码

Lingshu-32B 医疗大模型

免费

面向医疗问答与辅助决策场景的专用模型，强调合规表述与可解释性；适用于预问诊、文献摘要与科研辅助（不替代执业医师诊断）。

医疗↑ 32K科研

Qwen3-8B

免费

小规模开源友好模型，推理与部署成本低，适合私有化、边缘设备与教学实验；支持常见推理框架与量化部署。

↑ 32K深度思考MindSpore开源

Hunyuan-T1-Standard

14 元/百万 Token 或 0.04 元/次

腾讯混元系列通用对话模型，中文语境与业务表达自然，适合客服、营销文案与办公协作；支持工具调用与流式响应，便于接入微信生态相关业务。

Function Calling↑ 128K中文优化

ERNIE-4.0-Turbo-8K

12 元/百万 Token 或 0.035 元/次

文心大模型 Turbo 版本，在推理速度与效果间折中，适合搜索增强、摘要与多轮对话；对中文知识覆盖与合规表述有较好支持。

Function Calling↑ 8K搜索增强

Step-2-Mini

6 元/百万 Token 或 0.025 元/次

阶跃星辰轻量通用模型，适合对话、翻译与轻量 Agent；延迟与成本可控，便于与 Step 系列大模型组合成分层路由策略。

Function Calling↑ 32K低延迟