AI模型广场
开箱即用的大模型 API:统一接入、按量计费、弹性扩展。选购资源包即可调用多系列主流模型,专注业务而非基建
- 多系列模型一站式
- 兼容 OpenAI 风格接口
- 按需扩展与私有化选项
模型列表

GLM-5
18 元/百万 Token 或 0.05 元/次
智谱新一代旗舰对话模型,强化复杂推理、工具调用与长上下文一致性,适合企业客服、智能体与工作流编排;支持 Function Calling 与流式输出,便于对接现有业务系统。

DeepSeek-V3.2
3 元/百万 Token 或 0.03 元/次
高性价比通用大模型,支持深度思考模式与长文本理解,在代码、数学与逻辑题上表现均衡;适合研发辅助、数据分析、批量推理与 A/B 成本敏感场景。

Qwen3.5-122B-A10B
10 元/百万 Token 或 0.04 元/次
通义 MoE 架构大模型,在效果与成本之间取得平衡;支持工具调用、多轮对话与长上下文检索,适合高并发 API、RAG 与多租户 SaaS。

GLM-4.7-Flash
免费
GLM-4.7-Flash 作为 30B 级 SOTA 模型,在效率与效果之间提供新选择;面向 Agentic Coding 场景强化了代码与工具调用。轻量高速、首 Token 延迟低,适合对话、摘要、分类与简单工具调用;在免费额度内可快速验证原型与灰度上线。

Kimi-K2.5
21 元/百万 Token 或 0.08 元/次
Moonshot 长上下文与多模态能力突出,适合长文档理解、图文混合问答与复杂 Agent 流程;支持视觉输入与工具调用,便于构建企业知识助手。

Qwen3-Coder-Next
4 元/百万 Token 或 0.02 元/次
面向代码生成、重构与仓库级语义理解的编程专用模型,支持多种语言与目录结构上下文,适合 IDE 插件、CI 生成与代码评审辅助。

deepseek-coder-33b-instruct
8 元/百万 Token 或 0.03 元/次
DeepSeek 代码向指令模型,补全与跟随能力强,适合终端内联提示、脚本生成与单元测试草稿;兼容常见编程范式与注释风格。

Lingshu-32B 医疗大模型
免费
面向医疗问答与辅助决策场景的专用模型,强调合规表述与可解释性;适用于预问诊、文献摘要与科研辅助(不替代执业医师诊断)。

Qwen3-8B
免费
小规模开源友好模型,推理与部署成本低,适合私有化、边缘设备与教学实验;支持常见推理框架与量化部署。

Hunyuan-T1-Standard
14 元/百万 Token 或 0.04 元/次
腾讯混元系列通用对话模型,中文语境与业务表达自然,适合客服、营销文案与办公协作;支持工具调用与流式响应,便于接入微信生态相关业务。

ERNIE-4.0-Turbo-8K
12 元/百万 Token 或 0.035 元/次
文心大模型 Turbo 版本,在推理速度与效果间折中,适合搜索增强、摘要与多轮对话;对中文知识覆盖与合规表述有较好支持。

Step-2-Mini
6 元/百万 Token 或 0.025 元/次
阶跃星辰轻量通用模型,适合对话、翻译与轻量 Agent;延迟与成本可控,便于与 Step 系列大模型组合成分层路由策略。

