杭州牛哇特科技有限公司
首页政策园区Agent培训模型下载入驻
登录注册

AI模型广场

开箱即用的大模型 API:统一接入、按量计费、弹性扩展。选购资源包即可调用多系列主流模型,专注业务而非基建

  • 多系列模型一站式
  • 兼容 OpenAI 风格接口
  • 按需扩展与私有化选项

模型列表

热门系列:
推荐

GLM-5

18 元/百万 Token 或 0.05 元/次

智谱新一代旗舰对话模型,强化复杂推理、工具调用与长上下文一致性,适合企业客服、智能体与工作流编排;支持 Function Calling 与流式输出,便于对接现有业务系统。

Function Calling↑ 200K流式输出

DeepSeek-V3.2

3 元/百万 Token 或 0.03 元/次

高性价比通用大模型,支持深度思考模式与长文本理解,在代码、数学与逻辑题上表现均衡;适合研发辅助、数据分析、批量推理与 A/B 成本敏感场景。

Function Calling↑ 128K↓ 8K深度思考

Qwen3.5-122B-A10B

10 元/百万 Token 或 0.04 元/次

通义 MoE 架构大模型,在效果与成本之间取得平衡;支持工具调用、多轮对话与长上下文检索,适合高并发 API、RAG 与多租户 SaaS。

Function Calling↑ 256KApache-2.0
推荐

GLM-4.7-Flash

免费

GLM-4.7-Flash 作为 30B 级 SOTA 模型,在效率与效果之间提供新选择;面向 Agentic Coding 场景强化了代码与工具调用。轻量高速、首 Token 延迟低,适合对话、摘要、分类与简单工具调用;在免费额度内可快速验证原型与灰度上线。

Function Calling↑ 200K↓ 128K低延迟

Kimi-K2.5

21 元/百万 Token 或 0.08 元/次

Moonshot 长上下文与多模态能力突出,适合长文档理解、图文混合问答与复杂 Agent 流程;支持视觉输入与工具调用,便于构建企业知识助手。

Function Calling视觉↑ 256K

Qwen3-Coder-Next

4 元/百万 Token 或 0.02 元/次

面向代码生成、重构与仓库级语义理解的编程专用模型,支持多种语言与目录结构上下文,适合 IDE 插件、CI 生成与代码评审辅助。

编程↑ 128KFunction Calling

deepseek-coder-33b-instruct

8 元/百万 Token 或 0.03 元/次

DeepSeek 代码向指令模型,补全与跟随能力强,适合终端内联提示、脚本生成与单元测试草稿;兼容常见编程范式与注释风格。

Function Calling↑ 16K代码

Lingshu-32B 医疗大模型

免费

面向医疗问答与辅助决策场景的专用模型,强调合规表述与可解释性;适用于预问诊、文献摘要与科研辅助(不替代执业医师诊断)。

医疗↑ 32K科研

Qwen3-8B

免费

小规模开源友好模型,推理与部署成本低,适合私有化、边缘设备与教学实验;支持常见推理框架与量化部署。

↑ 32K深度思考MindSpore开源

Hunyuan-T1-Standard

14 元/百万 Token 或 0.04 元/次

腾讯混元系列通用对话模型,中文语境与业务表达自然,适合客服、营销文案与办公协作;支持工具调用与流式响应,便于接入微信生态相关业务。

Function Calling↑ 128K中文优化

ERNIE-4.0-Turbo-8K

12 元/百万 Token 或 0.035 元/次

文心大模型 Turbo 版本,在推理速度与效果间折中,适合搜索增强、摘要与多轮对话;对中文知识覆盖与合规表述有较好支持。

Function Calling↑ 8K搜索增强

Step-2-Mini

6 元/百万 Token 或 0.025 元/次

阶跃星辰轻量通用模型,适合对话、翻译与轻量 Agent;延迟与成本可控,便于与 Step 系列大模型组合成分层路由策略。

Function Calling↑ 32K低延迟
隐私协议|服务条款|联系我们|下载中心|加入我们

Copyright © 杭州牛哇特科技有限公司 版权所有

浙ICP备2026032910号