Model Catalog

One API for all models. Search our library, deploy and run inference on NVIDIA GPUs in seconds

Unlock $1 free API credit on first deposit of $5 - generate up to ~4M tokens

Model	Category	Context	Provider	Parameters	Price(/1M tokens)	Action
Qwen3.7 Max	Chat	128K Tokens	Alibaba (Cloud)	Undisclosed	Input: $2.50 Output: $7.50	Get API key
Claude Opus 4.7	Vision	Up to 1M Tokens	Anthropic		Input: $6.50 Output: $32.50	Get API key
Nemotron 3 Nano Omni	Chat	300K Tokens	NVIDIA	Undisclosed	Input: $0.06 Output: $0.24	Get API key
Kimi K2.6	Vision	256K Tokens	Moonshot AI	1T (32B active)	Input: $0.89 Output: $3.71	Get API key
NVIDIA Nemotron 3 Super 120B A12B	Chat	256K Tokens (up to 1M)	NVIDIA	120B (12B active)	Input: $0.10 Output: $0.50	Get API key
DeepSeek V4 Flash	Chat	393,216 Tokens	DeepSeek	V4 family	Input: $0.14 Output: $0.28	Get API key
GLM 5	Chat	200K Tokens	Z.ai (Zhipu AI)	744B (40B active)	Input: $0.80 Output: $3.13	Get API key
MiniMax M2.5	Chat	200K Tokens	MiniMax	230B (10B active)	Input: $0.30 Output: $1.20	Get API key
Kimi K2.5	Vision	256K Tokens	Moonshot AI	1T (32B active)	Input: $0.60 Output: $3.00	Get API key
Qwen3 Coder Plus	Code	Up to 1M Tokens	Alibaba (Cloud)		Input: $0.10 Output: $5.00	Get API key
Claude Opus 4.6	Vision	Up to 1M Tokens	Anthropic		Input: $6.50 Output: $32.50	Get API key
GPT 5.4	Vision	1,050,000 Tokens	OpenAI		Input: $5.00 Output: $22.00	Get API key
Gemini 3.1 Pro Preview	Vision	Up to 1M Tokens	Google		Input: $2.00 Output: $12.00	Get API key
Qwen3.6 Plus	Vision	Up to 256K tokens / 10 images	Alibaba (Cloud)	Undisclosed (frontier-scale)	Input: $0.50 Output: $3.00	Get API key
Qwen3.6 Max Preview	Chat	128K Tokens	Alibaba (Cloud)	Undisclosed	Input: $1.30 Output: $7.80	Get API key
Kimi K2 Thinking	Chat	256K Tokens	Moonshot AI	1T (32B active)	Input: $0.60 Output: $2.50	Get API key
Qwen3.5 Flash	Vision	1M Tokens (API) / 256K Tokens (self-hosted base)	Alibaba (Cloud)	35B (3B active) — hosted	Input: $0.10 Output: $0.40	Get API key
Qwen3.5 27B	Vision	256K Tokens (up to 1M)	Alibaba (Cloud)	27B (dense)	Input: $0.30 Output: $2.40	Get API key
Qwen3.5 35B A3B	Vision	256K Tokens (up to 1M)	Alibaba (Cloud)	35B (3B active)	Input: $0.25 Output: $2.00	Get API key
Qwen3.5 122B A10B	Vision	256K Tokens (up to 1M)	Alibaba (Cloud)	122B (10B active)	Input: $0.40 Output: $3.20	Get API key
Qwen3.6 27B	Vision	256K Tokens (up to 1M)	Alibaba (Cloud)	27B	Input: $0.60 Output: $3.60	Get API key
Qwen3.6 35B A3B	Vision	256K Tokens (up to 1M)	Alibaba (Cloud)	35B (A3B active)	Input: $0.25 Output: $1.49	Get API key
DeepSeek V3.2	Chat	128K Tokens	DeepSeek	685B	Input: $0.56 Output: $1.68	Get API key
DeepSeek R1 0528	Chat	128K Tokens	DeepSeek	671B (37B active)	Input: $0.90 Output: $3.20	Get API key
Qwen3 Max	Chat	128K Tokens	Alibaba (Cloud)	235B (22B active)	Input: $1.20 Output: $6.00	Get API key
Qwen3 VL 235B A22B Thinking	Vision	256K Tokens (up to 1M)	Alibaba (Cloud)	235B (22B active)	Input: $0.40 Output: $4.00	Get API key
Qwen3 Coder 480B A35B Instruct	Code	256K Tokens	Alibaba (Cloud)	480B (35B active)	Input: $1.50 Output: $7.50	Get API key
Qwen3 Next 80B A3B Thinking	Chat	256K Tokens	Alibaba (Cloud)	80B (3.9B active)	Input: $0.20 Output: $1.80	Get API key
NVIDIA Nemotron 3 Nano 30B A3B BF16	Chat	262k Tokens	NVIDIA	31.6B Total / 3.2B Active	Input: $0.04 Output: $0.22	Get API key
Llama 3.3 70B Instruct	Chat	128K Tokens	Meta	70B	Input: $0.27 Output: $0.85	Get API key
HunyuanOCR	OCR	16K Tokens	Tencent Hunyuan	1.0B	Input: $0.21 Output: $0.35	Get API key
DeepSeek R1 Distill Llama 70B	Chat	64k Tokens	DeepSeek	70B	Input: $1.20 Output: $1.80	Get API key
Fara 7B	Chat	8192 Tokens	Microsoft	7B	Input: $0.21 Output: $0.25	Get API key
Qwen3 Coder 30B A3B Instruct	Code	N/A	Alibaba (Cloud)	1.1B	Input: $0.79 Output: $0.79	Get API key
GPT OSS 120B	Chat	256k Tokens	OpenAI	121.7B	Input: $0.15 Output: $0.61	Get API key
Qwen3 Coder Next	Code	262K Tokens	Alibaba (Cloud)	79.7B (3B active)	Input: $0.30 Output: $1.50	Get API key
Mistral 7B Instruct V0.3	Chat	32K Tokens	MistralAI	7.3B	Input: $0.21 Output: $0.25	Get API key
Qwen3 VL 8B Instruct	Vision	32K Tokens	Alibaba (Cloud)	9B	Input: $0.25 Output: $0.44	Get API key
Qwen3 Coder Flash	Code	Up to 1M Tokens	Alibaba (Cloud)		Input: $0.30 Output: $5.00	Get API key
Qwen3 Plus	Chat	Up to 1M Tokens	Alibaba (Cloud)		Input: $0.40 Output: $1.20	Get API key
Qwen3 VL 235B A22B Instruct	Vision	Up to 128K Tokens	Alibaba (Cloud)	235B	Input: $0.40 Output: $1.60	Get API key
Qwen3 VL Flash	Vision	Up to 256K Tokens	Alibaba (Cloud)		Input: $0.05 Output: $0.40	Get API key
Qwen3 VL Plus	Vision	Up to 256K Tokens	Alibaba (Cloud)		Input: $0.20 Output: $1.60	Get API key
Qwen3 VL 30B A3B Instruct	Vision	128K Tokens	Alibaba (Cloud)	30B	Input: $1.15 Output: $1.17	Get API key
DeepSeek V3	Chat	128K Tokens	DeepSeek	671B (37B active)	Input: $0.30 Output: $1.30	Get API key
DeepSeek V4 Pro	Chat	393,216 Tokens	DeepSeek	V4 family	Input: $1.74 Output: $3.48	Get API key
Qwen3.5 Plus	Vision	1M Tokens (API) / 262K Tokens (self-hosted base)	Alibaba (Cloud)	397B (17B active) — hosted	Input: $0.40 Output: $2.40	Get API key
GLM 4.7	Chat	205K Tokens	Z.ai (Zhipu AI)	355B (32B active)	Input: $0.60 Output: $2.20	Get API key
Kimi K2 Instruct	Chat	256K Tokens	Moonshot AI	1T (32B active)	Input: $0.50 Output: $2.40	Get API key
Gemini 3 Flash Preview	Vision	Up to 1M Tokens	Google		Input: $0.50 Output: $3.00	Get API key
Gemini 2.5 Pro	Vision	Up to 1M Tokens	Google		Input: $1.25 Output: $10.00	Get API key
Gemini 2.5 Flash	Vision	Up to 1M Tokens	Google		Input: $0.15 Output: $0.25	Get API key
Claude Opus 4.5	Vision	Up to 200K Tokens	Anthropic		Input: $6.50 Output: $32.50	Get API key
Claude Sonnet 4.6	Vision	Up to 1M Tokens	Anthropic		Input: $3.90 Output: $19.50	Get API key
Claude Sonnet 4.5	Vision	Up to 200K Tokens (1M via beta header `context-1m-2025-08-07`)	Anthropic		Input: $3.90 Output: $19.50	Get API key
Claude Haiku 4 5.20251001	Vision	Up to 200K Tokens	Anthropic		Input: $1.30 Output: $6.50	Get API key
GPT 4O	Vision	128K Tokens	OpenAI		Input: $2.50 Output: $10.00	Get API key
GPT 4O Mini	Vision	128K Tokens	OpenAI		Input: $0.40 Output: $1.60	Get API key
GPT 4.1	Vision	1,047,576 Tokens	OpenAI		Input: $2.00 Output: $8.00	Get API key
GPT 5.4 Mini	Vision	400K Tokens	OpenAI		Input: $1.50 Output: $6.00	Get API key
GPT 5.4 Nano	Vision	400K Tokens	OpenAI		Input: $0.20 Output: $1.25	Get API key

Showing 0 of 0 models

Page size

Sign up to get $1.00 free API credit on first deposit of $5. Test out the latest models now.

Access enterprise-grade open-source AI models including Llama 3, DeepSeek, Qwen, and more via our high-performance serverless API. Experience low-latency inference on the latest NVIDIA GPUs optimized for production workloads.

Get API Key

"Qubrid helped us turn a collection of AI scripts into structured production workflows. We now have better reliability, visibility, and control over every run."

AI Infrastructure Team

Automation & Orchestration