Llama 3.2 11B Vision Instruct

META-LLAMA Developer Architecture Profile

Intelligence (ELO)1422Chatbot Arena Verified

Max Context131,072Tokens

API Cost / 1M$0.69Blended Prompt + Completion

Model Capabilities

Classification
Conversational
Vision
Coding & Logic
Fictional

Llama 3.2 11B Vision is a multimodal model with 11 billion parameters, designed to handle tasks combining visual and textual data. It excels in tasks such as image captioning and...

Granular Pricing Matrix

Input Tokens (Prompt)$0.34 / 1M

Output Tokens (Completion)$0.34 / 1M

Pricing data via OpenRouter. Sync: 6/14/2026

Evaluate Competitors

VS Engine MatchupLlama 3.2 11B Vision Instruct vs Qwen: Qwen3.7 Plus VS Engine MatchupLlama 3.2 11B Vision Instruct vs Qwen: Qwen3.6 Plus VS Engine MatchupLlama 3.2 11B Vision Instruct vs Qwen: Qwen3 Coder Next VS Engine MatchupLlama 3.2 11B Vision Instruct vs ByteDance Seed: Seed 1.6 Flash VS Engine MatchupLlama 3.2 11B Vision Instruct vs Switchpoint Router VS Engine MatchupLlama 3.2 11B Vision Instruct vs Amazon: Nova Lite 1.0