AI Perks

AI Perks دسترسی به تخفیف‌ها، اعتبارات و پیشنهادات ویژه ابزارهای هوش مصنوعی، خدمات ابری و API‌ها را فراهم می‌کند تا به استارتاپ‌ها و توسعه‌دهندگان در صرفه‌جویی کمک کند.

همه AI Perks را ببینید

مدل‌های هوش مصنوعی متن‌باز در سال ۲۰۲۶ به GPT-5 و Claude رسیدند

تا آوریل ۲۰۲۶، شش خانواده مدل متن‌باز، مدل‌های با وزن باز رقابتی عرضه می‌کنند که در بارهای کاری عملی با جایگزین‌های بسته قابل رقابت هستند یا از آن‌ها فراتر می‌روند. DeepSeek V4 معیارهای خام را رهبری می‌کند (۸۳.۷٪ تأیید شده SWE-bench، ۹۹.۴٪ AIME 2026). Qwen 3.6 وزنی بیش از کلاس خود می‌کوبد. Llama 4 طیف وسیعی از مقیاس‌های کوچک تا پیشرفته را پوشش می‌دهد. شکاف "باز در مقابل بسته" به سرعت در حال کاهش است.

نکته: بهترین مدل‌های متن‌باز عظیم هستند. DeepSeek V4 با حدود ۱ تریلیون پارامتر به چندین GPU H100 برای میزبانی خود نیاز دارد. Qwen 3.6-35B-A3B تنها مدل پیشرفته باز است که روی یک GPU مصرفی اجرا می‌شود. انتخاب مدل اشتباه به معنای پرداخت هزینه‌های بالای API یا دست و پنجه نرم کردن با زیرساخت است.

این راهنما برترین مدل‌های هوش مصنوعی متن‌باز را در سال ۲۰۲۶ بر اساس قابلیت، نیازمندی‌های سخت‌افزاری و هزینه واقعی رتبه‌بندی می‌کند. به علاوه، نحوه میزبانی مقرون به صرفه آنها با استفاده از اعتبارات رایگان AWS / Google / Together AI به ارزش ۵,۰۰۰ تا ۲۰۰,۰۰۰+ دلار از طریق AI Perks.

بودجه خود را در اعتبارات AI صرفه‌جویی کنید

جستجوی پیشنهادات برای

OpenAI,

Anthropic,

Lovable,

Notion

جستجوی پیشنهادات برای

OpenAI,

Anthropic,

Lovable,

Notion

Software	اعتبارات تقریبی	شرایط	شاخص تأیید	اقدامات

SaaS خود را تبلیغ کنید

به بیش از ۹۰٬۰۰۰ بنیان‌گذار جهانی که به دنبال ابزاری مانند ابزار شما هستند برسید

اکنون درخواست دهید

لیست رده‌بندی مدل‌های هوش مصنوعی متن‌باز ۲۰۲۶

رده	مدل	اندازه	بهترین کاربرد	هزینه میزبانی خود
S-Tier	DeepSeek V4	~۱T پارامتر	استدلال پیشرفته + کدنویسی	۵ تا ۱۵ دلار در ساعت (چند H100)
S-Tier	Qwen 3.6 235B	۲۳۵B (MoE، ۲۲B فعال)	پیشرفته عمومی	۲ تا ۵ دلار در ساعت (تک H100)
A-Tier	Llama 4 Maverick	۴۰۰B	قوی عمومی	۳ تا ۸ دلار در ساعت
A-Tier	Llama 4 Scout	۱۰۹B (MoE، ۱۷B فعال)	پنجره زمینه ۱۰M	۱ تا ۳ دلار در ساعت
A-Tier	Qwen 3.6-35B-A3B	۳۵B (MoE، ۳B فعال)	پیشرفته تک GPU	۰.۵۰ تا ۱.۵۰ دلار در ساعت
A-Tier	GLM-5.1	۱۰۰B+	برتری زبان چینی	۱ تا ۳ دلار در ساعت
B-Tier	Gemma 4-26B-A4B	۲۶B	GPU مصرفی ارزان	۰.۳۰ تا ۰.۸۰ دلار در ساعت
B-Tier	Mistral Small 4	۲۲B	مجوز دوستانه اتحادیه اروپا	۰.۳۰ تا ۰.۸۰ دلار در ساعت
B-Tier	Llama 4 8B	۸B	استقرار در لبه	CPU محلی ممکن است

AI Perks

همه AI Perks را ببینید

S-Tier: DeepSeek V4

DeepSeek V4 مدل متن‌باز رقابتی در سطح پیشرفته در سال ۲۰۲۶ است. منتشر شده در اوایل سال ۲۰۲۶، در کدنویسی (۸۳.۷٪ SWE-bench Verified، ۹۰٪ HumanEval) و استدلال (۹۹.۴٪ AIME 2026، ۹۲.۸٪ MMLU-Pro) پیشرو است.

نقاط قوت DeepSeek V4

بهترین GPT-4.1 و Claude Sonnet در معیارهای مختلف
پنجره زمینه ۱M با حافظه Engram
جامعه تحقیقاتی فعال
مجوز سهل‌گیرانه برای استفاده تجاری
قابلیت‌های عامل قوی (نزدیک به GPT-5.5)

نیازمندی‌های سخت‌افزاری DeepSeek V4

کوانتیزاسیون	تنظیمات GPU	هزینه ساعتی (ابری)
FP16	۸x H100 80GB	۲۵ تا ۴۰ دلار در ساعت
INT8	۴x H100 80GB	۱۲ تا ۲۰ دلار در ساعت
INT4	۲x H100 80GB	۶ تا ۱۰ دلار در ساعت
میزبانی شده (Together AI، Fireworks)	API	۰.۲۷ تا ۲.۲۰ دلار در هر ۱ میلیون توکن

میزبانی خود DeepSeek V4 با کیفیت پیشرفته هزینه‌ای بین ۶ تا ۴۰ دلار در ساعت دارد. APIهای میزبانی شده (Together AI، Fireworks، DeepSeek Direct) برای بارهای کاری متغیر به طور چشمگیری ارزان‌تر هستند.

چه زمانی از DeepSeek V4 استفاده کنیم

استدلال پیشرفته با هزینه API کمتر از Claude/GPT
جریان‌های کاری با حجم بالای کدنویسی
نیاز به مجوز متن‌باز سهل‌گیرانه
حساس به حریم خصوصی (امکان میزبانی خود)

S-Tier: Qwen 3.6-235B

Qwen 3.6-235B مدل پیشرفته Alibaba با معماری MoE (۲۲B پارامتر فعال) است. استدلال قوی در زبان‌های مختلف، با عملکرد چشمگیر به ازای هر پارامتر فعال.

نقاط قوت Qwen 3.6-235B

۲۲B پارامتر فعال (استنتاج ارزان‌تر از DeepSeek V4)
عالی چندزبانه (به ویژه چینی، انگلیسی، کد)
مجوز Apache 2.0
پشتیبانی بالغ از فراخوانی ابزار
قوی در AIME 2026 (۹۲.۷٪) و GPQA (۸۶٪)

سخت‌افزار Qwen 3.6 (235B)

کوانتیزاسیون	تنظیمات GPU
FP16	۴x H100 80GB
INT8	۲x H100 80GB
INT4	۱x H100 80GB

معماری MoE به این معنی است که تنها ۲۲B پارامتر در هر توکن فعال می‌شوند، که استنتاج را به طور چشمگیری ارزان‌تر از مدل‌های متراکم ۲۳۵B می‌کند.

A-Tier: Qwen 3.6-35B-A3B (پیشرفته تک GPU)

Qwen 3.6-35B-A3B تنها مدل پیشرفته قابل رقابت متن‌باز است که با کوانتیزاسیون روی یک GPU مصرفی اجرا می‌شود. ۳۵B پارامتر، ۳B فعال در هر توکن.

چرا این مهم است

معیار	Qwen 3.6-35B-A3B
SWE-bench Verified	۷۳.۴٪
GPQA Diamond	۸۶.۰٪
AIME 2026	۹۲.۷٪
MMLU-Pro	۸۷٪

این اعداد با GPT-4.1 و Claude Sonnet 4.6 رقابت می‌کنند - روی مدلی که در یک GPU A10G (۱.۲۱ دلار در ساعت در AWS) جا می‌شود.

هزینه میزبانی خود

AWS g5.2xlarge (1x A10G 24GB): ۱.۲۱ دلار در ساعت = ~۸۷۰ دلار در ماه برای ۲۴/۷
کوانتیزه شده به INT4: ۱۶GB VRAM مورد نیاز است (در A10G جا می‌شود)

برای یک استارتاپ که استنتاج مداوم را اجرا می‌کند، یک A10G واحد با قیمت ۱.۲۱ دلار در ساعت، کیفیت Claude Sonnet را با کسری از هزینه‌های API مطابقت می‌دهد.

A-Tier: خانواده Llama 4

Llama 4 چندین اندازه را پوشش می‌دهد - Scout (۱۰۹B/۱۷B فعال)، Maverick (۴۰۰B) و انواع کوچکتر. رویکرد خانواده گسترده Meta Llama 4 را به متنوع‌ترین گزینه متن‌باز تبدیل می‌کند.

Llama 4 Scout: پنجره زمینه ۱۰M

ویژگی برجسته Llama 4 Scout: پنجره زمینه ۱۰ میلیون توکن. این برای مدل‌های متن‌باز بی‌سابقه است. برای وظایفی که به پایگاه‌های کد کامل یا پردازش اسناد عظیم نیاز دارند، Scout بی‌رقیب است.

Llama 4 Maverick: پیشرفته عمومی

۴۰۰B پارامتر که بارهای کاری عمومی را پوشش می‌دهد. در اکثر معیارها با GPT-4.1 رقابت می‌کند اما در کدنویسی/استدلال از DeepSeek V4 و Qwen 3.6-235B عقب است.

چه زمانی از Llama 4 استفاده کنیم

نیاز به پنجره زمینه ۱۰M (Scout)
اکوسیستم و ابزارهای Meta را می‌خواهید
با خانواده Llama از نسخه‌های قبلی آشنا هستید
استقرار چند ابری (AWS، GCP، Azure همه از Llama پشتیبانی می‌کنند)

میزبانی شده در مقابل میزبانی خود: تصمیم واقعی

برای اکثر تیم‌ها، دسترسی API میزبانی شده به مدل‌های متن‌باز ارزان‌تر از میزبانی خود است مگر اینکه توان عملیاتی ثابت بسیار بالایی داشته باشید.

قیمت‌گذاری میزبانی شده (آوریل ۲۰۲۶)

ارائه‌دهنده	مدل‌ها	قیمت‌گذاری
Together AI	Llama 4, Qwen 3, DeepSeek V4	۰.۲۷ تا ۲.۲۰ دلار در هر ۱ میلیون توکن
Fireworks AI	Llama 4, Qwen 3, DeepSeek	۰.۲۰ تا ۲.۰۰ دلار در هر ۱ میلیون توکن
DeepInfra	چند مدل	۰.۱۰ تا ۱.۵۰ دلار در هر ۱ میلیون توکن
Replicate	چند مدل	قیمت‌گذاری در ثانیه
fal.ai	چند مدل	قیمت‌گذاری در ثانیه

برای بارهای کاری کمتر از ~۵۰ میلیون توکن در ماه، API میزبانی شده ارزان‌تر است. بالاتر از آن، میزبانی خود اقتصادی‌تر می‌شود (با فرض داشتن ظرفیت مهندسی).

چه زمانی مدل‌های متن‌باز Claude/GPT را شکست می‌دهند

مورد استفاده	مدل‌های متن‌باز برنده می‌شوند	چرا
حساس به هزینه در مقیاس	DeepSeek V4 / Qwen 3.6	۵ تا ۱۰ برابر ارزان‌تر از Claude Opus
حداکثر زمینه (>۱M توکن)	Llama 4 Scout	پنجره ۱۰M توکن
حریم خصوصی / محل نگهداری داده‌ها	هر مدل خود میزبانی شده	هیچ داده‌ای زیرساخت شما را ترک نمی‌کند
سفارشی‌سازی / تنظیم دقیق	Llama 4 / Qwen 3.6	وزن‌های باز برای SFT، LoRA
استقرار در لبه	Llama 4 8B / Gemma 4	روی سخت‌افزار مصرفی اجرا می‌شود
استدلال پیشرفته با هزینه کم	DeepSeek V4	GPT-4.1 را شکست می‌دهد، ارزان‌تر

چه زمانی مدل‌های بسته همچنان برنده می‌شوند

بهترین اکوسیستم عامل (Claude Code، Codex Skills)
چندوجهی صیقل خورده (GPT-5.5 متن/تصویر/صوت/ویدئو را یکپارچه می‌کند)
کدنویسی پیشرفته (Claude Opus 4.7، GPT-5.5)
ساده‌ترین تجربه توسعه‌دهنده (بدون زیرساخت)
بالاترین تحقیقات ایمنی و تفسیرپذیری (Claude)

برای اکثر سازندگان، استفاده از هر دو پاسخ درستی است - مدل‌های بسته برای کارهای حساس و رو به مشتری؛ متن‌باز برای استنتاج ارزان با حجم بالا.

چگونه اعتبارات رایگان میزبانی مدل‌های متن‌باز را قدرت می‌بخشند

منبع اعتبار	اعتبارات موجود	قدرت می‌بخشد
AWS Activate	۱,۰۰۰ تا ۱۰۰,۰۰۰ دلار	GPUهای EC2 (H100، A100، A10G)
Google Cloud	۱,۰۰۰ تا ۲۵,۰۰۰ دلار	GPUهای GCE + میزبانی Vertex
Together AI Startup Program	۱۵,۰۰۰ تا ۵۰,۰۰۰ دلار	میزبانی Llama 4، Qwen، DeepSeek
Microsoft Founders Hub	۵۰۰ تا ۱,۰۰۰ دلار	GPUهای Azure + Azure ML
Replicate / fal.ai ثبت نام	متغیر	API چند مدل

مجموع پتانسیل: ۱۷,۵۰۰ تا ۱۷۶,۰۰۰+ دلار اعتبار رایگان برای میزبانی مدل‌های متن‌باز.

یک استارتاپ با ۵۰,۰۰۰ دلار اعتبار انباشته می‌تواند چندین نمونه Qwen 3.6-235B را ۲۴/۷ به مدت ۶+ ماه اجرا کند بدون اینکه یک دلار هزینه کند.

گام به گام: استقرار هوش مصنوعی متن‌باز با اعتبارات رایگان

گام ۱: دریافت اعتبارات رایگان

در AI Perks ثبت نام کنید و برای AWS Activate، Google Cloud، Together AI Startup Program و Microsoft Founders Hub اقدام کنید.

گام ۲: رویکرد میزبانی خود را انتخاب کنید

API میزبانی شده (ساده‌ترین): Together AI، Fireworks، DeepInfra
GPU ابری (انعطاف‌پذیر): AWS EC2، GCP GCE، Azure VMs
Kubernetes خود مدیریت شده (پیشرفته): سرورهای استنتاج خود را اجرا کنید

گام ۳: مدل خود را انتخاب کنید

معیارهای پیشرفته: DeepSeek V4
پیشرفته تک GPU: Qwen 3.6-35B-A3B
زمینه طولانی: Llama 4 Scout (پنجره ۱۰M)
چند منظوره: Qwen 3.6-235B
لبه / موبایل: Llama 4 8B / Gemma 4

گام ۴: استنتاج را راه‌اندازی کنید

از vLLM، TGI یا SGLang برای سرویس‌دهی با توان عملیاتی بالا استفاده کنید. یا از یک API میزبانی شده استفاده کنید و زیرساخت را به طور کامل حذف کنید.

گام ۵: بهینه‌سازی کنید

برای میزبانی ارزان‌تر به INT8 یا INT4 کوانتیزه کنید. در صورت امکان از کش پرامپت استفاده کنید. مصرف توکن را نظارت کنید.

گام ۶: با مدل‌های بسته ترکیب کنید

از مدل‌های بسته (Claude، GPT-5.5) برای کارهای حساس رو به مشتری استفاده کنید. از متن‌باز برای پردازش داخلی/دسته‌ای با حجم بالا استفاده کنید. مسیریابی هوشمند هزینه‌های کلی را ۷۰ تا ۹۰ درصد کاهش می‌دهد.

سوالات متداول

بهترین مدل هوش مصنوعی متن‌باز در سال ۲۰۲۶ چیست؟

DeepSeek V4 معیارهای خام را رهبری می‌کند (۸۳.۷٪ SWE-bench، ۹۹.۴٪ AIME). Qwen 3.6-235B با هزینه محاسباتی کمتر رقابتی است. Qwen 3.6-35B-A3B بهترین گزینه تک GPU است. Llama 4 Scout دارای پنجره زمینه ۱۰M است. "بهترین" به سخت‌افزار و بار کاری شما بستگی دارد. اعتبارات رایگان از طریق AI Perks به شما امکان آزمایش همه آنها را می‌دهد.

آیا مدل‌های متن‌باز می‌توانند با GPT-5.5 و Claude Opus 4.7 رقابت کنند؟

در بسیاری از معیارها، بله. DeepSeek V4 در کدنویسی و استدلال GPT-4.1 را شکست می‌دهد. Qwen 3.6 با Claude Sonnet 4.6 در کارهای عمومی مطابقت دارد. مدل‌های بسته همچنان در بلوغ اکوسیستم عامل (Claude Code، Codex)، چندوجهی (GPT-5.5) و تجربه توسعه‌دهنده پیشرو هستند. از هر دو استفاده کنید - بسیاری از سازندگان این کار را می‌کنند.

آیا Llama 4 برای استفاده تجاری رایگان است؟

بله، Llama 4 تحت مجوز سهل‌گیرانه Meta برای استفاده تجاری مجوز دارد. میزبانی خود و از طریق ارائه‌دهندگان ابری (AWS Bedrock، GCP Vertex و غیره) مجاز است. محدودیت‌هایی برای شرکت‌های بسیار بزرگ (۷۰۰ میلیون+ MAU) اعمال می‌شود. اکثر استارتاپ‌ها حقوق تجاری کامل دارند.

میزبانی خود DeepSeek V4 چقدر هزینه دارد؟

میزبانی خود DeepSeek V4 در FP16 به ۸ GPU H100 با هزینه ۲۵ تا ۴۰ دلار در ساعت نیاز دارد. کوانتیزاسیون INT4 این مقدار را به ۲ GPU H100 با هزینه ۶ تا ۱۰ دلار در ساعت کاهش می‌دهد. برای اکثر بارهای کاری، APIهای میزبانی شده (Together AI، Fireworks) با قیمت ۰.۲۷ تا ۲.۲۰ دلار در هر ۱ میلیون توکن ارزان‌تر از میزبانی خود هستند. اعتبارات رایگان از طریق AI Perks هر دو مسیر را پوشش می‌دهند.

آیا می‌توانم هوش مصنوعی متن‌باز را روی یک GPU اجرا کنم؟

بله - Qwen 3.6-35B-A3B با کوانتیزاسیون INT4 روی یک A10G (۲۴GB VRAM) اجرا می‌شود. Gemma 4-26B و Mistral Small 4 نیز روی GPUهای مصرفی واحد جا می‌شوند. AWS g5.2xlarge (۱.۲۱ دلار در ساعت) کافی است. با اعتبارات AWS Activate از طریق AI Perks، این کار رایگان است.

آیا باید یک مدل متن‌باز را تنظیم دقیق کنم؟

اگر یک وظیفه دامنه خاص و بیش از ۱۰,۰۰۰ مثال با کیفیت بالا دارید، تنظیم دقیق کنید. در غیر این صورت، مهندسی پرامپت روی یک مدل پایه قوی (DeepSeek V4، Qwen 3.6) اغلب از تنظیم دقیق یک مدل کوچکتر بهتر است. هزینه تنظیم دقیق بسته به اندازه مدل بین ۵۰ تا ۵,۰۰۰ دلار زمان GPU است.

ارزان‌ترین API هوش مصنوعی متن‌باز میزبانی شده چیست؟

Together AI، Fireworks و DeepInfra همگی با قیمت ۰.۲۰ تا ۲.۲۰ دلار در هر ۱ میلیون توکن برای برترین مدل‌های متن‌باز رقابت می‌کنند. DeepInfra اغلب از نظر قیمت خالص برنده می‌شود. Together AI قوی‌ترین برنامه اعتبارات استارتاپی را دارد (۱۵ هزار تا ۵۰ هزار دلار از طریق AI Perks). چندین ارائه‌دهنده را تست کنید - اعتبارات رایگان آن را بدون هزینه می‌سازد.

هوش مصنوعی متن‌باز را با کیفیت پیشرفته، با هزینه صفر اجرا کنید

چشم‌انداز هوش مصنوعی متن‌باز در سال ۲۰۲۶ قوی‌ترین حالت خود تا به امروز است. DeepSeek V4 در چندین معیار GPT-4.1 را شکست می‌دهد. Qwen 3.6 با Claude Sonnet مطابقت دارد. Llama 4 کل طیف مقیاس را پوشش می‌دهد. AI Perks تضمین می‌کند که می‌توانید همه آنها را بدون پرداخت هزینه میزبانی اجرا کنید:

۱,۰۰۰ تا ۱۰۰,۰۰۰+ دلار AWS Activate (میزبانی GPU)
۱,۰۰۰ تا ۲۵,۰۰۰+ دلار Google Cloud (میزبانی Vertex AI)
۱۵,۰۰۰ تا ۵۰,۰۰۰+ دلار اعتبار Together AI (API میزبانی شده)
۲۰۰+ مزیت اضافی استارتاپی

در getaiperks.com ثبت نام کنید →

هوش مصنوعی متن‌باز در سال ۲۰۲۶ با مدل‌های بسته رقابت می‌کند. آن را رایگان در getaiperks.com اجرا کنید.