علی بابا Qwen3 را عرضه کرد: AI هیبریدی رقیب GPT/Gemini
علی بابا از خانواده مدل های AI جدید Qwen3 (تا ۲۳۵B پارامتر) با استدلال هیبریدی و قیمت پایین رونمایی کرد! مقایسه با GPT/Gemini در های ورت!

اژدهای چینی در رقابت هوش مصنوعی؛ علیبابا و نسل جدید Qwen
رقابت نفسگیر در دنیای هوش مصنوعی (AI) هر روز داغتر میشود. در حالی که نامهایی مانند OpenAI (خالق ChatGPT) و گوگل (با مدل Gemini) بر سر زبانها افتادهاند، غولهای فناوری از دیگر نقاط جهان نیز بیکار ننشستهاند و با سرعت در حال توسعه مدلهای زبانی بزرگ (LLM) و ابزارهای هوش مصنوعی پیشرفته خود هستند. در این میان، علیبابا (Alibaba)، غول تجارت الکترونیک و فناوری چین، با یک حرکت بزرگ و استراتژیک، از نسل جدید مدلهای هوش مصنوعی خود با نام Qwen3 رونمایی کرده است.
این خانواده جدید از مدلهای AI که علیبابا ادعا میکند قادر به رقابت و حتی در مواردی پیشی گرفتن از بهترین مدلهای گوگل و OpenAI است، با ویژگیهای نوآورانهای مانند استدلال "هیبریدی" و معماری "ترکیبی از متخصصان" (MoE)، توجه بسیاری را به خود جلب کرده است. علاوه بر این، علیبابا با متنباز (Open Source) کردن بسیاری از این مدلها و عرضه آنها با قیمتهای بسیار رقابتی (در صورت استفاده از API)، قصد دارد فشار را بر رقبای غربی افزایش داده و سهم بیشتری از بازار جهانی و به خصوص بازار پررونق چین را به دست آورد.
اما Qwen3 دقیقاً چیست؟ قابلیت "استدلال هیبریدی" آن چه معنایی دارد؟ عملکرد آن در مقایسه با مدلهای مطرح چگونه است؟ و عرضه این مدلها چه پیامدهایی برای آینده هوش مصنوعی، رقابت چین و آمریکا در این حوزه، و اکوسیستم مدلهای متنباز دارد؟ های ورت (hiwert.com) در این مقاله جامع، به بررسی عمیق خانواده مدلهای Qwen3 علیبابا، فناوریهای پشت آن، عملکرد و جایگاه آن در چشمانداز جهانی هوش مصنوعی میپردازد.
Qwen3 چیست؟ نسل جدید هوش مصنوعی چندوجهی و استدلالگر از علی بابا
Qwen (که مخفف Qianwen و به معنی "هزار سوال پرسیدن" است) نام خانواده مدلهای زبانی بزرگ توسعهیافته توسط Alibaba Cloud، بازوی رایانش ابری علیبابا است. Qwen3 جدیدترین و پیشرفتهترین نسل از این خانواده محسوب میشود که در اواخر آوریل ۲۰۲۵ معرفی شد.
ویژگیهای کلیدی این خانواده عبارتند از:
- طیف وسیعی از مدلها: Qwen3 شامل مجموعهای از مدلها با اندازههای مختلف است، از مدلهای کوچک و کارآمد با ۰.۶ میلیارد پارامتر گرفته تا مدلهای غولپیکر با ۲۳۵ میلیارد پارامتر. (پارامترها به طور تقریبی نشاندهنده پیچیدگی و توانایی حل مسئله مدل هستند و مدلهای بزرگتر معمولاً قدرتمندترند).
- دسترسی باز (عمدتاً): برخلاف بسیاری از مدلهای پیشرفته غربی که انحصاری (Proprietary) هستند، علیبابا اکثر مدلهای خانواده Qwen3 را تحت یک مجوز باز (Open License) برای دانلود و استفاده (تحقیقاتی و در برخی موارد تجاری) در پلتفرمهای محبوبی مانند Hugging Face و GitHub در دسترس قرار داده یا قرار خواهد داد. این یک حرکت استراتژیک مهم برای جذب توسعهدهندگان و ترویج استفاده از این مدلهاست.
- چندوجهی بودن (Multimodal): مدلهای Qwen3 صرفاً متنی نیستند و قابلیت درک و پردازش انواع مختلف داده مانند تصویر، صدا و ویدیو را نیز (در برخی مدلها) دارند یا به سمت آن حرکت میکنند.
معماری نوآورانه Qwen3: استدلال "هیبریدی" و "ترکیبی از متخصصان" (MoE)
یکی از جذابترین جنبههای Qwen3، معماری و قابلیتهای نوآورانه آن است:
استدلال هیبریدی: تعادل هوشمندانه بین سرعت و دقت! علیبابا مدلهای Qwen3 را "هیبریدی" مینامد. این به چه معناست؟ این مدلها قادرند به صورت پویا بین دو حالت عملکردی سوئیچ کنند:
حالت پاسخ سریع (Non-thinking mode): برای درخواستهای سادهتر که نیاز به تحلیل عمیق ندارند، مدل به سرعت پاسخ میدهد.
حالت استدلال (Thinking/Reasoning mode): برای مسائل پیچیدهتر که نیاز به تحلیل، برنامهریزی یا بررسی چند مرحلهای دارند، مدل زمان بیشتری را صرف "فکر کردن" و "استدلال" میکند. این فرآیند استدلال به مدل اجازه میدهد تا به طور موثری خودش را حقیقتسنجی (Fact-check) کند و پاسخهای دقیقتر و قابل اعتمادتری تولید نماید (مشابه قابلیتی که در مدلهایی مانند o3 OpenAI دیده میشود). البته، این حالت استدلال عمیقتر، به قیمت افزایش زمان پاسخدهی (Higher Latency) تمام میشود. نکته کلیدی این است که به گفته تیم Qwen، "ما حالتهای تفکر و عدم تفکر را به صورت یکپارچه ادغام کردهایم و به کاربران انعطافپذیری لازم برای کنترل بودجه تفکر را میدهیم." این یعنی کاربر یا توسعهدهنده میتواند بر اساس نیاز هر وظیفه، تعیین کند که مدل چقدر باید برای استدلال وقت بگذارد و بین سرعت و دقت، تعادل برقرار نماید.
-
معماری ترکیبی از متخصصان (Mixture of Experts - MoE): کارایی محاسباتی بالاتر برخی از مدلهای بزرگتر خانواده Qwen3 (مانند مدل ۲۳۵ میلیارد پارامتری) از معماری MoE استفاده میکنند. این معماری که در مدلهای پیشرفته دیگری مانند Mixtral 8x7B و برخی نسخههای Gemini گوگل نیز به کار رفته، به جای استفاده از یک مدل غولپیکر یکپارچه، وظایف ورودی را به بخشهای کوچکتر (Subtasks) تقسیم کرده و هر بخش را به مدلهای "متخصص" (Expert) کوچکتر و تخصصیتر که برای آن نوع وظیفه بهینه شدهاند، واگذار میکند. در نهایت، یک مکانیزم "دروازه" (Gating Mechanism) تصمیم میگیرد که کدام متخصصها برای پاسخ به یک درخواست خاص فعال شوند. مزیت اصلی MoE، افزایش کارایی محاسباتی است. با فعال کردن تنها بخش کوچکی از پارامترهای کل مدل برای هر درخواست، میتوان به عملکردی مشابه مدلهای بسیار بزرگتر دست یافت، اما با هزینه محاسباتی و انرژی مصرفی بسیار کمتر در زمان استنتاج (Inference).
زیربنای قدرتمند Qwen3: آموزش بر روی اقیانوسی از دادهها و پشتیبانی از ۱۱۹ زبان!
قدرت هر مدل زبانی بزرگ، به حجم و کیفیت دادههایی که با آن آموزش دیده، بستگی دارد. علیبابا ادعا میکند که مدلهای Qwen3 بر روی یک مجموعه داده عظیم با بیش از ۳۶ تریلیون توکن آموزش دیدهاند! (هر میلیون توکن تقریباً معادل ۷۵۰ هزار کلمه است).
این مجموعه داده عظیم و متنوع شامل موارد زیر بوده است:
- کتابهای درسی و متون علمی (Textbooks)
- زوجهای پرسش و پاسخ (Question-Answer Pairs)
- قطعه کدهای برنامهنویسی (Code Snippets)
- دادههای تولید شده توسط خود هوش مصنوعی (AI-generated Data)
- و منابع دیگر...
علاوه بر حجم داده، پشتیبانی از ۱۱۹ زبان مختلف نیز یکی دیگر از نقاط قوت Qwen3 است که آن را به ابزاری قدرتمند برای کاربردهای جهانی تبدیل میکند.
Qwen3 در میدان نبرد بنچمارکها: مقایسه عملکرد با غولهای جهانی
اما ادعای رقابت با بهترینهای جهان، نیاز به اثبات در بنچمارکهای استاندارد دارد. علیبابا نتایجی را منتشر کرده که نشاندهنده عملکرد قوی Qwen3 است، هرچند که به نظر نمیرسد (حداقل در تمام زمینهها) کاملاً از مدلهای پیشرفتهای مانند GPT-4 (یا نسخههای آتی مانند o3/o4) یا Gemini 2.5 Pro پیشی گرفته باشد:
-
مدل پرچمدار Qwen-3-235B-A22B: رقابتی شانه به شانه: این بزرگترین مدل خانواده Qwen3 (که احتمالاً به صورت عمومی منتشر نخواهد شد) عملکرد بسیار خوبی در بنچمارکهای مختلف نشان داده است:
- برنامهنویسی (Codeforces): توانسته است اندکی بهتر از o3-mini (نسخه کوچک مدل آتی OpenAI) و Gemini 2.5 Pro گوگل عمل کند.
- ریاضیات (AIME): در آخرین نسخه این بنچمارک چالشبرانگیز ریاضی، بهتر از o3-mini عمل کرده است.
- استدلال (BFCL): در این آزمون که توانایی مدل در "استدلال" در مورد مسائل را میسنجد، نیز برتر از o3-mini بوده است. تحلیل های ورت: این نتایج نشان میدهد که بزرگترین مدل Qwen3 یک رقیب بسیار جدی و قدرتمند در سطح جهانی است، به خصوص در زمینههای کدنویسی، ریاضی و استدلال، اگرچه ممکن است در سایر زمینهها همچنان مدلهای OpenAI یا گوگل برتری داشته باشند.
-
مدل متنباز بزرگ Qwen3-32B: قدرت در دسترس برای همه! شاید مهمتر از مدل غولپیکر ۲۳۵ میلیاردی، عملکرد مدل ۳۲ میلیارد پارامتری Qwen3 باشد که به صورت متنباز منتشر شده است. این مدل نیز عملکردی بسیار رقابتی نشان داده است:
- رقابت با مدلهای انحصاری و متن باز: این مدل با مدلهای قدرتمند دیگری مانند R1 از آزمایشگاه چینی DeepSeek رقابت میکند.
- برتری نسبت به مدلهای قدیمیتر: Qwen3-32B در چندین آزمون، از جمله بنچمارک کدنویسی LiveCodeBench، از مدل o1 شرکت OpenAI (مدل پایه اولیه ChatGPT) پیشی گرفته است. این عملکرد قوی، Qwen3-32B را به یکی از بهترین گزینههای متنباز برای توسعهدهندگان و محققانی تبدیل میکند که به دنبال مدلی قدرتمند و در عین حال قابل دسترس هستند.
-
سایر توانمندیهای برجسته: علیبابا همچنین تاکید کرده که مدل های Qwen3 در قابلیتهای مهم دیگری مانند فراخوانی ابزار (Tool-calling) (استفاده از ابزارهای خارجی)، پیروی از دستورالعملها (Instruction Following) و کپی کردن فرمتهای داده خاص نیز "عالی" عمل میکنند.
فراتر از دانلود مستقیم: دسترسی ابری و اکوسیستم در حال رشد Qwen3
علاوه بر امکان دانلود مدلهای متنباز، علیبابا دسترسی به Qwen3 را از طریق ارائهدهندگان خدمات ابری (Cloud Providers) نیز فراهم کرده است. شرکتهایی مانند Fireworks AI و Hyperbolic از جمله اولینهایی هستند که دسترسی به Qwen3 را از طریق APIهای خود ارائه میدهند.
توهین سریواستاوا (Tuhin Srivastava)، همبنیانگذار و مدیرعامل Baseten (یکی دیگر از میزبانان ابری AI)، در مصاحبه با تککرانچ (TechCrunch) میگوید: "Qwen3 یک نقطه دیگر در خط روند مدلهای متنبازی است که با سیستمهای منبعبسته مانند OpenAI همگام میشوند... این واقعیت را منعکس میکند که کسبوکارها هم در حال ساخت ابزارهای خود هستند و هم از شرکتهای مدلبسته مانند Anthropic و OpenAI خرید میکنند." های ورت نیز معتقد است که دسترسی آسان از طریق پلتفرمهای ابری، نقش مهمی در پذیرش و استفاده گستردهتر از مدلهایی مانند Qwen3 خواهد داشت.
پیامدهای استراتژیک عرضه Qwen3: تشدید رقابت جهانی و چالش برای غرب
عرضه خانواده قدرتمند و عمدتاً متنباز Qwen3 توسط علیبابا، پیامدهای مهمی در سطح جهانی دارد:
- افزایش فشار بر آزمایشگاههای آمریکایی: ظهور مدلهای بسیار توانمند و اغلب متنباز از چین (مانند Qwen و مدلهای DeepSeek)، فشار رقابتی را بر آزمایشگاههای پیشرو آمریکایی مانند OpenAI، Google DeepMind و Anthropic به شدت افزایش میدهد. این شرکتها دیگر نمیتوانند تنها بر برتری فنی خود تکیه کنند و باید با مدلهایی رقابت کنند که با سرعت در حال بهبود هستند و به صورت رایگان یا با هزینه بسیار کمتر در دسترس قرار میگیرند.
- زمینه محدودیتهای صادرات تراشه: این پیشرفتها همچنین در بستر محدودیتهای فزایندهای رخ میدهد که دولت ایالات متحده برای صادرات تراشههای پیشرفته هوش مصنوعی (مانند GPUهای انویدیا) به چین و همچنین خرید فناوریهای مرتبط از چین اعمال کرده است. هدف این محدودیتها، کند کردن سرعت پیشرفت چین در حوزه AI است. اما همانطور که سریواستاوا اشاره میکند، مدلهای پیشرفته و متنبازی مانند Qwen3 که در داخل چین توسعه یافتهاند، بدون توجه به این محدودیتها، به طور گسترده در داخل این کشور مورد استفاده قرار خواهند گرفت.
- تقویت جایگاه مدلهای متنباز: عرضه مدلهای قدرتمندی مانند Qwen3-32B تحت لیسانس باز، به تقویت اکوسیستم هوش مصنوعی متنباز (Open Source AI) کمک شایانی میکند. این امر به توسعهدهندگان و شرکتهای کوچکتر امکان میدهد تا به فناوریهای پیشرفته دسترسی داشته باشند و نوآوری کنند، بدون اینکه کاملاً به پلتفرمهای انحصاری و گرانقیمت وابسته باشند. این روند، بحث داغ بین مدلهای متنباز و متنبسته را داغتر میکند.
Qwen3، گامی بلند برای علیبابا در رقابت جهانی هوش مصنوعی | های ورت
رونمایی علیبابا از خانواده مدلهای هوش مصنوعی Qwen3، یک رویداد مهم و قابل توجه در چشمانداز جهانی هوش مصنوعی است. این مدلها با ارائه ترکیبی از عملکرد رقابتی (در برخی معیارها حتی بهتر از رقبای مطرح)، قابلیتهای نوآورانه (مانند استدلال هیبریدی و معماری MoE)، پشتیبانی گسترده زبانی، دسترسی عمدتاً متنباز و قیمتگذاری تهاجمی برای استفاده از API، نشاندهنده بلوغ و قدرت رو به رشد اکوسیستم هوش مصنوعی چین و به طور خاص، شرکت علیبابا هستند.
Qwen3 نه تنها فشار رقابتی را بر غولهای آمریکایی افزایش میدهد، بلکه با ارائه گزینههای قدرتمند و مقرونبهصرفه، به توانمندسازی توسعهدهندگان و تسریع پذیرش AI در صنایع مختلف، به خصوص در چین و بازارهای نوظهور، کمک خواهد کرد.