علیبابا، غول تجارت الکترونیک چین، پا به عرصه هوش مصنوعی گذاشته و با معرفی هوش مصنوعی Qwen 2.5 Max، غوغایی به پا کرده است. این مدل قدرتمند، رقبای سرسختی مانند GPT-4o، Claude 3.5 Sonnet و DeepSeek V3 را به چالش میکشد. اما هوش مصنوعی Qwen 2.5 Max چه ویژگیهایی دارد و چقدر قدرتمند است؟ در این مقاله از ای بازی به بررسی کامل این مدل میپردازیم.
هوش مصنوعی Qwen 2.5 Max چیست؟
هوش مصنوعی Qwen 2.5 Max، جدیدترین و پیشرفتهترین مدل هوش مصنوعی ساخته شده توسط شرکت علیبابا است. این مدل همهکاره، با هدف رقابت با برترین هوشهای مصنوعی جهان توسعه یافته است.
ویژگیهای کلیدی هوش مصنوعی Qwen 2.5 Max
- محصول علیبابا: توسط شرکت چینی علیبابا، فعال در حوزه تجارت الکترونیک، هوش مصنوعی و محاسبات ابری ساخته شده است.
- مدل بسته: برخلاف برخی مدلهای دیگر، کد و وزنهای این مدل به صورت عمومی در دسترس نیست.
- دادههای آموزشی عظیم: با ۲۰ تریلیون توکن، روی حجم بسیار زیادی از دادهها آموزش دیده است.
- رقیب GPT-4o و DeepSeek V3: رقیبی جدی برای مدلهای قدرتمند GPT-4o و DeepSeek V3 محسوب میشود.
- بدون قابلیت استدلال: مانند DeepSeek R1، نحوه رسیدن به پاسخها را نمایش نمیدهد و فقط نتیجه را ارائه میدهد.
به نظر میرسد که علیبابا در حال توسعه و پیشرفت در زمینه هوش مصنوعی است و شاید در آیندهای نزدیک، مدل استدلالی اختصاصی خود را نیز معرفی کند.

نحوه عملکرد هوش مصنوعی Qwen 2.5 Max
هوش مصنوعی Qwen 2.5 Max از روش “Mixture-of-Experts” (MoE) استفاده میکند. این تکنیک که در DeepSeek V3 نیز به کار رفته است، به مدل کمک میکند تا ضمن حفظ قدرت خود، هزینههای پردازشی را نیز کنترل کند.
Mixture-of-Experts (MoE) چیست و چرا اهمیت دارد؟
MoE را میتوان به تیمی از متخصصان تشبیه کرد. هر متخصص در زمینه خاصی تخصص دارد. وقتی سوالی پرسیده میشود، فقط متخصصی که در آن زمینه تخصص دارد، پاسخ میدهد. هوش مصنوعی Qwen 2.5 Max نیز به همین شیوه عمل میکند. به جای فعال کردن تمام پارامترها برای هر ورودی، فقط بخشهای مرتبط با آن ورودی را فعال میکند.
مزایای استفاده از MoE
- سرعت بالاتر: به دلیل فعال شدن بخشهای ضروری مدل، سرعت پردازش افزایش مییابد.
- مصرف منابع کمتر: مدل به قدرت پردازش کمتری نیاز دارد.
- رقابت با مدلهای سنگین: امکان رقابت با مدلهای قدرتمند مانند GPT-4o و Claude 3.5 Sonnet را فراهم میکند.
در مقابل، مدلهای متراکم (Dense Models) مانند GPT-4o، تمام پارامترهای خود را برای هر ورودی فعال میکنند که نیازمند قدرت پردازش بسیار بالایی است.
دادههای آموزشی و نحوه بهبود دقت هوش مصنوعی Qwen 2.5 Max
هوش مصنوعی Qwen 2.5 Max روی ۲۰ تریلیون توکن داده آموزش دیده است. این حجم عظیم از دادهها، معادل خواندن ۱۶۸ میلیون بار کتاب ۱۹۸۴ جورج اورول است! اما صرفاً داشتن دادههای زیاد، کافی نیست. علیبابا برای بهبود دقت مدل، مراحل دیگری را نیز انجام داده است:
- تنظیم دقیق با کمک انسانها (SFT): کارشناسان خبره، پاسخهای باکیفیت برای مدل فراهم کردند تا نحوه پاسخگویی بهتر و مفیدتر را بیاموزد.
- یادگیری تقویتی از بازخورد انسانی (RLHF): مدل به گونهای آموزش داده شده است که ترجیحات کاربران را در پاسخها درک کند و لحن طبیعیتر و مفیدتری داشته باشد.
عملکرد هوش مصنوعی Qwen 2.5 Max و مقایسه با رقبا
عملکرد هوش مصنوعی Qwen 2.5 Max در معیارهای مختلف چگونه است و چه جایگاهی در مقایسه با رقبا دارد؟ برای ارزیابی دقیقتر، این مدل در معیارهای استاندارد مورد آزمایش قرار گرفته است. این معیارها، دو نوع مدل را بررسی میکنند:
- مدلهای آموزشی (Instruct): برای کاربردهای واقعی مانند چت، کدنویسی و پرسش و پاسخ تنظیم شدهاند.
- مدلهای پایه (Base Models): قبل از تنظیم دقیق، فقط روی دادههای عمومی آموزش دیدهاند.
در جدول زیر، عملکرد هوش مصنوعی Qwen 2.5 Max در معیارهای مختلف و مقایسه آن با GPT-4o، Claude 3.5 Sonnet و DeepSeek V3 آمده است:
| معیار | هوش مصنوعی Qwen 2.5 Max | DeepSeek V3 | Claude 3.5 Sonnet | GPT-4o |
|---|---|---|---|---|
| Arena-Hard (ترجیح کاربران در مکالمات) | ۸۹.۴ | ۸۵.۵ | ۸۵.۲ | – |
| MMLU-Pro (دانش و استدلال) | ۷۶.۱ | ۷۵.۹ | ۷۸.۰ | ۷۷.۰ |
| GPQA-Diamond (دانش عمومی) | ۶۰.۱ | ۵۹.۱ | ۶۵.۰ | – |
| LiveCodeBench (توانایی کدنویسی) | ۳۸.۷ | ۳۷.۶ | ۳۸.۹ | – |
| LiveBench (عملکرد کلی) | ۶۲.۲ | ۶۰.۵ | ۶۰.۳ | – |
مقایسه مدلهای پایه: هوش مصنوعی Qwen 2.5 Max در برابر رقبا
در این بخش، هوش مصنوعی Qwen 2.5 Max با مدلهای پایه دیگر مانند DeepSeek V3، LLaMA 3.1-405B و Qwen 2.5-72B مقایسه میشود.
| معیار | هوش مصنوعی Qwen 2.5 Max | DeepSeek V3 | LLaMA 3.1-405B |
|---|---|---|---|
| MMLU (دانش عمومی) | ۸۷.۹ | – | – |
| C-Eval (دانش عمومی) | ۹۲.۲ | – | – |
| HumanEval (کدنویسی) | ۷۳.۲ | – | – |
| MBPP (کدنویسی) | ۸۰.۶ | – | – |
| GSM8K (ریاضی) | ۹۴.۵ | ۸۹.۳ | ۸۹.۰ |
| MATH (ریاضی) | ۶۸.۵ | – | – |
نحوه دسترسی به هوش مصنوعی Qwen 2.5 Max
برای دسترسی به هوش مصنوعی Qwen 2.5 Max، دو راه وجود دارد:
- استفاده از چت Qwen: سادهترین راه، استفاده از پلتفرم چت Qwen است. با استفاده از رابط کاربری تحت وب، میتوانید به راحتی با این مدل تعامل کنید.
- دسترسی از طریق API: برای توسعهدهندگان، امکان استفاده از API استودیوی مدل Alibaba Cloud فراهم شده است.

کلام آخر
هوش مصنوعی Qwen 2.5 Max، قویترین مدل هوش مصنوعی علیبابا تا به امروز است و با رقبای قدرتمند خود رقابت میکند. این مدل با وجود اینکه Open-Source نیست، به راحتی قابل دسترس است. با سرمایهگذاریهای عظیم علیبابا در زمینه هوش مصنوعی، انتظار میرود نسخههای جدیدتر و پیشرفتهتری از این مدل در آیندهای نزدیک معرفی شوند.




