مدل هوش مصنوعی ERNIE 5 بایدو با عملکردی فراتر از GPT-5 و Gemini 2.5 در بنچمارکهای اسناد، نمودارها و OCR معرفی شد. یک مدل همهوجهی قدرتمند برای متن، تصویر، صدا و ویدیو. با ایبازی همراه باشید.
مدل هوش مصنوعی ERNIE 5 بایدو؛ رقیب تازه و قدرتمند GPT-5 و Gemini
شرکت بایدو تنها یک روز پس از معرفی GPT-5.1 توسط OpenAI، از مدل هوش مصنوعی ERNIE 5 بایدو رونمایی کرد؛ مدلی همهوجهی که توانایی پردازش و تولید همزمان محتوا در چهار بُعد متن، تصویر، صدا و ویدیو را دارد. این مدل جدید برخلاف نسخهی قبلی یعنی ERNIE-4.5-VL که بهصورت متنباز ارائه شده بود، انحصاری است و فقط از طریق سرویس ERNIE Bot و پلتفرم ابری Qianfan در دسترس قرار خواهد گرفت. نسخهای دیگر با نام ERNIE 5.0 Preview 1022 نیز معرفی شده که بهطور ویژه برای پردازشهای سنگین متنی بهینه شده است.
رقابت مستقیم ERNIE 5 با GPT-5 و Gemini
براساس بنچمارکهای منتشرشده توسط بایدو، مدل هوش مصنوعی ERNIE 5 بایدو در بسیاری از وظایف کلیدی عملکردی برابر یا حتی بهتر از GPT-5-High و Gemini 2.5 Pro ارائه داده است. این مدل بهویژه در حوزههایی که برای کسبوکارها حیاتی هستند، از رقبای آمریکایی خود پیشی گرفته است.

برتری در OCR، اسناد و نمودارها
در بنچمارکهای OCRBench و DocVQA، مدل بایدو توانست در تشخیص نوری کاراکترها و پاسخدهی بر اساس اسناد، از GPT-5 و Gemini جلو بزند.
در آزمون ChartQA نیز درک دادههای ساختاریافته و استدلال نموداری ERNIE 5 بهتر از رقبا بوده و بایدو این توانایی را نقطه قوت مدل خود برای صنایع مالی و سیستمهای پردازش اسناد معرفی کرده است.
رقابت نزدیک در تصویر، صدا و زبان
در بخش تولید تصویر نیز ERNIE 5 توانسته با مدل Veo3 گوگل رقابت کند یا حتی عملکرد بالاتری ارائه دهد. در حوزههای صوتی و زبانی نیز نتایج اعلامشده رقابتی بوده، هرچند تمرکز اصلی مدل همچنان روی پردازش بصری، اسناد و دادههای ساختاریافته است.

مقایسه قیمت ERNIE 5 با مدلهای آمریکایی
بایدو مدل جدید خود را با قیمتگذاری پریمیوم معرفی کرده است؛ بااینحال هزینهی آن همچنان بسیار پایینتر از رقبای آمریکایی محاسبه میشود.
مقایسه هزینه استفاده از مدلها (بهازای هر یک میلیون توکن):
- ERNIE 5.0 (Baidu): ورودی 0.85 دلار | خروجی 3.40 دلار
- GPT-5.1 (OpenAI): ورودی 1.25 دلار | خروجی 10 دلار
- Gemini 2.5 Pro (Google): ورودی 1.25 دلار | خروجی 10 دلار
- Claude Opus 4.1 (Anthropic): ورودی 15 دلار | خروجی 75 دلار
- ERNIE 4.5 Turbo (Baidu): ورودی 0.11 دلار | خروجی 0.45 دلار
این اختلاف قیمت باعث شده کسبوکارها ERNIE 5 را انتخابی اقتصادیتر و مناسبتر برای پردازشهای گسترده بدانند.
بخشی از استراتژی بزرگ بایدو
رونمایی از مدل هوش مصنوعی ERNIE 5 بایدو تنها یک بخش از برنامه گستردهتر این شرکت است. بایدو در کنار آن محصولات دیگری مانند MeDo (پلتفرم ساخت اپلیکیشن بدون کدنویسی) و Oreate را نیز معرفی کرده و سرویس تاکسی خودران Apollo Go را به ۲۲ شهر گسترش داده است. این اقدامات نشان میدهد بایدو قصد دارد حضور خود را در بازار جهانی هوش مصنوعی و خدمات هوشمند پررنگتر کند.
کلام آخر
ظهور مدلهایی مانند ERNIE 5 در ادامه موج تحولاتی است که این روزها در صنعت هوش مصنوعی دیده میشود. نمونه آن مدلهایی است که شرکتهای غربی عرضه کردهاند؛ ازجمله معرفی مدل GPT-5.1 با تنظیمات تازه و ویژگیهای ارتقایافته که نشان میدهد رقابت جهانی در سطح مدلهای مولتیمودال هر روز شدیدتر میشود.
ERNIE 5 اکنون یکی از برجستهترین نمونههای این رقابت است؛ مدلی که هم در عملکرد و هم در قیمتگذاری، چشمانداز تازهای برای کاربران و کسبوکارها ایجاد کرده است.




