قابلیت جدید تولید تصویر در ChatGPT با مدل GPT-4o | بهبود کیفیت و دقت تصاویر

قابلیت جدید تولید تصویر در ChatGPT با مدل GPT-4o | بهبود کیفیت و دقت تصاویر

هوش مصنوعی
زمان مطالعه: 2 دقیقه
میانگین رتبه
4 از 5 ستاره. 1 رأی.
رتبه من:

OpenAI ویژگی جدیدی به نام «Images in ChatGPT» را معرفی کرده که به کمک مدل GPT-4o کیفیت تصاویر تولیدی را بهبود می‌بخشد. این قابلیت جدید باعث ارتقای انسجام و یکپارچگی تصاویر شده و امکان افزودن عناصر بیشتری را فراهم می‌کند.

با ای بازی همراه باشید تا از قابلیت جدید OpenAI در ChatGPT مطلع شوید.

قابلیت جدید OpenAI در ChatGPT | تولید تصویر در ChatGPT با مدل GPT-4o

طبق اعلام «تارا کریستینسن»، سخنگوی OpenAI، این ویژگی از امروز برای همه کاربران در دسترس است. کاربران نسخه رایگان ChatGPT نیز بدون محدودیت در تعداد درخواست، می‌توانند از این قابلیت استفاده کنند؛ هرچند ممکن است بر اساس میزان تقاضا، برخی محدودیت‌ها در آینده اعمال شود.

بهبود دقت و انسجام تصاویر در مدل GPT-4o

«گابریل گو»، مدیر تیم تحقیقاتی OpenAI، در مصاحبه‌ای با Verge اعلام کرد که قابلیت جدید مبتنی بر مدل GPT-4o omnimodal توسعه یافته است. این مدل امکان پردازش انواع مختلف داده‌ها را فراهم کرده و توانایی حفظ انسجام و دقت عناصر گرافیکی را به میزان قابل‌توجهی افزایش داده است.

مشکلات مدل‌های قبلی و راه‌حل جدید

مدل‌های قدیمی مانند DALL·E در چینش رنگ‌ها و اشکال دچار مشکل بودند؛ مثلاً ممکن بود به‌جای ستاره آبی و مثلث قرمز، ستاره قرمز و مثلث آبی را تولید کنند. اما در مدل جدید این مشکل برطرف شده و حالا می‌توان ۱۵ تا ۲۰ عنصر را به‌درستی در تصویر قرار داد، درحالی‌که مدل‌های قبلی تنها بین ۵ تا ۸ عنصر را بدون خطا طراحی می‌کردند.

ویژگیمدل‌های قدیمیمدل جدید (GPT-4o)
تعداد عناصر صحیح در تصویر۵ تا ۸ عنصر۱۵ تا ۲۰ عنصر
انسجام رنگ‌ها و شکل‌هاممکن است اشتباه باشدکاملاً بهینه‌شده
دقت در متون داخل تصاویرپایینبهبودیافته، اما هنوز محدودیت دارد
مدل GPT-4o از یک روش Autoregressive برای تولید تصاویر استفاده می‌کند.

چگونه ChatGPT تصاویر را بهبود داده است؟

مدل GPT-4o از یک روش Autoregressive برای تولید تصاویر استفاده می‌کند. در این روش، تصاویر به‌صورت تدریجی از بالا به پایین و از چپ به راست ساخته می‌شوند، مشابه فرایند نوشتن متن. این روش باعث بهبود یکپارچگی تصاویر شده، درحالی‌که مدل‌های قدیمی مانند DALL·E از Diffusion model استفاده می‌کردند که تصویر را به‌طور هم‌زمان پردازش می‌کرد.

چالش‌های پیش رو

با وجود پیشرفت‌های زیاد، مدیر تیم تحقیقاتی OpenAI اعلام کرده که هنوز در پردازش متون کوچک داخل تصاویر چالش‌هایی وجود دارد. اما به‌طور کلی، مدل جدید به حفظ کیفیت و دقت هم‌زمان متن و تصویر کمک می‌کند.

جمع‌بندی

افزودن قابلیت Images in ChatGPT یک گام بزرگ در جهت بهبود تولید تصاویر توسط هوش مصنوعی است. مدل GPT-4o با ارتقای دقت رنگ‌ها، چینش صحیح عناصر، و بهبود روش پردازش تصاویر، تجربه‌ای روان‌تر و دقیق‌تر را برای کاربران ChatGPT فراهم کرده است. OpenAI همچنان در حال توسعه این قابلیت است تا کیفیت تصاویر را بیش‌ازپیش افزایش دهد.

تاریخ آخرین آپدیت:  3 ماه قبل

پایان