OpenAI ویژگی جدیدی به نام «Images in ChatGPT» را معرفی کرده که به کمک مدل GPT-4o کیفیت تصاویر تولیدی را بهبود میبخشد. این قابلیت جدید باعث ارتقای انسجام و یکپارچگی تصاویر شده و امکان افزودن عناصر بیشتری را فراهم میکند.
با ای بازی همراه باشید تا از قابلیت جدید OpenAI در ChatGPT مطلع شوید.
قابلیت جدید OpenAI در ChatGPT | تولید تصویر در ChatGPT با مدل GPT-4o
طبق اعلام «تارا کریستینسن»، سخنگوی OpenAI، این ویژگی از امروز برای همه کاربران در دسترس است. کاربران نسخه رایگان ChatGPT نیز بدون محدودیت در تعداد درخواست، میتوانند از این قابلیت استفاده کنند؛ هرچند ممکن است بر اساس میزان تقاضا، برخی محدودیتها در آینده اعمال شود.
بهبود دقت و انسجام تصاویر در مدل GPT-4o
«گابریل گو»، مدیر تیم تحقیقاتی OpenAI، در مصاحبهای با Verge اعلام کرد که قابلیت جدید مبتنی بر مدل GPT-4o omnimodal توسعه یافته است. این مدل امکان پردازش انواع مختلف دادهها را فراهم کرده و توانایی حفظ انسجام و دقت عناصر گرافیکی را به میزان قابلتوجهی افزایش داده است.
مشکلات مدلهای قبلی و راهحل جدید
مدلهای قدیمی مانند DALL·E در چینش رنگها و اشکال دچار مشکل بودند؛ مثلاً ممکن بود بهجای ستاره آبی و مثلث قرمز، ستاره قرمز و مثلث آبی را تولید کنند. اما در مدل جدید این مشکل برطرف شده و حالا میتوان ۱۵ تا ۲۰ عنصر را بهدرستی در تصویر قرار داد، درحالیکه مدلهای قبلی تنها بین ۵ تا ۸ عنصر را بدون خطا طراحی میکردند.
ویژگی | مدلهای قدیمی | مدل جدید (GPT-4o) |
---|---|---|
تعداد عناصر صحیح در تصویر | ۵ تا ۸ عنصر | ۱۵ تا ۲۰ عنصر |
انسجام رنگها و شکلها | ممکن است اشتباه باشد | کاملاً بهینهشده |
دقت در متون داخل تصاویر | پایین | بهبودیافته، اما هنوز محدودیت دارد |

چگونه ChatGPT تصاویر را بهبود داده است؟
مدل GPT-4o از یک روش Autoregressive برای تولید تصاویر استفاده میکند. در این روش، تصاویر بهصورت تدریجی از بالا به پایین و از چپ به راست ساخته میشوند، مشابه فرایند نوشتن متن. این روش باعث بهبود یکپارچگی تصاویر شده، درحالیکه مدلهای قدیمی مانند DALL·E از Diffusion model استفاده میکردند که تصویر را بهطور همزمان پردازش میکرد.
چالشهای پیش رو
با وجود پیشرفتهای زیاد، مدیر تیم تحقیقاتی OpenAI اعلام کرده که هنوز در پردازش متون کوچک داخل تصاویر چالشهایی وجود دارد. اما بهطور کلی، مدل جدید به حفظ کیفیت و دقت همزمان متن و تصویر کمک میکند.
جمعبندی
افزودن قابلیت Images in ChatGPT یک گام بزرگ در جهت بهبود تولید تصاویر توسط هوش مصنوعی است. مدل GPT-4o با ارتقای دقت رنگها، چینش صحیح عناصر، و بهبود روش پردازش تصاویر، تجربهای روانتر و دقیقتر را برای کاربران ChatGPT فراهم کرده است. OpenAI همچنان در حال توسعه این قابلیت است تا کیفیت تصاویر را بیشازپیش افزایش دهد.
تاریخ آخرین آپدیت: 3 ماه قبل