گوگل به تازگی از ابزار هوش مصنوعی جدیدی به نام Whisk رونمایی کرده است که رویکردی نوآورانه در تولید تصاویر ارائه میدهد. هوش مصنوعی Whisk گوگل به جای تکیه صرف بر دستورات متنی پیچیده، به کاربران اجازه میدهد تا با استفاده از تصاویر موجود، تصاویر جدید و خلاقانهای خلق کنند. این ابزار با بهرهگیری از هوش مصنوعی پیشرفته، امکانات جذابی را برای کاربران فراهم کرده است.
با ای بازی همراه باشید.
هوش مصنوعی Whisk گوگل چگونه کار میکند؟
Whisk با دریافت تصاویر به عنوان الگو، قادر است موضوع، صحنه و سبک تصویر نهایی را تشخیص دهد. کاربران میتوانند برای هر یک از این سه بخش (موضوع، صحنه و سبک) چندین تصویر به عنوان الگو ارائه کنند. این ویژگی انعطافپذیری بالایی به کاربران میدهد تا بتوانند دقیقاً به نتیجه دلخواه خود دست پیدا کنند.
برای درک بهتر نحوه عملکرد Whisk، مراحل زیر را در نظر بگیرید:
مرحله | توضیح |
---|---|
۱. انتخاب الگو | کاربران میتوانند تصاویر دلخواه خود را برای الگوبرداری به Whisk ارائه کنند. |
۲. پیشنهاد خودکار الگو | اگر تصویری برای الگوبرداری در دسترس نباشد، کاربران میتوانند با کلیک روی آیکون تاس، از گوگل بخواهند که به صورت خودکار الگوهایی را پیشنهاد دهد. |
۳. ورود متن (اختیاری) | برای جزئیات بیشتر و کنترل دقیقتر بر نتیجه نهایی، کاربران میتوانند متنی را در کادر مربوطه وارد کنند. اما این مرحله کاملاً اختیاری است. |
هوش مصنوعی Whisk گوگل پس از دریافت تصاویر و (در صورت وجود) متن ورودی کاربر، تصاویری جدید بر اساس آنها تولید میکند. این ابزار برای هر تصویر تولید شده، متنی توصیفی نیز ارائه میدهد که به درک بهتر تصویر کمک میکند.
امکانات اصلی Whisk به شرح زیر است:
امکانات | توضیح |
---|---|
ذخیره و دانلود | کاربران میتوانند تصاویر مورد پسند خود را به لیست علاقهمندیها اضافه یا آنها را دانلود کنند. |
ویرایش | امکان ویرایش تصاویر با وارد کردن متن بیشتر یا ویرایش متن توصیفی آنها وجود دارد. |
هدف Whisk:
گوگل هدف از توسعه Whisk را «کاوش بصری سریع» اعلام کرده است. این ابزار برای ویرایشهای دقیق پیکسل به پیکسل طراحی نشده، بلکه تمرکز آن بر خلق ایدههای بصری جدید و سریع است. گوگل اذعان میکند که Whisk ممکن است در برخی موارد به نتیجه مطلوب نرسد، به همین دلیل امکان ویرایش متنهای زیربنایی تصاویر را فراهم کرده است.
تکنولوژی پشت هوش مصنوعی Whisk گوگل:
Whisk از جدیدترین نسخه مدل هوش مصنوعی Imagen 3 بهره میبرد. گوگل همچنین Veo 2، نسخه بعدی مدل تولید کننده ویدیوی خود را معرفی کرده است که ظاهراً درک بسیار خوبی از زبان منحصربهفرد فیلمبرداری دارد و نسبت به مدلهای مشابه کمتر دچار توهماتی مانند انگشتان اضافی میشود.
مزایای هوش مصنوعی Whisk گوگل:
مزایای اصلی Whisk در جدول زیر خلاصه شده است:
مزیت | توضیح |
---|---|
سهولت استفاده | عدم نیاز به دستورات متنی پیچیده |
خلاقیت بالا | امکان ترکیب تصاویر مختلف و خلق ایدههای جدید |
سرعت | تولید سریع تصاویر |
انعطافپذیری | امکان استفاده از تصاویر متعدد به عنوان الگو و همچنین ورود متن |
کلام آخر
هوش مصنوعی Whisk گوگل ابزاری نوآورانه و قدرتمند است که امکان خلق تصاویر جدید و خلاقانه را با استفاده از تصاویر موجود فراهم میکند. این ابزار با رابط کاربری ساده و قابلیتهای پیشرفته خود، میتواند به ابزاری محبوب برای طراحان، هنرمندان و عموم کاربران تبدیل شود.
جمینای ۲.۰ زیرساختی برای هوش مصنوعیهای گوگل است و Whisk نمونهای از کاربرد آن در خلق تصاویر با الهام از عکسهاست. هر دو نشاندهنده تمرکز گوگل بر هوش مصنوعی قدرتمند، کاربردی و در دسترس هستند. هوش مصنوعی Whisk گوگل به طور خاص، تعامل بصری و آسان با هوش مصنوعی را برای خلق تصاویر فراهم میکند.
تاریخ آخرین آپدیت: 1 ماه قبل