مدل جهانی Runway با نام GWM-1 معرفی شد؛ مدلی پیشرفته برای شبیهسازی رفتار و فیزیک دنیای واقعی همراه با نسخه جدید Gen-4.5. با ای بازی همراه باشید.
مدل جهانی Runway؛ نسل جدید شبیهسازی با درک واقعی جهان
شرکت هوش مصنوعی Runway از نخستین مدل جهانی (World Model) خود با نام GWM-1 رونمایی کرد؛ مدلی که میتواند با پیشبینی فریمبهفریم، شبیهسازیهایی بسازد که رفتار، فیزیک و پویایی دنیای واقعی را در گذر زمان بهدرستی درک میکنند. این معرفی، Runway را وارد رقابت جدی با شرکتهایی کرده که در حال توسعه مدلهای جهانمحور هستند.
به گفته Runway، مدل جهانی این شرکت از نظر عمومی نسبت به رقبایی مانند Genie-3 گوگل یک گام جلوتر قرار دارد و میتواند کاربردهای گستردهای در حوزههایی مانند رباتیک، علوم زیستی و آموزش سیستمهای هوشمند داشته باشد.
مدل جهانی (World Model) چیست؟
اصطلاح مدل جهانی به سیستمهایی از هوش مصنوعی اشاره دارد که با یادگیری یک شبیهسازی درونی از سازوکار جهان، قادرند بدون آموزش جداگانه، به تواناییهایی مانند استدلال، پیشبینی و برنامهریزی دست پیدا کنند. Runway اعلام کرده برای رسیدن به چنین مدلی، ابتدا یک مدل ویدیویی بسیار قدرتمند توسعه داده تا بتواند پیکسلها را مستقیماً پیشبینی کند.
به باور این شرکت، زمانی که چنین مدلی در مقیاس مناسب و با دادههای درست آموزش داده شود، به درکی بنیادین از نحوه کارکرد جهان دست پیدا میکند.
GWM-1 چگونه کار میکند؟
سازوکار مدل جهانی Runway بر پایه پیشبینی فریمبهفریم بنا شده است. این مدل میتواند از یک صحنه ثابت، محیطی غوطهورکننده، پویا و قابل کاوش بسازد؛ محیطی که در آن هندسه، نورپردازی و فیزیک بهصورت زنده و لحظهای شکل میگیرند.
کاربر میتواند در این جهانها نقشهای مختلفی را تجربه کند؛ از یک انسان در حال قدمزدن در شهر گرفته تا یک پهپاد در حال پرواز یا رباتی که در یک انبار مسیریابی میکند.
نسخههای تخصصی مدل جهانی Runway
Runway مدل جهانی خود را در قالب سه نسخه تخصصی ارائه کرده است:
GWM-Worlds
این نسخه یک اپلیکیشن مبتنی بر مدل است که امکان ساخت پروژههای تعاملی و کاوش در جهانهای تولیدشده را فراهم میکند. کاربران میتوانند با یک پرامپت یا تصویر مرجع، صحنه دلخواه خود را بسازند و در آن حرکت کنند. این شبیهسازی با نرخ ۲۴ فریمبرثانیه و رزولوشن 720p اجرا میشود و میتواند برای توسعه بازیها و آموزش رفتار عاملهای هوشمند مفید باشد.
GWM-Robotics
تمرکز این نسخه بر تولید دادههای مصنوعی برای آموزش رباتهاست. Runway اعلام کرده این نسخه از طریق یک SDK ارائه میشود و مذاکراتی با شرکتهای فعال در حوزه رباتیک برای استفاده تجاری از آن در جریان است.
GWM-Avatars
در این نسخه، تمرکز بر شبیهسازی رفتار انسان و توسعه آواتارهای بسیار واقعگرایانه است؛ موضوعی که میتواند در آموزش، تعامل انسان و ماشین و محیطهای مجازی کاربرد گستردهای داشته باشد.
به گفته Runway، این سه نسخه فعلاً بهصورت مستقل ارائه شدهاند، اما هدف نهایی، ادغام همه این قابلیتها در یک مدل واحد است.

معرفی Gen-4.5؛ مدل ویدیویی با پشتیبانی صوتی بومی
همزمان با معرفی مدل جهانی Runway، این شرکت نسخه جدید مدل ویدیویی خود با نام Gen-4.5 را نیز منتشر کرده است. این نسخه به قابلیت صوتی بومی مجهز شده و امکان تولید ویدیوهای بلند چندشاتی را فراهم میکند.
با این بهروزرسانی، کاربران میتوانند ویدیوهای یکدقیقهای با حفظ انسجام کاراکتر، دیالوگ طبیعی، صدای پسزمینه و نماهای پیچیده از زوایای مختلف تولید کنند. همچنین امکان ویرایش صوت موجود، افزودن دیالوگ و تدوین ویدیوهای چندشاتی با طول دلخواه نیز در دسترس قرار گرفته است.
در این مسیر، ابزارهای هوش مصنوعی تولید ویدیو مانند ابزارهای InVideo، نقش پررنگتری در ساخت محتوای حرفهای و بلندمدت پیدا کردهاند و بسیاری از تولیدکنندگان محتوا بهدنبال راهکارهایی برای مدیریت پروژههای ویدیویی پیشرفتهتر هستند.
آینده شبیهسازی با مدل جهانی Runway
معرفی مدل جهانی Runway نشان میدهد که هوش مصنوعی بهسمت ساخت شبیهسازیهایی حرکت میکند که نهتنها واقعگرایانهتر هستند، بلکه میتوانند قوانین فیزیکی و رفتار جهان را نیز درک کنند. چنین فناوریهایی میتوانند مسیر توسعه رباتها، سیستمهای هوشمند و حتی آموزش تعاملی را بهطور اساسی تغییر دهند.




