با شات ایکس همیشه در فناوری بروز باشید
Kling اپلیکیشن هوش مصنوعی جدید از چین
عکس : اپلیکیشن Kling

به نظر می‌رسد چین در توسعه مدل هوش مصنوعی خود به سرعت در حال پیشرفت است و Kling شاهدی بر این رشد سریع است.

به گزارش سرویس اخبار هوش مصنوعی سایت شات ایکس و به نقل از ایتنا در فوریه امسال، شرکت اوپن ای‌آی، Sora مدل تولید ویدیوی خود را راه‌اندازی کرد که می‌تواند ویدیوهای یک دقیقه‌ای با کیفیت بالا ایجاد کند. Sora هنوز برای عموم در دسترس نیست، اما به نظر می‌رسد یک مدل دیگر تبدیل متن به ویدیو در تیتر خبرها باشد. شرکت چینی Kuaishou Technology که به پلتفرم معروف ویدیوی کوتاه است، از مدل تبدیل متن به ویدئو به نام Kling رونمایی کرده است. برخلاف Sora، به نظر می‌رسد Kling در طریق لیست انتظار در دسترس کاربران قرار گرفته است.

فیلم‌های با کیفیت بالا تولید کنید

مدل Kling از بازسازی 3 بعدی پیشرفته صورت و بدن با استفاده از فناوری 3D VAE این شرکت استفاده می‌کند و به کاربران امکان می‌دهد ویدیوهایی با نسبت‌های مختلف بسازند
عکس : مدل Kling از بازسازی 3 بعدی پیشرفته صورت و بدن با استفاده از فناوری 3D VAE این شرکت استفاده می‌کند و به کاربران امکان می‌دهد ویدیوهایی با نسبت‌های مختلف بسازند

Kling از فناوری مشابه Sora استفاده می‌کند و می‌تواند ویدیوهای HD 1080p تولید کند که تا دو دقیقه طول بکشد.

این مدل می‌تواند حرکات واقع گرایانه در مقیاس بزرگ ایجاد کند که اساساً ویژگی‌های جهان فیزیکی را تقلید می‌کند. گفته می‌شود که Kling بر اساس معماری Diffusion Transformer ساخته شده است و می‌تواند پیام‌های متنی را به تصاویر و ویدیوهای زنده تبدیل کند.

مدل Kling از بازسازی 3 بعدی پیشرفته صورت و بدن با استفاده از فناوری 3D VAE این شرکت استفاده می‌کند و به کاربران امکان می‌دهد ویدیوهایی با نسبت‌های مختلف بسازند.



تبدیل متن به ویدئو

تبدیل متن به ویدئو در اپلیکیشن Kling
عکس : تبدیل متن به ویدئو در اپلیکیشن Kling

این شرکت یک ویدئوی نمایشی منتشر کرد که توانایی کلینگ را برای ایجاد یک ویدیو تا دو دقیقه با سرعت 30 فریم بر ثانیه نشان می‌داد.

اما سورا فقط قادر به ایجاد ویدیوهای یک دقیقه‌ای است. بر اساس نمونه‌های ارسال شده در ایکس (توییتر سابق)، به نظر می رسد ویدیوهای ایجاد شده توسط Kling به طور دقیق ویژگی‌های فیزیکی دنیای واقعی را تقلید می‌کنند.

لازم به ذکر است که Kling تنها مدل متن به ویدئو از چین نیست.

در ماه آوریل، Vidu AI را منتشر کرد که یک مدل متن به ویدیو که قادر به تولید ویدیوهای 16 ثانیه‌ای با کیفیت 1080p است.



Sora تاخیر داشت

Sora
عکس : Sora

OpenAI در میدان رقابت با بازیکنان موجود مانند Runway و Pika Labs روبرو است که هر دو در حال تقویت بازی در هوش مصنوعی هستند.

همچنین رقبای جدیدی مانند Haiper، LTX Studio و Higgsfield وجود دارند که هر کدام رویکردهای متفاوتی را برای ویدیوهای هوش مصنوعی اتخاذ می‌کنند و حتی گوگل نیز یک مدل Veo جدید دارد.

لازم به ذکر است که پس از رونمایی OpenAI از Sora در فوریه گذشته، شاهد استفاده از تعداد فزاینده‌ای از سازندگان از آن بودیم، از جمله 5 کارگردان برنده جایزه که قرار است هفته آینده فیلم‌های کوتاه ساخته شده توسط Sora را به نمایش بگذارند.

با وجود این، هنوز به طور گسترده در دسترس عموم نیست. حقیقت این است که تاخیر OpenAI فنی نیست بلکه به دلیل ایمنی است.

این شرکت می‌گوید که می‌خواهد اطمینان حاصل کند که این مدل از هوش مصنوعی نمی‌تواند برای به دست آوردن اطلاعات گمراه‌کننده یا اهداف مخرب قبل از ارسال آن به عموم مردم استفاده شود.

ارسال این خبر برای دوستان در شبکه های مجازی :
تلگرامواتساپایتاتوییترفیس بوکلینکدین