باید قدری بیشتر صبر کنیم تا بتوانیم عرضه پیچیدهترین مدل هوش مصنوعی گوگل تا به امروز را تجربه کنیم.
جیمنی (Gemini) به عنوان نسل بعدی هوش مصنوعی و چندوجهی توصیف شده است، به این معنی که میتواند انواع مختلفی از دادهها را پردازش کند و گفته میشود که ظرفیت درک و تولید متن و تصاویر و همچنین انواع دیگر محتوا - مانند وبسایتها - بر اساس طرح اولیه یا توضیحات نوشتهشده را دارد.
وبسایت The Information، به نقل از دو منبع ناشناس مطلع از این تصمیم، گزارش داد که رویدادهای اعلامنشده رونمایی قبلی - که در ابتدا قرار بود هفته آینده در نیویورک، واشنگتن و کالیفرنیا برگزار شوند - به دلیل نگرانیهای ناشی از عدم پاسخدهی قابل قبول این هوش مصنوعی به برخی از درخواستها (پرامپتها) و جستارهای غیرانگلیسی، بی سر و صدا به اوایل سال 2024 موکول شدهاند.
نمایندگان گوگل از اظهارنظر فوری در اینباره در واکنش به پرسش بیزینس اینسایدر خوداری کردند.
با اینکه جیمنی هنوز برای استفاده عمومی منتشر نشده است، اما گفته میشد که عملکرد آن به طرز چشمگیری از GPT-4 شرکت OpenAI بهتر است زیرا از قدرت محاسباتی بسیار بیشتری نسبت به رقیب خود استفاده میکند.
سیسی سیائو، معاون گوگل و مدیر بارد و گوگل اسیستنت، درباره جمینی گفته بود: «من چیزهای بسیار شگفتانگیزی دیدهام. مثلا به جمینی گفتم که دارم تلاش میکنم یک کیک بپزم، برایم 3 تصویر از مراحلی را ترسیم کن که نحوه آماده کردن یک کیک سهلایه را نشان بدهد، و جمینی واقعاٌ تصاویر آن را برایم تولید کرد».
سیائو افزود: «اینها تصاویر کاملاً بدیعی هستند. اینها تصاویری از اینترنت نیستند. جمینی اکنون میتواند به صورت تصویری با انسان صحبت کند، نه فقط به صورت متنی».
اگرچه گوگل در حال حاضر مدل هوش مصنوعی مولد خود به نام بارد را دارد، اما ChatGPT تاکنون بیشتر توجه کاربران را جلب کرده است – اما تحلیلگران استدلال میکنند که زمانی که جمینی بالاخره راهاندازی شود، این وضعیت میتواند تغییر کند.