هوش مصنوعی بسیار پیشرفته ChatGPT 5.5 معرفی شد

شنبه 05 اردیبهشت 1405

نویسنده : افشین نوری

هوش مصنوعی بسیار پیشرفته ChatGPT 5.5 معرفی شد — عکس : هوش مصنوعی ChatGPT 5.5

شرکت OpenAI هوش مصنوعی جدید ChatGPT 5.5 را معرفی کرده است. این مدل به عنوان هوشمندترین و سریع‌ترین AI توصیف شده که می‌تواند وظایف کاری را از ابتدا تا انتها به صورت کامل انجام دهد.

برخلاف نسخه‌های قبلی که برای انجام وظایف نیاز به پرامپت‌های دقیق و مرحله به مرحله داشتند، GPT-5.5 می‌تواند پروژه‌های پیچیده و چندبخشی را به صورت کامل و از ابتدا تا انتها مدیریت کند. طبق اعلامیه مطبوعاتی شرکت، شما می‌توانید یک پروژه را به آن بسپارید و اطمینان داشته باشید که برنامه ریزی، استفاده از ابزارها، بررسی نتایج کار، رفع ابهامات و تکمیل پروژه را به بهترین نحو انجام خواهد داد. این مدل در نوشتن و اشکال‌زدایی کد، تحقیق آنلاین، تحلیل داده‌ها، ایجاد اسناد و صفحات گسترده و حتی کار با نرم‌افزارها در برنامه‌های مختلف مهارت بالایی دارد.

بزرگترین پیشرفت این مدل در زمینه کدنویسی عاملی و رایانش است. در بنچمارک Terminal-Bench 2.0 که گردش کارهای پیچیده خط فرمان را می‌سنجد، GPT-5.5 به دقت ۸۲.۷ درصد دست یافته که رکورد جدیدی در این حوزه محسوب می‌شود. در بنچمارک SWE-Bench Pro که ارزیابی حل مسائل واقعی در GitHub را انجام می‌دهد، امتیاز ۵۸.۶ درصد کسب کرده و وظایف بیشتری را به صورت کامل و در یک مرحله نسبت به مدل‌های قبلی حل می‌کند. همچنین در معیار داخلی OpenAI موسوم به Expert-SWE برای پروژه‌های کدنویسی ۲۰ ساعته، عملکرد بهتری نسبت به GPT-5.4 از خود نشان داده. نکته مهم این است که این قابلیت‌ها با مصرف توکن کمتر ارائه می‌شوند که GPT-5.5 را هم تواناتر و هم کارآمدتر می‌کند. در شاخص کدنویسی Artificial Analysis، GPT-5.5 هوشمندی پیشرو را با تقریبا نصف هزینه مدل‌های رقیب ارائه می‌دهد.

در بیانیه مطبوعاتی آمده که GPT-5.5 با همکاری و بر روی سیستم‌های NVIDIA GB200 و GB300 NVL72 طراحی شده و Codex به مهندسان در تست و بهینه سازی خود پشته کمک کرده است. یکی از پیشرفت‌های کلیدی، تعادل بار پویا است. به جای تقسیم درخواست‌ها به قطعات ثابت، Codex ترافیک تولیدی چند هفته را تحلیل کرد تا الگوریتم‌های پارتیشن‌بندی هوشمندتری ایجاد کند و سرعت تولید توکن را بیش از ۲۰ درصد افزایش دهد.

در زمینه کارهای دانشی، GPT-5.5 بیشتر شبیه یک دستیار توانا عمل می‌کند تا یک چت‌بات. این مدل در یافتن اطلاعات، استخراج نکات مهم، استفاده از ابزارها و تبدیل ورودی‌های خام به خروجی‌های پالایش شده بهتر عمل می‌کند. در Codex، اکنون اسناد و صفحات گسترده و ارائه‌های باکیفیت‌تری تولید می‌کند. تیم‌های خود OpenAI در حال حاضر از آن در بخش‌های مالی، ارتباطات، بازاریابی و محصول استفاده می‌کنند. این شرکت گزارش داده که تیم مالی از آن برای بررسی ۲۴۷۷۱ فرم مالیاتی K-1 استفاده کرده که در مجموع ۷۱۶۳۷ صفحه می‌شود و این فرآیند را دو هفته زودتر به پایان رسانده است. تیم ارتباطات یک چارچوب امتیازدهی برای درخواست‌های سخنرانی ایجاد کرده و یک عامل خودکار Slack را تأیید کرده که اکنون درخواست‌های کم‌خطر را بدون دخالت انسان مدیریت می‌کند.

قابلیت Thinking در GPT-5.5 پاسخ‌های سریع‌تر و مختصرتری برای مسائل پیچیده ارائه می‌دهد، در حالی که GPT-5.5 Pro کیفیت قابل توجهی برای کارهای چالش‌برانگیز در حوزه‌های کسب و کار، حقوقی، آموزشی و علم داده دارد. این مدل در بنچمارک GDPval برای کارهای دانشی چندشغلی امتیاز ۸۴.۹ درصد، در OSWorld-Verified برای کار با محیط‌های واقعی کامپیوتر امتیاز ۷۸.۷ درصد و در Tau2-bench Telecom برای گردش کارهای خدمات مشتری بدون تنظیم دقیق پرامپت، امتیاز ۹۸ درصد کسب کرده است.

OpenAI ادعا می‌کند که GPT-5.5 با قوی‌ترین سازوکارهای حفاظتی خود عرضه می‌شود، از جمله کنترل‌های سخت‌گیرانه‌تر برای درخواست‌های پرخطر امنیتی. برای تعادل بین دسترسی و ایمنی، OpenAI (Trusted Access for Cyb را راه‌اندازی می‌کند که به کاربدان تأیید شده اجازه استفاده گسترده‌تر از مدل‌های مجاز سایبری مانند GPT-5.4-Cyber را برای کارهای امنیتی قانونی می‌دهد.

GPT-5.5 اکنون برای کاربران پلاس، پرو، Business و Enterprise در ChatGPT و Codex در دسترس قرار دارد، در حالی که GPT-5.5 Pro برای کاربران پرو، Business و Enterprise در دسترس خواهد بود. دسترسی API نیز به زودی و پس از بررسی‌های بیشتر ایمنی و امنیتی ارائه خواهد شد.