شرکت OpenAI هوش مصنوعی جدید ChatGPT 5.5 را معرفی کرده است. این مدل به عنوان هوشمندترین و سریعترین AI توصیف شده که میتواند وظایف کاری را از ابتدا تا انتها به صورت کامل انجام دهد.
برخلاف نسخههای قبلی که برای انجام وظایف نیاز به پرامپتهای دقیق و مرحله به مرحله داشتند، GPT-5.5 میتواند پروژههای پیچیده و چندبخشی را به صورت کامل و از ابتدا تا انتها مدیریت کند. طبق اعلامیه مطبوعاتی شرکت، شما میتوانید یک پروژه را به آن بسپارید و اطمینان داشته باشید که برنامه ریزی، استفاده از ابزارها، بررسی نتایج کار، رفع ابهامات و تکمیل پروژه را به بهترین نحو انجام خواهد داد. این مدل در نوشتن و اشکالزدایی کد، تحقیق آنلاین، تحلیل دادهها، ایجاد اسناد و صفحات گسترده و حتی کار با نرمافزارها در برنامههای مختلف مهارت بالایی دارد.
بزرگترین پیشرفت این مدل در زمینه کدنویسی عاملی و رایانش است. در بنچمارک Terminal-Bench 2.0 که گردش کارهای پیچیده خط فرمان را میسنجد، GPT-5.5 به دقت ۸۲.۷ درصد دست یافته که رکورد جدیدی در این حوزه محسوب میشود. در بنچمارک SWE-Bench Pro که ارزیابی حل مسائل واقعی در GitHub را انجام میدهد، امتیاز ۵۸.۶ درصد کسب کرده و وظایف بیشتری را به صورت کامل و در یک مرحله نسبت به مدلهای قبلی حل میکند. همچنین در معیار داخلی OpenAI موسوم به Expert-SWE برای پروژههای کدنویسی ۲۰ ساعته، عملکرد بهتری نسبت به GPT-5.4 از خود نشان داده. نکته مهم این است که این قابلیتها با مصرف توکن کمتر ارائه میشوند که GPT-5.5 را هم تواناتر و هم کارآمدتر میکند. در شاخص کدنویسی Artificial Analysis، GPT-5.5 هوشمندی پیشرو را با تقریبا نصف هزینه مدلهای رقیب ارائه میدهد.
در بیانیه مطبوعاتی آمده که GPT-5.5 با همکاری و بر روی سیستمهای NVIDIA GB200 و GB300 NVL72 طراحی شده و Codex به مهندسان در تست و بهینه سازی خود پشته کمک کرده است. یکی از پیشرفتهای کلیدی، تعادل بار پویا است. به جای تقسیم درخواستها به قطعات ثابت، Codex ترافیک تولیدی چند هفته را تحلیل کرد تا الگوریتمهای پارتیشنبندی هوشمندتری ایجاد کند و سرعت تولید توکن را بیش از ۲۰ درصد افزایش دهد.
در زمینه کارهای دانشی، GPT-5.5 بیشتر شبیه یک دستیار توانا عمل میکند تا یک چتبات. این مدل در یافتن اطلاعات، استخراج نکات مهم، استفاده از ابزارها و تبدیل ورودیهای خام به خروجیهای پالایش شده بهتر عمل میکند. در Codex، اکنون اسناد و صفحات گسترده و ارائههای باکیفیتتری تولید میکند. تیمهای خود OpenAI در حال حاضر از آن در بخشهای مالی، ارتباطات، بازاریابی و محصول استفاده میکنند. این شرکت گزارش داده که تیم مالی از آن برای بررسی ۲۴۷۷۱ فرم مالیاتی K-1 استفاده کرده که در مجموع ۷۱۶۳۷ صفحه میشود و این فرآیند را دو هفته زودتر به پایان رسانده است. تیم ارتباطات یک چارچوب امتیازدهی برای درخواستهای سخنرانی ایجاد کرده و یک عامل خودکار Slack را تأیید کرده که اکنون درخواستهای کمخطر را بدون دخالت انسان مدیریت میکند.
قابلیت Thinking در GPT-5.5 پاسخهای سریعتر و مختصرتری برای مسائل پیچیده ارائه میدهد، در حالی که GPT-5.5 Pro کیفیت قابل توجهی برای کارهای چالشبرانگیز در حوزههای کسب و کار، حقوقی، آموزشی و علم داده دارد. این مدل در بنچمارک GDPval برای کارهای دانشی چندشغلی امتیاز ۸۴.۹ درصد، در OSWorld-Verified برای کار با محیطهای واقعی کامپیوتر امتیاز ۷۸.۷ درصد و در Tau2-bench Telecom برای گردش کارهای خدمات مشتری بدون تنظیم دقیق پرامپت، امتیاز ۹۸ درصد کسب کرده است.
OpenAI ادعا میکند که GPT-5.5 با قویترین سازوکارهای حفاظتی خود عرضه میشود، از جمله کنترلهای سختگیرانهتر برای درخواستهای پرخطر امنیتی. برای تعادل بین دسترسی و ایمنی، OpenAI (Trusted Access for Cyb را راهاندازی میکند که به کاربدان تأیید شده اجازه استفاده گستردهتر از مدلهای مجاز سایبری مانند GPT-5.4-Cyber را برای کارهای امنیتی قانونی میدهد.
GPT-5.5 اکنون برای کاربران پلاس، پرو، Business و Enterprise در ChatGPT و Codex در دسترس قرار دارد، در حالی که GPT-5.5 Pro برای کاربران پرو، Business و Enterprise در دسترس خواهد بود. دسترسی API نیز به زودی و پس از بررسیهای بیشتر ایمنی و امنیتی ارائه خواهد شد.