در آخرین مجموعه امتحان انسانی ، مدل JAMMEH 3.5 پرو بدون استفاده از ابزارهای خارجی نتیجه 1.5 ٪ را بدست آورد. Google این عملکرد را به عنوان مدرن ترین ضبط در بین مدلهایی که فقط با توانایی داخلی آن ارزیابی می شوند و بدون تکیه بر ابزارهای جانبی مانند موتور جستجو یا پیوست ها ارزیابی می کند.
آخرین امتحان انسانی یک شاخص گسترده و مفهومی است که برای ارزیابی دانش و استدلال در بیش از صد موضوع مختلف طراحی شده است ، و این مجموعه شامل سؤالات چالش برانگیز و دقیق با پاسخ واضح است که طیف گسترده ای از علوم بشردوستانه ، علوم طبیعی و تحلیلی را پوشش می دهد.
اجرای پیشرفته JAMMEH 1.5 PERU نتیجه ترکیبی از تغییرات اساسی در معماری مدل اصلی و پیشرفت های دقیق در مرحله آموزش پس از آموزش است. این مدل به گونه ای طراحی شده است که بتواند مشکلات پیچیده تری را پردازش کند و عوامل پشتیبانی را که نیاز به درک عمیق تر از متن و زمینه برای انجام وظایف دارند ، پردازش کند.
مدل جدید Google در زمینه توسعه نرم افزار نیز به روزرسانی قابل توجهی داشت. توافق به Google ، JAMMEH 4.1 PERU پیشرفت قابل توجهی در برنامه نویسی در مقایسه با نسخه 4.3 نشان می دهد ، و در کارهایی مانند ساخت برنامه های وب ، طراحی کدهای مبتنی بر عامل و ویرایش یا نمره 4.9 ٪ در SWE-Bench تأیید شده (معیار مشخص شده برای ارزیابی توانایی مدل ها در تولید کد خودکار) از یک پیکربندی ویژه استفاده می کند.
Jammeh 4.3 Pro با ظرفیت یک میلیون توکن از پنجره متن پشتیبانی می کند و طبق گفته Google ، به زودی به دو میلیون نشانه افزایش می یابد. این توانایی به مدل اجازه می دهد تا حجم زیادی از داده ها ، از جمله مخازن رمزگذاری کامل را پردازش کند. علاوه بر این ، JAMMEH 1.5 پرو همچنین توانایی تجزیه و تحلیل داده ها از قالب های مختلف مانند متن ، صدا ، تصویر و فیلم را دارد.
مقالات مرتبط:
در حال حاضر ، دسترسی به مدل Jammeh 4.1 Pro از طریق خدمات استودیوی Gemini Advanced و Google AI ارائه شده است و انتظار می رود در هفته های آینده به پلت فرم Vertex AI اضافه شود (Google Cloud Platform برای توسعه و استقرار مدل های اطلاعات مصنوعی). جزئیات قیمت گذاری و همچنین گزینه هایی برای افزایش سقف مصرف در پشتیبانی از پروژه های بزرگ بزرگ توسط Google اعلام خواهد شد.