مجله اینترنتی گیمیس

استارتاپ آنتروپیک از «پوکمون» برای تست مدل‌هایش استفاده می‌کند

فوریه 25, 2025

استفاده از بازی های مختلف برای اندازه گیری توانایی مدل های هوش مصنوعی و ایجاد شاخص های مختلف برای آنها دارای سابقه ای طولانی است و اکنون انسان شناسی به شرکت هایی پیوسته است که از این گزینه برای آزمایش مدل های خود استفاده می کنند.

بر اساس انتشار منتشر شده در انسان شناسیقابلیت های Sonnet Claud 3.7 ، این استارتاپ ، مصنوعی ترین مدل هوش خود را با بازی کلاسیک Pokémon Red ، آزمایش کرد که برای کنسول Game Boy Nintendo راه اندازی شد.

این انسان شناسی مدل Claude 3.7 را با حافظه اساسی ، صفحه نمایش و تماس برای وارد کردن و اجرای دکمه ها برای فشار دادن و حرکت در اطراف صفحه مجهز کرد تا مدل بتواند به طور مداوم Pokémon را بازی کند.

ویژگی منحصر به فرد Clude 3.7 توانایی تفکر و استدلال و غلبه بر مشکلات چالش برانگیز با انجام محاسبات بیشتر و هزینه های طولانی تر است. در حال حاضر ، توانایی ویژه مجهز به مدل های OpenAi و Deepseek-R1 O3-Mini است.

Cluude 3.7 بهتر از نسخه Pokémon Red Game Claude 3.0 ، نه فقط از طریق خانه ای در شهر پالت ، جایی که بازی شروع می شود ، عملکرد بهتری داشت. اخیراً ، وی موفق شد با سه رهبر باشگاه پوکمون بجنگد و نشان خود را بدست آورد.

مقالات مرتبط

به گفته انسان شناسی ، مدل Claude 3.7 موفق شد با 6000 حرکت به آخرین رهبر باشگاه پوکمون برسد ، اما دقیقاً چند محاسبات برای رسیدن به این مرحله هنوز مشخص نیست.

share this recipe: