مجله اینترنتی گیمیس

شرکتی چینی رقیب هوش مصنوعی GPT-4 را با تنها ۲ هزار پردازنده گرافیکی توسعه داد


کای فو لیبنیانگذار و مدیر عامل استارتاپ ai.01 در مصاحبه ای اعلام کرد که شرکت او یکی از مدل های پیشرفته هوش مصنوعی خود را با استفاده از دو هزار پردازنده گرافیکی و تنها سه میلیون دلار آموزش داده است.

در ویدیوی ارسال شده در Xکای فو لی گفت: «آنچه دوستان من را در سیلیکون ولی شگفت زده می کند، عملکرد ما نیست، بلکه این است که ما مدل را تنها با سه میلیون دلار آموزش دادیم. در حالی که GPT-4 با هزینه 80-100 میلیون دلار و GPT-5 با هزینه حدود 1 میلیارد دلار شایعه شده است.

مدیر ai.01 به محدودیت‌های دسترسی چین به فناوری‌های پیشرفته مانند پردازنده‌های گرافیکی پرقدرت انویدیا که قلب تپنده بسیاری از سرورهای هوش مصنوعی را تشکیل می‌دهند، اشاره کرد و افزود: به عنوان یک شرکت چینی، دسترسی ما به پردازنده‌های گرافیکی به دلیل تحریم های آمریکا محدود شده است. همچنین شرکت های چینی به اندازه شرکت های آمریکایی ارزش گذاری نمی شوند.

کای فو لی می‌گوید تیمش تنها دو هزار پردازنده گرافیکی برای توسعه مدل هوش مصنوعی خود داشت و او باید اولویت‌هایش را به‌عنوان مدیر اجرایی درست انجام می‌داد. با توجه به لیست در وب سایت ai.01مدل Yi-Lightning بر اساس معیار عملکرد UC Berkeley LMSIS در رتبه ششم قرار دارد.

دستاورد این استارت آپ چینی به دلیل کاهش هزینه های خیره کننده آن قابل توجه است. این تفاوت چشمگیر نشان می دهد که دستیابی به قابلیت های پیشرفته هوش مصنوعی همیشه به بودجه های زیادی نیاز ندارد و مهندسی دقیق و بهینه سازی هدفمند می تواند نتایج مشابهی را با هزینه و منابع محاسباتی کمتر ایجاد کند.

مقالات مرتبط

گفته می شود که OpenAI از 10000 پردازنده گرافیکی Nvidia A100 برای آموزش مدل GPT-3 خود استفاده کرده است و از تعداد بسیار بیشتری CPU H100 برای آموزش مدل های GPT-4 و GPT-4o استفاده کرده است. قیمت هر پردازنده H100 حدود 30 هزار دلار است و قیمت دو هزار آن 6 میلیون دلار خواهد بود. بنابراین به نظر می رسد چینی ها از پردازنده های ارزان تری استفاده کرده اند.

کای فو لی افزود: ما باید روند آموزش و خروجی مدل را تسریع کنیم. بنابراین، استنتاج ما برای شناسایی تنگناها با تلاش برای تبدیل مسئله محاسباتی به یک مشکل حافظه، ساخت یک حافظه پنهان چند لایه، ایجاد یک موتور استنتاج ویژه و موارد دیگر در کل فرآیند طراحی شده است. اما مهمتر از همه، هزینه استنتاج مدل ما 10 سنت در هر میلیون توکن است (0.03 دلار به ازای هر 1000 توکن در GPT-4).



Source link

share this recipe:
Facebook
Twitter
Pinterest

Still hungry? Here’s more