اپل با انویدیا همکاری خواهد کرد تا عملکرد مدل های زبان بزرگ خود (LLM) را به طور چشمگیری بهبود بخشد. این همکاری شامل استفاده از تکنیک جدید تولید متن است که سرعت برنامه های هوش مصنوعی را به میزان قابل توجهی افزایش می دهد.
در اوایل سال جاری، اپل رویکرد ReDrafter (ReDrafter) را معرفی کرد و آن را به عنوان منبع باز منتشر کرد. این روش با ترکیب تکنیک های Beam Search و Dynamic Tree Attention سرعت فرآیند تولید متن را افزایش می دهد.
Beam Search چندین توالی متن ممکن را به طور همزمان برای دستیابی به بهترین نتایج بررسی میکند و Dynamic Tree Attention همپوشانیهای غیرضروری بین دنبالهها را سازماندهی و حذف میکند تا عملکرد را بهبود بخشد.
مقاله مرتبط
اپل قبلاً فناوری ReDrafter را در چارچوب TensorRT-LLM انویدیا ادغام کرده است. فناوری Said برای بهینه سازی اجرای مدل های زبان بزرگ بر روی گرافیک های Nvidia طراحی شده است. طبق گفته اپل، این ادغام نرخ تولید توکن را 2.7 برابر افزایش می دهد.
به گفته اپلپیشرفت های عملکرد هوش مصنوعی این شرکت علاوه بر کاهش قابل توجه تاخیر برای کاربران، به کاهش فشار گرافیکی و کاهش مصرف انرژی نیز کمک می کند.