جدول ارزیابی Depsic برتری V3 را در بسیاری از شاخص های کد و ریاضی نشان می دهد
مایل برقیپلیس سابق Openai بر اساس استدلال با یک زنجیره زنجیره ای ، دو ترفند را برای تقویت مؤثرتر فراخوانی می کند. برای بیان آن ، DiPSIC از یک تکنیک نسبتاً جدید استفاده می کند که به مدل اجازه می دهد تا رفتار انسان را تقلید کند ، قدم به قدم و حل مشکلات از طریق تجربه و اشتباه (آموزش تقویت). این روش به مدل امکان دستیابی به عملکرد مدل OPNI را با قدرت محاسباتی و هزینه های کمتری می دهد.
نسخه سوم و دوم Deepseek اساساً همان نوع مدل های مورد استفاده در GPT-4 است ، اما با یک مهندسی بیشتر برای افزایش عملکرد پردازنده های گرافیکی.
جدید مایل برقیبشر یک محقق سابق سیاست OpenAi
البته آزمایشگاههای دیگر نیز از این روشها استفاده می کنند. به عنوان مثال ، روش “مخلوط کارشناسان” ، که از آن در آموزش مدل های خود استفاده می شود ، در GPT-4 نیز استفاده می شود. این روش فقط برای بخش های خاصی از مدلی که برای آنها در فرآیند پردازش با کمک یک متخصص مفید است ، فراهم می کند ، هر یک در پردازش یک نوع خاص از داده ها واجد شرایط هستند ، بنابراین با افزایش دقت ، هزینه ها و قدرت پردازش را کاهش می دهند. هزینه ها و پردازش.
اما با ایجاد دسته های تخصصی تر و ایجاد یک روش مؤثرتر برای برقراری ارتباط بین این بخش ها ، Deepsic تکنیک MOD را بهبود بخشید و کل فرایند یادگیری را بهینه می کند. علاوه بر این ، محققان DeepSic روش Latenne چند با پیشرو را بهبود بخشیده اند تا میزان حافظه مورد نیاز برای پردازش درخواست ها را با فشرده سازی فروشگاه های اطلاعاتی و بازیابی روش ها در مدل کاهش دهند. در حقیقت ، آخرین مدل DeepSic چنان بهینه شده است که توسعه آن فقط به فرآیند پردازش پردازنده LLAMA 3.1 نیاز دارد.
در سایه تحریم ها ؛ Deepsik از چه سخت افزاری استفاده می کند؟
یکی از جالب ترین مباحث مربوط به DIPSY ، سخت افزاری است که برای توسعه مدلهای بزرگ زبان استفاده می شود. با توجه به تحریم های ایالات متحده که توانایی دریافت و تولید تراشه های پیشرفته برای ساخت این مدل ها را محدود می کند.
ممنوعیت صادرات تراشه های پیشرفته به چین ، که از ماه اکتبر به طور جدی آغاز شد ، نسبتاً جدید است و تأثیر کامل آن هنوز احساس نشده است. با این حال ، به نظر می رسد که ایالات متحده و چین رویکردهای متناقضی برای توسعه هوش مصنوعی اتخاذ کرده اند. در حالی که ایالات متحده در حال شرط بندی بر قدرت خام است (مانند پروژه 2 میلیارد دلاری آلتمن با ترامپ) ، Deepsic به دلیل دسترسی به منابع محدود بهینه شده است.
Deepsic می گوید به 6000 تراشه Nvidia A100 دسترسی دارد
dipsic در یک مقاله تحقیق وی در ماه آگوست اعلام کرد که وی به مجموعه ای از تراشه های A100 A100 Nvidia که در ماه اکتبر از صادرات به چین ممنوع شده بود ، دسترسی خواهد داشت. در مقاله دیگر در ژوئن همان سال ، دیپسیک خاطرنشان کرد که مدل قدیمی Deepseek-V2 با کمک خوشه های تراشه های NVIDIA H800 تهیه شده است. NVIDIA این تراشه را با توانایی پردازش کوچکتر برای رعایت قوانین کنترل صادرات ایالات متحده ایجاد کرده است.
منابع دیگر تخمین می زنند که DIPSY احتمالاً از حدود 2.5 تراشه Nvidia برای توسعه فناوری خود استفاده کرده است. Nvidia از اظهار نظر در مورد آنچه که تراشه های dipsic استفاده می کردند ، خودداری کرد. با این حال ، سخنگوی ساخت یک تراشه در بیانیه ای گفت که “DiPic پیشرفت چشمگیری در صنعت هوش مصنوعی داشته است” و افزود که روش راه اندازی برای آموزش مدل “به تعداد قابل توجهی از پردازنده های گرافیکی NVIDIA و شبکه های پردازش قدرتمند نیاز دارد .
دانشمند ارشد Dipsy قبلاً کارمند Nvidia بود
نکته جالب این است که دانشمند ارشد Dip -sub ، Zizjang Penn ، این که نقش اصلی در توسعه Deepseek-VL2 و Deepseek-V3 و Deepseek-R1 نقش اساسی داشت ، او پیش از این کارمند Nvidia بود. به گفته او یو یو ، یک دانشمند ارشد علمی در Nvidia ، “Zigang در تابستان یکی از کارآموزان ما در Nvidia بود. بعداً ، هنگامی که ما قصد داشتیم اجاره کامل را به او پیشنهاد دهیم ، در آن زمان به Depsic پیوست.”
مهم نیست که تراشه مدل های Dipsy چه چیزی ایجاد شده است ، به نظر می رسد که امروزه رویکرد منبع باز در زمینه هوش مصنوعی در حال افزایش تأثیر و محبوبیت است. این یک زنگ هشدار برای شرکت های بسته مانند Openai است ، یک روز او می خواست اولین شرکت در جهان باشد که به AGI می رسد.
چرا Deepsic جهان را غافلگیر کرد؟
هوش مصنوعی نیاز به محاسبات عظیم و هزینه های بالا دارد. تا آنجا که قدرتمندترین رهبران فناوری در ایالات متحده نیروگاه های هسته ای را برای تأمین برق مورد نیاز برای مدلهای هوش مصنوعی خود خریداری می کنند.
چندی پیش ، متا اعلام کرد که امسال بیش از 5 میلیارد دلار برای توسعه هوش مصنوعی هزینه خواهد کرد. Openai همچنین سال گذشته تخمین زده است که صنعت اطلاعات مصنوعی برای ارائه تراشه های پیشرفته به یک تریلیون دلار سرمایه گذاری نیاز دارد.
بنابراین ، این ایده که مدل هایی با عملکردهای مشابه از قدرتمندترین هوش مصنوعی در ایالات متحده می توانند با قیمتی بسیار کمتری توسعه دهند و با تراشه های بسیار بزرگتر ، صنعت را درک می کند که میزان سرمایه گذاری مورد نیاز در زمینه هوش مصنوعی را درک کند.
هوش مصنوعی منتقدان و مخالفان زیادی دارد ، اما حامیان آن نوید آینده ای پر سود را دارند. به عنوان مثال ، لیزا سو ، مدیرعامل AMD ، تأثیر هوش مصنوعی بر زندگی روزمره و تحقیقات آینده انسانی مانند تأثیر اینترنت ، ظاهر تلفن های هوشمند و فضای ابری را بررسی می کند و معتقد است که آنچه اکنون از هوش مصنوعی می بینیم تنها است مشاوره در کوه یخ.
اگر چنین قدرت تحول آمیز می تواند به چنین هزینه کم برسد ، جهان با فرصت های جدید و البته تهدیدهای جدید روبرو خواهد شد.
در همین حال ، شرکتی که بیشترین استفاده را از این فناوری نوظهور داشته است ، Nvidia است که تراشه های پیشرفته ای را که توسط شرکت های اطلاعاتی مصنوعی استفاده می شود ، تولید می کند. تصور سرمایه گذاران این بود که در طول “تب طلای هوش مصنوعی” ، خرید سهام NVIDIA به معنای سرمایه گذاری در شرکتی است که صنعت را تولید می کند. مهم نیست که کدام شرکت در نهایت برنده رقابت هوش مصنوعی خواهد شد. از آنجا که همه آنها برای راه اندازی مدل های خود به تراشه های NVIDIA زیادی احتیاج دارند. این مفهوم به 2 دلار در 5 دسامبر ، ارزش سهام NVIDIA کمک کرد. تقریباً 5 برابر بزرگتر از ارزش آن در اوایل ژانویه.
چگونه Deepsik سالها Openai را فقط در چند ماه تولید مثل کرد؟
اما موفقیت Dipsic این ایده را مطرح می کند که افزایش نجومی در ارزش سهام NVIDIA. اگر این استارتاپ واقعاً راهی برای استفاده از آنها با کارآمدتر پیدا کرده باشد ، به جای اینکه فقط تراشه های بیشتری بخرید ، سایر شرکت ها یکسان خواهند بود. این تغییر می تواند منجر به کاهش تقاضا برای مدرن ترین تراشه های Nvidia شود. زیرا شرکت ها همیشه در تلاشند تا هزینه های خود را کاهش دهند.
اما کمتر برای جنبه دیگری از تاریخ ؛ چگونه Dipician در طی چند ماه موفق به بازتولید سود چند ساله Openai شد. TSMC -OPP OPP برای Chip World خود را به عنوان تنها شرکتی قادر به توسعه هوش مصنوعی پیشرفته معرفی کرده است و با این تصویر سرمایه گذاران را به دست آورده است تا بزرگترین هوش مصنوعی جهان را بسازند. اما دستاوردهای Dip -Sick One -Right نشان می دهد که برتری فنی با دوام نیست. حتی وقتی شرکت ها سعی می کنند روش های خود را محرمانه نگه دارند.
بخشی از ارزش شرکت های بسته مانند Openai به افراد بستگی دارد که فکر کنند آنها کارهای مهمی را انجام می دهند که فراتر از قدرت بسیاری از شرکت ها هستند. این امر برای ایجاد تبلیغات و جذب سرمایه بیشتر یا توسعه پروژه های جدید ضروری است. اما Deepsic نشان داده است که برای رسیدن به خارج از منزل به صدها میلیون دلار نیازی ندارد. جای تعجب نیست که این حداقل چند ساعت از بازار سهام ایالات متحده ترسیده است.
موفقیت دیپسیک برای آینده هوش مصنوعی به چه معناست؟
موفقیت DIP -SUCCESS نشان داده است که پاشش مالی تضمینی برای برتری نیست. با این حال ، برخی از کارشناسان می گویند که شرکت برای هزینه نهایی آموزش این مدل می گوید و می گوید هزینه ها بسیار بیشتر از هزینه های اعلام شده است.
برخی بر این باورند که محدودیت های صادراتی به ایالات متحده شکست خورده است و آنها را به جای کند کردن پیشرفت تکنولوژیکی چین ، آنها را به سمت نوآوری وادار کرده است. برای برخی ، موفقیت Deepsic نشان دهنده از دست دادن برتری هوش مصنوعی آمریکا است.
برخی بر این باورند که این یک وضعیت متقاطع است و بورس و صنعت اطلاعات مصنوعی به کشور قبلی باز خواهد گشت. اما تعدادی از متخصصان این موضوع را نشانه تکامل تکنولوژیکی می دانند. به جای تلاش برای ایجاد مدل های بزرگتر و گرانتر ، شرکت های اطلاعاتی مصنوعی اکنون بیشتر بر توسعه فرصت های پیشرفته مانند استدلال و منطق متمرکز شده اند.