امروز : جمعه 25اردیبهشتماه 1405 | ساعت : 18 : 04

آخرین اخبار

داروی فشار خون سلاح جدیدی علیه سرطان شد

شفقنا - پژوهشگران مرکز سرطان دارتموث کشف کرده‌اند تلومیسارتان،...

آل صادق: ایران برای امنیت و توسعه منطقه در کنار عراق خواهد ماند

شفقنا- سفیر جمهوری اسلامی ایران در عراق، تشکیل دولت...

اسامی معرفی‌شدگان شرکت در مصاحبه دکتری 1405 اعلام شد

شفقنا- رئیس سازمان سنجش آموزش کشور از اعلام اسامی...

عراقچی: «ایران شریک قابل اعتماد همه کشورهای دوست است»

شفقنا- وزیر امور خارجه ایران درباره دیدار با همتای هندی...

نوآوری در تراشه‌های شبیه مغز؛ مصرف انرژی هوش مصنوعی یک‌دهم شد

شفقنا - پژوهشگران دانشگاه علوم و فناوری هوآژونگ و...

بقائی: مردمان کرد، پاسداران غیور استقلال، عزت و تمامیت میهن هستند

شفقنا- سخنگوی وزارت امور خارجه در یکی از شبکه‌های اجتماعی...

رایزنی غریب آبادی با دبیرکل سازمان حقوقی و مشورتی آسیا و آفریقا

شفقنا-«کاظم غریب آبادی»، معاون امور حقوقی و بین‌المللی وزارت...

صعود دختران هندبال ایران به نیمه نهایی قهرمانی آسیا

شفقنا- تیم ملی هندبال زیر ۱۶ سال دختران ایران...

حمایت از تولید تجهیزات راهبردی مخابراتی در دستور کار ستاد اقتصاد دیجیتال

شفقنا- دبیر ستاد توسعه اقتصاد دانش‌بنیان دیجیتال  معاونت علمی...

پایان لیگ برتر هندبال زنان با قهرمانی سپاهان 

شفقنا-در پایان لیگ برتر هندبال زنان تیم سپاهان اصفهان...

عراقچی: زورگویی امریکا باید به زباله دان تاریخ سپرده شود

شفقنا- وزیر امور خارجه جمهوری اسلامی ایران در گزارشی...

دیوان عالی عربستان، خواستار استهلال ماه ذی‌الحجه در روز یکشنبه شد

شفقنا- دیوان عالی عربستان سعودی از عموم مسلمانان در...

دیپ‌سیک روش جدید استدلال هوش مصنوعی را معرفی می‌کند

شفقنا- استارت‌آپ چینی دیپ‌سیک (DeepSeek) با همکاری دانشگاه چینگ‌هوا، تکنیک ترکیبی جدیدی برای بهبود استدلال مدل‌های زبانی بزرگ ارائه کرده که نتایج سریع‌تر و هم‌سوتر با ترجحات انسانی تولید می‌کند.

به گزارش سرویس ترجمه شفقنا، شرکت هوش مصنوعی DeepSeek چین، روشی نوین برای ارتقای قابلیت‌های استدلالی مدل‌های زبانی بزرگ (LLM) معرفی کرده است. این اقدام در حالی صورت می‌گیرد که جامعه فناوری مشتاقانه منتظر عرضه مدل نسل بعدی این شرکت است.

بر اساس مقاله‌ای که به تازگی منتشر شده است، DeepSeek با همکاری پژوهشگران دانشگاه چینگ‌هوا، تکنیکی توسعه داده که دو روش «مدل‌سازی پاداش تولیدی» (GRM) و «تنظیم انتقادی خودمحور» را ترکیب می‌کند. این رویکرد دوگانه به مدل‌های زبانی کمک می‌کند تا پاسخ‌های بهتر و سریع‌تری به پرسش‌های عمومی ارائه دهند.

پژوهشگران در این مقاله ذکر کرده‌اند که مدل‌های DeepSeek-GRM عملکردی رقابتی با مدل‌های پاداش عمومی قوی داشته‌اند. مدل‌سازی پاداش فرآیندی است که مدل‌های زبانی را به سمت ترجیحات انسانی هدایت می‌کند.

به گفته محققان،DeepSeek قصد دارد مدل‌های GRM را به صورت متن‌باز منتشر کند، اما جدول زمانی مشخصی برای این کار ارائه نکرده است.

انتشار این خبر در حالی صورت می‌گیرد که گمانه‌زنی‌ها درباره حرکت بعدی این استارت‌آپ پس از جلب توجه جهانی به مدل پایه V3 و مدل استدلالی R1 آن افزایش یافته است.

ماه گذشته، خبرگزاری رویترز گزارش داد که مدل DeepSeek-R2 که جانشین مدل R1 محسوب می‌شود، ممکن است به زودی و احتمالاً در همین ماه منتشر شود. این شرکت قصد دارد از موقعیت رو به رشد خود نهایت استفاده را ببرد. عرضه مدل DeepSeek-R1 با عملکرد مقرون‌به‌صرفه و رقابتی خود، جامعه فناوری جهانی را تحت تأثیر قرار داد.

این خبر را اینجا ببینید.

اخبار مرتبط
اخبار مرتبط

پاسخ دیدگاه

لطفا نظر خود را وارد کنید
نام خود را بنویسید