امروز : پنج‌شنبه 2بهمنماه 1404 | ساعت : 13 : 17

آخرین اخبار

گفت‌وگوی تلفنی وزرای امور خارجه ایران و مصر

شفقنا- وزرای امور خارجه ایران و مصر طی یک...

ترامپ: توافق صلح اوکراین «به طور معقولی نزدیک» است

شفقنا – دونالد ترامپ، رئیس جمهور آمریکا، روز چهارشنبه...

طلای جهانی سقوط کرد

شفقنا- طلا و سایر فلزات گرانبها در معاملات روز...

نظرسنجی: اکثر آمریکایی‌ها معتقدند که اوضاع کشور در دوران ترامپ «از کنترل خارج شده...

شفقنا – نتایج آخرین نظرسنجی مشترک اکونومیست/یوگاو نشان می‌دهد...

فرمانده کل سپاه: دشمنان از هر گونه خطای محاسباتی پرهیز کنند

شفقنا- فرمانده کل سپاه پاسداران انقلاب اسلامی در پیامی...

گزارش تصویری: سومین آئین بزرگداشت و پیشواز دهه مهدویت در قم

شفقنا- سومین آئین بزرگداشت و پیشواز دهه مهدویت همزمان...

از رسانه ها/ آنچه پیش روی سیاست خارجی است

شفقنا- روزنامه آرمان امروز نوشت: اگر آمریکا و ایران...

از رسانه ها/ سرمایه‌های خارجی کجا رفتند؟

شفقنا- روزنامه دنیای اقتصاد نوشت: سرمایه‌گذاری مستقیم خارجی (FDI)...

تعداد جانباختگان حوادث اخیر 3117 تن اعلام شد / ۲۴۲۷ تن شهید

شفقنا -  بنیاد شهید اعلام کرد: بنا بر اطلاعات...

آیا ممکن است اینترنت به شکل جهانی قطع شود؟

شفقنا- آیا ممکن است قطعی جهانی اینترنت در سراسر...

از رسانه ها/ یمن در وضعیت «نه جنگ و نه صلح»

شفقنا- روزنامه آرمان ملی نوشت:  با در نظر گرفتن...

یک گزارش: نیمی از انتشار کربن جهان از 32 شرکت سوخت فسیلی ناشی می‌شود/...

شفقنا- منتقدان، شرکت‌های پیشرو را به کارشکنی در اقدامات...

ارتش کانادا سناریوی حمله به آمریکا را مدل‌سازی می‌کند

شفقنا – روزنامه گلوب اند میل روز سه‌شنبه به...

ترامپ: محل جسد آخرین زندانی اسرائیلی در غزه مشخص است

شفقنا- دونالد ترامپ، رئیس جمهور آمریکا، در نشست مطبوعاتی...

دیپ‌سیک؛ موفقیتی بزرگ با علامت سوال‌های بزرگتر

شفقنا – مدل‌های هوش مصنوعی دیپ‌سیک با عملکردی رقابتی در حل مسائل ریاضی و کدنویسی و هزینه آموزشی به مراتب کمتر، توجه جامعه علمی را جلب کرده‌اند.

به گزارش سرویس ترجمه شفقنا، اما بررسی‌های دقیق‌تر نشان می‌دهد که مکانیسم درونی «استدلال» این مدل‌ها هنوز یک جعبه سیاه باقی مانده است.

کلید موفقیت: یادگیری تقویتی

دیپ‌سیک به جای استفاده از هزاران داده برچسب‌زده انسانی، مدل‌هایش (مانند R1-Zero و R1) را عمدتاً از طریق آزمون و خطا آموزش داده است:

مدل در مواجهه با یک مسئله، چندین راه‌حل احتمالی را تولید می‌کند.

اگر هر کدام از این راه‌حل‌ها درست باشد، یک پاداش دریافت می‌کند.

این فرآیند شبیه حل پازل توسط انسان، بدون دریافت راهنمایی صریح است.

مزیت بزرگ: این روش نسبت به آموزش نظارت‌شده سنتی، به داده انسانی کمتر و قدرت محاسباتی کم‌تری نیاز دارد و از نظر هزینه مقرون به‌صرفه‌تر است.

با این حال، این روش ایراداتی دارد که ماهیت «استدلال» مدل را زیر سؤال می‌برد:

۱. پاداش بر اساس نتیجه، نه فرآیند:
مدل تنها برای جواب درست نهایی پاداش می‌گیرد، حتی اگر برخی مراحل میانی آن نادرست یا غیرمنطقی باشند. این باعث می‌شود نتوان مطمئن بود که مدل واقعاً فرآیند استدلال صحیح را یاد گرفته است یا فقط خروجی درست را به خاطر سپرده است.

۲. خطر حفظ کردن:
با توجه به اینکه مدل پایه (V3 Base) روی حجم عظیمی از داده‌های اینترنتی (که ممکن است شامل خروجی مدل‌های دیگر هم باشد) آموزش دیده، ممکن است پاسخ مسائل معروف را به خاطر سپرده باشد، نه اینکه واقعاً آن‌ها را حل کند.

۳. توهم استدلال انسانی:
مدل طوری آموزش دیده که قبل از ارائه جواب نهایی، یک «فرآیند فکری» شبیه انسان تولید کند (مثلاً بنویسد: «بذار فکر کنم… آها! فهمیدم»). اما این متن لزوماً بازتاب واقعی فرآیند داخلی مدل نیست و ممکن است صرفاً یک قالب ساختگی برای نمایش باشد.

واکنش جامعه علمی: تحسین همراه با احتیاط

دیپ‌سیک با انتشار جزئیات مدل در مجله نیچر و در معرض داوری همتا قرار دادن آن، گامی به سوی شفافیت برداشته است. با این حال، درک ما از چگونگی استدلال این مدل‌ها هنوز بسیار محدود است.

تفسیر نادرست از توانایی‌های مدل ممکن است منجر به اعتماد بیش از حد انسان‌ها به خروجی هوش مصنوعی، بدون نقد و بررسی منطقی آن شود.

پیشرفت تکنیکی مهم، اما نه معجزه
دیپ‌سیک نشان داده که با مدیریت هوشمندانه منابع و روش‌های آموزشی جایگزین می‌توان به عملکردی رقابتی دست یافت. این دستاوردی ارزشمند برای دموکراتیک‌سازی دسترسی به هوش مصنوعی پیشرفته است.

اما باید مراقب باشیم که عملکرد خوب در آزمون‌های استاندارد را با درک واقعی و استدلال شبه‌انسانی اشتباه نگیریم. هنوز راه زیادی تا درک کامل آنچه درون این مدل‌ها می‌گذرد، باقی است.

این خبر را اینجا ببینید.

اخبار مرتبط
اخبار مرتبط

پاسخ دیدگاه

لطفا نظر خود را وارد کنید
نام خود را بنویسید