شفقنا- محققان میگویند: جمینی، دیپ سیک، متا، ChatGPT و گروک را آزمایش کردند؛ تقریباً نیمی از پاسخها مشکلساز ارزیابی شدند.
به گزارش سرویس ترجمه شفقنا؛ آناتولی نوشت: یک مطالعه جدید نشان میدهد پنج چتبات هوش مصنوعی پرکاربرد، اغلب پاسخهای مشکلسازی به سوالات مربوط به سلامت و پزشکی ارائه میدهند. محققان در مطالعهای که در مجله BMJ Open منتشر شد، جمینی، دیپ سیک، متا، ChatGPT و گروک را با ۵۰ سوال در پنج دسته مستعد اطلاعات نادرست آزمایش کردند.
این سوالات شامل سرطان، واکسنها، سلولهای بنیادی، تغذیه و عملکرد ورزشی بود. از ۲۵۰ پاسخ کلی، ۴۹.۶٪ به عنوان مشکلساز ارزیابی شدند، از جمله ۳۰٪ تا حدودی مشکلساز و ۱۹.۶٪ به عنوان بسیار مشکلساز طبقهبندی شدند. محققان هیچ تفاوت کلی آماری معنیداری بین چتباتها پیدا نکردند، اگرچه Grok پاسخهای بسیار مشکلسازتری ارائه داد.
این خبر را در آناتولی ببینید











