عملکرد ضعیفتر مدل Gemini 2.5 Flash در آزمونهای ایمنی
مدل جدید هوش مصنوعی گوگل با نام Gemini 2.5 Flash در مقایسه با نسخه قبلی خود، Gemini 2.0 Flash، در برخی آزمونهای ایمنی عملکرد ضعیفتری داشته است. این کاهش عملکرد در دو حوزهی اصلی مشاهده شده:
- ایمنی متن به متن (Text-to-Text)
- ایمنی تصویر به متن (Image-to-Text)
این آزمونها به صورت خودکار انجام شدهاند و شامل ارزیابیهای انسانی نبودهاند.
جزئیات کاهش ایمنی در Gemini 2.5 Flash
- افزایش تخطی از دستورالعملهای ایمنی گوگل
- میزان نقض دستورالعملها در پاسخهای متنی، ۴.۱٪ افزایش یافته است.
- کاهش ایمنی در پاسخ به تصاویر
- در بخش تصویر به متن، مدل با ۹.۶٪ کاهش ایمنی مواجه شده و احتمال تولید محتوای نامناسب بیشتر شده است.
مقایسه با نسخه قبلی: Gemini 2.0 Flash
- مدل جدید کمتر محتاط است و در مواجهه با موضوعات حساس، کمتر امتناع میکند.
- این روند افزایش پاسخگویی به موضوعات بحثبرانگیز، در سایر شرکتهای بزرگ مانند OpenAI نیز دیده میشود.
واکنش گوگل و اقدامات آینده
- گوگل این کاهش عملکرد را تأیید کرده و اعلام کرده که نظارت مستمر بر ایمنی مدلها را ادامه خواهد داد.
- برنامههایی برای بازنگری دستورالعملهای ایمنی و آموزش مدلهای آینده با مرزهای ایمنی دقیقتر در دستور کار قرار دارد.
نتیجهگیری: چالشهای مداوم در ایمنی هوش مصنوعی
این گزارش نشان میدهد که حتی شرکتهای پیشرو مانند گوگل نیز در مسیر توسعه مدلهای هوش مصنوعی با چالشهای جدی در زمینه ایمنی مواجهاند. پیشرفت در این حوزه نیازمند نظارت مستمر، اصلاحات ساختاری و تعهد به اصول اخلاقی است تا از تولید محتوای خطرناک یا نامناسب جلوگیری شود.
انتهای خبر از دایان پرو



