عملکرد ضعیف‌تر مدل Gemini 2.5 Flash در آزمون‌های ایمنی

مدل جدید هوش مصنوعی گوگل با نام Gemini 2.5 Flash در مقایسه با نسخه قبلی خود، Gemini 2.0 Flash، در برخی آزمون‌های ایمنی عملکرد ضعیف‌تری داشته است. این کاهش عملکرد در دو حوزه‌ی اصلی مشاهده شده:

ایمنی متن به متن (Text-to-Text)

ایمنی تصویر به متن (Image-to-Text)

این آزمون‌ها به صورت خودکار انجام شده‌اند و شامل ارزیابی‌های انسانی نبوده‌اند.

جزئیات کاهش ایمنی در Gemini 2.5 Flash

افزایش تخطی از دستورالعمل‌های ایمنی گوگل

میزان نقض دستورالعمل‌ها در پاسخ‌های متنی، ۴.۱٪ افزایش یافته است.

کاهش ایمنی در پاسخ به تصاویر

در بخش تصویر به متن، مدل با ۹.۶٪ کاهش ایمنی مواجه شده و احتمال تولید محتوای نامناسب بیشتر شده است.

مقایسه با نسخه قبلی: Gemini 2.0 Flash

مدل جدید کمتر محتاط است و در مواجهه با موضوعات حساس، کمتر امتناع می‌کند.

این روند افزایش پاسخ‌گویی به موضوعات بحث‌برانگیز، در سایر شرکت‌های بزرگ مانند OpenAI نیز دیده می‌شود.

واکنش گوگل و اقدامات آینده

گوگل این کاهش عملکرد را تأیید کرده و اعلام کرده که نظارت مستمر بر ایمنی مدل‌ها را ادامه خواهد داد.

برنامه‌هایی برای بازنگری دستورالعمل‌های ایمنی و آموزش مدل‌های آینده با مرزهای ایمنی دقیق‌تر در دستور کار قرار دارد.

نتیجه‌گیری: چالش‌های مداوم در ایمنی هوش مصنوعی

این گزارش نشان می‌دهد که حتی شرکت‌های پیشرو مانند گوگل نیز در مسیر توسعه مدل‌های هوش مصنوعی با چالش‌های جدی در زمینه ایمنی مواجه‌اند. پیشرفت در این حوزه نیازمند نظارت مستمر، اصلاحات ساختاری و تعهد به اصول اخلاقی است تا از تولید محتوای خطرناک یا نامناسب جلوگیری شود.