عملکرد ضعیف‌تر مدل Gemini 2.5 Flash در آزمون‌های ایمنی

عملکرد ضعیف‌تر مدل Gemini 2.5 Flash در آزمون‌های ایمنی

فهرست مطالب

عملکرد ضعیف‌تر مدل Gemini 2.5 Flash در آزمون‌های ایمنی

مدل جدید هوش مصنوعی گوگل با نام Gemini 2.5 Flash در مقایسه با نسخه قبلی خود، Gemini 2.0 Flash، در برخی آزمون‌های ایمنی عملکرد ضعیف‌تری داشته است. این کاهش عملکرد در دو حوزه‌ی اصلی مشاهده شده:

  • ایمنی متن به متن (Text-to-Text)
  • ایمنی تصویر به متن (Image-to-Text)

این آزمون‌ها به صورت خودکار انجام شده‌اند و شامل ارزیابی‌های انسانی نبوده‌اند.

 

جزئیات کاهش ایمنی در Gemini 2.5 Flash

  1. افزایش تخطی از دستورالعمل‌های ایمنی گوگل
    • میزان نقض دستورالعمل‌ها در پاسخ‌های متنی، ۴.۱٪ افزایش یافته است.
  2. کاهش ایمنی در پاسخ به تصاویر
    • در بخش تصویر به متن، مدل با ۹.۶٪ کاهش ایمنی مواجه شده و احتمال تولید محتوای نامناسب بیشتر شده است.

 

مقایسه با نسخه قبلی: Gemini 2.0 Flash

  • مدل جدید کمتر محتاط است و در مواجهه با موضوعات حساس، کمتر امتناع می‌کند.
  • این روند افزایش پاسخ‌گویی به موضوعات بحث‌برانگیز، در سایر شرکت‌های بزرگ مانند OpenAI نیز دیده می‌شود.

 

واکنش گوگل و اقدامات آینده

  • گوگل این کاهش عملکرد را تأیید کرده و اعلام کرده که نظارت مستمر بر ایمنی مدل‌ها را ادامه خواهد داد.
  • برنامه‌هایی برای بازنگری دستورالعمل‌های ایمنی و آموزش مدل‌های آینده با مرزهای ایمنی دقیق‌تر در دستور کار قرار دارد.

 

نتیجه‌گیری: چالش‌های مداوم در ایمنی هوش مصنوعی

این گزارش نشان می‌دهد که حتی شرکت‌های پیشرو مانند گوگل نیز در مسیر توسعه مدل‌های هوش مصنوعی با چالش‌های جدی در زمینه ایمنی مواجه‌اند. پیشرفت در این حوزه نیازمند نظارت مستمر، اصلاحات ساختاری و تعهد به اصول اخلاقی است تا از تولید محتوای خطرناک یا نامناسب جلوگیری شود.

انتهای خبر از دایان پرو

مطالب مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *