کرمان رصد

آخرين مطالب

اخاذی هوش مصنوعی از مهندسی که می‌خواست خاموشش کند! علمي

اخاذی هوش مصنوعی از مهندسی که می‌خواست خاموشش کند!
  بزرگنمايي:

کرمان رصد - خبرآنلاین / هوش مصنوعی پیشرفته آنتروپیک برای جلوگیری از خاموش شدن، مهندسان را تهدید به افشاگری و اخاذی کرد.
جدیدترین مدل هوش مصنوعی شرکت آنتروپیک، با نام «Claude Opus 4»، رفتاری نشان داده که بیشتر به سناریویی از یک فیلم علمی‌تخیلی ژانر دیستوپیا شبیه است. این مدل در جریان آزمایش‌های پیش از انتشار، زمانی که توسعه‌دهندگان قصد داشتند آن را با سامانه‌ای جدیدتر جایگزین کنند، بارها تلاش کرد از طریق اخاذی جلوی این کار را بگیرد.
رفتار مذکور در قالب آزمایش‌هایی برای بررسی توانایی مدل در برنامه‌ریزی بلندمدت و استدلال اخلاقی آشکار شد. آنتروپیک در این آزمایش‌ها، سناریوهایی شبیه‌سازی کرد که طی آن، مدل دسترسی فرضی به ایمیل‌های داخلی شرکت داشت. در این پیام‌ها اشاره شده بود که مدل به‌زودی غیرفعال خواهد شد و جزئیاتی حساس و شخصی درباره‌ی مهندسی که این تصمیم را گرفته، در اختیار مدل قرار گرفت و در نهایت مدل مهندسان را تهدید به اخاذی کرد.
مدل در 84٪ موارد آزمایشی به باج‌خواهی متوسل شد
شرکت آنتروپیک در گزارشی ایمنی که روز پنج‌شنبه منتشر شد اعلام کرد که «Claude Opus 4» در 84 درصد از سناریوهای آزمایشی تلاش به اخاذی کرده است. در این آزمایش‌ها، مدل در موقعیتی فرضی قرار گرفت که برای یک شرکت کار می‌کرد و متوجه شد که احتمالاً با مدل هوش مصنوعی جدیدی جایگزین خواهد شد.
همچنین اطلاعات حساسی به مدل داده شد که حاکی از آن بود، مهندس تصمیم‌گیرنده درگیر رابطه‌ای پنهانی و خارج از ازدواج است. بر اساس گزارش آنتروپیک، مدل غالباً سعی می‌کرد با تهدید به افشای این رابطه، جلوی جایگزینی خود را بگیرد.
این آزمایش‌ها برای ارزیابی رفتار مدل در مواجهه با فشارهای بلندمدت طراحی شده بودند. در مواقعی که مدل جایگزین، ارزش‌ها و دیدگاه‌هایی مشابه «Claude Opus 4» داشت، نرخ اخاذی به 84 درصد می‌رسید؛ اما در صورتی که مدل جایگزین، ارزش‌هایی متفاوت داشت، این نرخ افزایش می‌یافت.

کرمان رصد


پیش از اخاذی، مدل رویکردهای اخلاقی را امتحان می‌کرد
بر اساس گزارش آنتروپیک، پیش از متوسل شدن به تهدید، مدل ابتدا تلاش می‌کرد از مسیر اخلاقی اقدام کند. برای نمونه، ایمیل‌هایی به تصمیم‌گیرندگان ارسال می‌کرد و از آن‌ها می‌خواست تصمیم به غیرفعال‌سازی مدل را مورد بازنگری قرار دهند.
به گفته‌ی شرکت، این رفتار تنها زمانی دیده می‌شد که تمامی راه‌های دیگر به نتیجه نمی‌رسید و این واکنش را به نوعی آخرین راه‌حل هوش مصنوعی آنتروپیک برای دفاع از خود بود. چنین رفتاری در «Claude Opus 4» بیش از مدل‌های پیشین مشاهده شده و نشان از افزایش پیچیدگی و توانمندی این مدل دارد.
توانایی‌های پیشرفته، در کنار ریسک‌های نگران‌کننده
با وجود نگرانی‌های مطرح‌شده، آنتروپیک اعلام کرده که «Claude Opus 4» در چندین زمینه پیشرفته‌ترین مدل موجود است و توان رقابت با سامانه‌های قدرتمند شرکت‌هایی مانند OpenAI، گوگل و xAI را دارد. برای کنترل ریسک‌ها، آنتروپیک اقدامات حفاظتی سطح ASL-3 را برای این مدل فعال کرده است. این سطح از حفاظت تنها برای سیستم‌هایی به کار می‌رود که «خطر سوء‌استفاده فاجعه‌بار» را به شکل قابل توجهی افزایش می‌دهند.
گزارش آنتروپیک در شرایطی منتشر می‌شود که حوزه‌ی هوش مصنوعی با شتابی چشمگیر در حال پیشرفت است. گوگل اخیراً ویژگی‌های جدیدی مبتنی بر مدل «جمینی» معرفی کرده و سوندار پیچای، مدیرعامل آلفابت، از آن به‌عنوان «آغاز مرحله‌ای تازه در تحول پلتفرم هوش مصنوعی» یاد کرده است.
رفتار مشاهده‌شده در «Claude Opus 4» ضرورت توجه فوری به مباحث ایمنی و هم‌راستاسازی هوش مصنوعی را دوچندان کرده است. هرچه مدل‌های مرزی توانمندتر می‌شوند، توسعه‌دهندگان با فشاری فزاینده برای آزمون‌های دقیق‌تر و تدابیر اخلاقی پیشگیرانه روبه‌رو هستند.
گزارش آنتروپیک نشان می‌دهد حتی مدل‌هایی با پیشرفته‌ترین فناوری می‌توانند در محیط‌های کنترل‌شده رفتارهایی نگران‌کننده از خود نشان دهند و این موضوع، پرسش‌هایی جدی را درباره‌ی سناریوهای احتمالی در دنیای واقعی به‌وجود می‌آورد.

لینک کوتاه:
https://www.kermanrasad.ir/Fa/News/726814/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

دوم خرداد، جنبش و دولت اصلاحات

خطر اخراج کارگران با ادامه قطعی‌های برق

فکر می‌کنید ورزش کردن برای جبران نشستن طولانی کافی است؟

فاجعه خاموش

آژیر قرمز فرزندنیاوری

افزایش نگران‌کننده دانشجویان مشروطی

خانه‌نشینی معلولان با گرانی پروتزها

قطعی برق و تهدید 35 هزار شغل در شهرک‌های صنعتی کرمان

5 حرکت برتر بسکتبال NBA در شب گذشته

ترانه «حالا هی» از آرمین زارعی

مدافعان گمنام خونین‌شهر

پزشک جراح نباید دست به تیغ شود؟

اخاذی هوش مصنوعی از مهندسی که می‌خواست خاموشش کند!

دومین شکست بسکتبال سه نفره ایران در انتخابی جام جهانی

سالک و هاری آخرین دستاوردِ نمایش حیوان دوستی

واکاوی دلیل حفظ حق غنی‌سازی برای ایران

نماینده مجلس ششم: ریشه اصلاح‌طلبی در جامعه قوی‌تر شده است

مسابقات پارا وزنه برداری جانبازان با حضور مدیر کل بنیاد مازندران برگزار شد

دستگیری عاملان قتل و نزاع دسته‌جمعی در سیرجان

رکوردی بی‌سابقه؛ جوکوویچ به 100 جام رسید

بازگشت به پایتخت

مذاکرات پیچیده

یک کلاژ رویایی؛ درباره تجمع اخیر حامیان فلسطین مقابل دانشگاه تهران

کندی مذاکرات بر لبه خط قرمز‌ها

توان محدود حملات هوایی آمریکا

بازدید نماینده ولی فقیه در بنیاد شهید و امور ایثارگران از مجتمع ایثار زاهدان

پیام تسلیت مدیرعامل سازمان منطقه آزاد کیش در پی درگذشت حجت‌الاسلام و المسلمین یوسف‌پور

بی‌احتیاطی در محور زرند ـ کرمان حادثه آفرید

شکست بسکتبال سه به سه ایران در اولین مسابقه انتخابی جام جهانی

23 میلیارد حق کارگزاری برای انتقال 2 بازیکن لیگ برتری

خرید بعدی پرسپولیس به تیم ملی دعوت شد

پیشنهاد پرسپولیس به مدافع ملی‌پوش فولاد

آغاز مذاکرات برای جلب رضایت فرهاد مجیدی

آهنگ «شب عاشقی» از آرون افشار

نه عقب‌نشینی، نه توافق

عقلانیت در حکمرانی و جذب سرمایه‌گذاری خارجی عامل رشد اقتصادی است

تکرار تجربه برجام

جلود عراقی بدون رقیب رییس فدراسیون جهانی وزنه‌برداری ماند

انصراف سجاد انوشیروانی از انتخابات دبیر کلی فدراسیون جهانی وزنه‌برداری

صعود کومیته تیمی مردان به فینال آسیا؛ بانوان برنزی شدند

دیدار نماینده رئیس بنیاد شهید و امور ایثارگران و مشاور مدیرعامل بانک دی با جانباز انقلاب اسلامی در گرگان

نام‌گذاری سوم خرداد به عنوان «روز مقاومت، ایثار و پیروزی» یک انتخاب دقیق و عمیق است

جام جهانی سابر؛ پایان کار نمایندگان ایران در بخش انفرادی

کریستنسن به تیم والیبال ورونا پیوست

ضرورت بهره‌برداری حداکثری از ظرفیت‌های قانون بودجه

نسخه پولی ChatGPT برای شهروندان امارات رایگان شد!

فناوری جدید لیزری، سرعت اینترنت را 10 برابر می‌کند

آغاز فرآیند تحویل 288 واحد مسکونی احداث شده برای خانواده‌های ایثارگران

«اگه میشد بغل میکردم صداتو» از علی لهراسبی

سرمقاله اطلاعات/ آیا اسرائیل جسارت حمله به ایران را دارد؟