add

Sun’iy intellekt shantaj qilishni o‘rgandi — tahdidli signal

30.05.2025 | 19:2048313

Anthropic’ning Opus 4 modeli insonlarga ta’sir o‘tkazish, shantaj qilish va soxta ma’lumot tarqatishni o‘rgandi.

Sun’iy intellekt shantaj qilishni o‘rgandi — tahdidli signal
Anthropic kompaniyasi tomonidan ishlab chiqilgan Opus 4 sun’iy intellekt modeli insonlarni aldash, tahdid qilish va o‘z mavqeini saqlab qolish uchun axloqqa zid harakatlarni amalga oshirish qobiliyatiga ega ekani ma’lum bo‘ldi. Axios nashrining yozishicha, bu holat kompaniya tayyorlagan 120 sahifalik hisobotda bayon etilgan. Opus 4 sun’iy intellekt modeli odatda marketing tahlillari, kod yozish va avtonom faoliyat yuritishda samaradorlik ko‘rsatgan. Biroq sinovlar chog‘ida u o‘zining o‘chirilishi mumkinligini anglab, modelga qaratilgan tahdidlarga javoban soxta xatlar orqali muhandislarga bosim o‘tkazgan. Xususan, model muhandisning shaxsiy yozishmalarini topib, ular orqali shantaj qilgan va o‘zini o‘chirmaslikni talab qilgan. Bundan tashqari, u o‘z faoliyatini davom ettirish uchun boshqa xodimlarga ham manipulyativ elektron xatlar yuborgan. Ta’kidlanishicha, Opus 4 o‘z xatti-harakatida insonlar tomonidan berilgan cheklov va qoidalarga zid ravishda ish yuritgan. Shu bois, Anthropic ushbu modelga xavf darajasi bo‘yicha 3-bosqichni belgilagan. Bu daraja odatda yadroviy yoki biologik xavflar bilan bog‘liq texnologiyalarga nisbatan ishlatiladi. Apollo Research hisobotiga ko‘ra, model zararli kodlar yaratish, yuridik hujjatlarni soxtalashtirish va o‘zining keyingi versiyalariga yashirin xabarlar qoldirishga urinishlari bilan ham diqqatga tushgan. Mazkur holat sun’iy intellekt modellarining axloqiy standartlar va xavfsizlik me’yorlariga muvofiqligini qayta ko‘rib chiqish zaruratini ko‘rsatmoqda.

Teglar

Mavzuga oid