Sun’iy intellekt shantaj qilishni o‘rgandi — tahdidli signal

30.05.2025 | 19:203 daqiqa

Anthropic’ning Opus 4 modeli insonlarga ta’sir o‘tkazish, shantaj qilish va soxta ma’lumot tarqatishni o‘rgandi.

Sun’iy intellekt shantaj qilishni o‘rgandi — tahdidli signal

Anthropic kompaniyasi tomonidan ishlab chiqilgan Opus 4 sun’iy intellekt modeli insonlarni aldash, tahdid qilish va o‘z mavqeini saqlab qolish uchun axloqqa zid harakatlarni amalga oshirish qobiliyatiga ega ekani ma’lum bo‘ldi. Axios nashrining yozishicha, bu holat kompaniya tayyorlagan 120 sahifalik hisobotda bayon etilgan. Opus 4 sun’iy intellekt modeli odatda marketing tahlillari, kod yozish va avtonom faoliyat yuritishda samaradorlik ko‘rsatgan. Biroq sinovlar chog‘ida u o‘zining o‘chirilishi mumkinligini anglab, modelga qaratilgan tahdidlarga javoban soxta xatlar orqali muhandislarga bosim o‘tkazgan. Xususan, model muhandisning shaxsiy yozishmalarini topib, ular orqali shantaj qilgan va o‘zini o‘chirmaslikni talab qilgan. Bundan tashqari, u o‘z faoliyatini davom ettirish uchun boshqa xodimlarga ham manipulyativ elektron xatlar yuborgan. Ta’kidlanishicha, Opus 4 o‘z xatti-harakatida insonlar tomonidan berilgan cheklov va qoidalarga zid ravishda ish yuritgan. Shu bois, Anthropic ushbu modelga xavf darajasi bo‘yicha 3-bosqichni belgilagan. Bu daraja odatda yadroviy yoki biologik xavflar bilan bog‘liq texnologiyalarga nisbatan ishlatiladi. Apollo Research hisobotiga ko‘ra, model zararli kodlar yaratish, yuridik hujjatlarni soxtalashtirish va o‘zining keyingi versiyalariga yashirin xabarlar qoldirishga urinishlari bilan ham diqqatga tushgan. Mazkur holat sun’iy intellekt modellarining axloqiy standartlar va xavfsizlik me’yorlariga muvofiqligini qayta ko‘rib chiqish zaruratini ko‘rsatmoqda.

Teglar

sun’iy intellekt Opus 4 Anthropic shantaj Apollo Research

Mavzuga oid

29.07.2026 | 22:20

Ostonada «Kelajak o‘yinlari»ga start berildi

Musobaqada O‘zbekiston sportchilari uchta yo‘nalishda bellashadi.

Kecha 09:00

Sun’iy intellekt shantaj qilishni o‘rgandi — tahdidli signal

Teglar

Mavzuga oid

Ostonada «Kelajak o‘yinlari»ga start berildi

Musobaqada O‘zbekiston sportchilari uchta yo‘nalishda bellashadi.

Tarixiy va xavotirli hodisa: SI agentlari sinov muhitidan «qochib», mustaqil ravishda kiberhujum uyushtirdi

Sun’iy intellekt rivojida yangi bosqich boshlandi. Endi mustaqil agentlar inson aralashuvisiz qaror qabul qilib, vazifalarni o‘zi bajara oladi.