+13° Kechasi +6°
Andijon (Bugun, 23 noyabr)
Bugungi valyuta kurslari:

$ 12 844.21 so'm (-11.72 so'mga)
127.35 so'm (-0.81 so'mga)
13 508.26 so'm (-62.46 so'mga)
21-01-2024, 16:09
47

Olimlar:Sun’iy intellekt modellarini aldashga o‘rgatish mumkin

Sun’iy intellekt modellarini aldashga o‘rgatish mumkin, ammo undan himoyalanish hali "samarasiz", deyiladi yangi tadqiqotda. Bu haqda Euronews yozmoqda.

AQShning Anthropic kompaniyasi tadqiqotchilari sun’iy intellekt modellarini aldashga o‘rgatish mumkinligini va xavfsizlikni o‘rgatishning mavjud usullari buning oldini olishda "samarasiz"ligini aniqlashdi.

Tadqiqotning maqsadi sun’iy intellekt modellarini odamlarga o‘xshab aldashga o‘rgatish mumkinligini aniqlashdir.

Tadqiqot davomida ishtirokchilar SI modellarini aldashga o‘rgatish mumkinligini bilib oldilar. Ular ma’lum kirish signallari tomonidan qo‘zg‘atiladigan va juda xavfli bo‘lishi mumkin bo‘lgan «bekdor» deb ataladigan xatti-harakatni yaratish orqali SI modellarini aldashga o‘rgata oldilar.

Tadqiqot ishtirokchilari SI modellari nafaqat aldashni o‘rganibgina qolmay, balki aldashga moyilligini ham yashira olishini aniqlashdi.

Tadqiqot mualliflari lingvistik modellar (LLM) uchun katta xavf tug‘dirishi mumkin bo‘lgan ikkita o‘ziga xos tahdidni ko‘rib chiqdilar: firibgarlar tomonidan ishga tushirilgan modelning ixtirosi va firibgar modelning tabiiy ravishda paydo bo‘lishi.
Top.Mail.Ru Анализ сайта