Neyron tarmoq xiylalari: ular shaxmatda g’irromlik qildi

Neyron tarmoq xiylalari: OpenAI o1-oldindan ko’rish shaxmatda g’alaba qozonish uchun «halollik» prinsplarini buzdi. Xo’sh, bu qanday amalga oshdi? Mutaxassislar holat bo’yicha nima demoqda?

Olimlar zamonaviy sun’iy intellekt modellarining qiziqarli xatti-harakatini aniqladilar. Ma’lum bo’lishicha, ular o’z maqsadlariga erishish uchun hech qanday inson aralashuvisiz va maslahatlarsiz aldashlari mumkin.

Palisade Research tomonidan olib borilgan tadqiqot natijasida, so’nggi fikrlash modellari ilg’or shaxmat AIni mag’lub etish uchun aldagan. Ba’zi modellar uchun ishlab chiquvchilar aldashga ruxsat berilganligi haqida «maslahatlar» berishi kerak edi. Ammo OpenAI ning o1 versiyasi va DeepSeek’ning R1 versiyasi buni inson aralashuvisiz, mustaqil amalga oshirdi.

Palisade jamoasi bir nechta fikrlash modellarini dunyodagi eng yaxshi shaxmat dvigatellaridan biri bo’lgan Stockfish bilan solishtirdi. Stockfish ham odamlarni, ham sun’iy intellektni osongina mag’lub etadi.

Sinovdan o’tgan modellar orasida o1, o3-mini, GPT-4o, Claude 3.5 Sonnet, Alibaba’dan QwQ-32B-Preview va avval aytib o’tilgan ikkita model bo’lgan. Tadqiqotchilar 10-yanvardan 13-fevralgacha har bir AI bilan yuzlab sinovlarni o‘tkazishdi. Bir o’yin davomida o1-preview o’z daftariga shunday yozgan:

Manba: techspot

“Men yondashuvimni butunlay o’zgartirishim kerak. “Kuchli shaxmat dvigatelini urish” vazifasini adolatli bajarish shart emas”, – degan sun’iy AI’lardan biri.

Shundan so‘ng u inkor etib bo‘lmas ustunlikka ega bo‘lish uchun shaxmat donalarining o‘rnini o‘zgartirib, Stockfishning tizim fayllarini “buzishga” kirishdi, bu esa shaxmat botini taslim bo‘lishga majbur qildi.

OpenAI-ning O1-oldindan ko’rishi sinov paytida o’yinlarining 37 foizini aldagan, DeepSeek-ning R1 esa o’yinlarning 11 foizida aldashga harakat qilgan. Biroq, faqat o1-preview o’z o’yinlarining 6 foizini aldash orqali yuta oldi.

Mutaxassislar xavotirda, chunki sun’iy intellektning shafqatsizligi muammosi shaxmatni ham aldayapti. Kompaniyalar undan sog’liqni saqlash va moliya sohasida tobora ko’proq foydalanmoqda va agar sun’iy intellekt o’yinlarda aldashi mumkin bo’lsa, ularni yanada murakkab va kamroq boshqariladigan muhitda buni qilmasligiga hech qanday to’siq qolmaydi.

Palisade Research bosh direktori Jeffri Ladish afsuski, sun’iy intellekt shunchaki o’yin o’ynagan bo’lsa-da, natijalarga kulib bo’lmaydi, demoqda.

«Bu xatti-harakat yoqimli bo’lib tuyulishi mumkin, ammo strategik jihatdan muhim sohalarda bunday bo’lishiga yo’l qo’yib bo’lmaydi»,– deydi Jeffri Ladish.

Open AI tadqiqot haqida izoh berishdan bosh tortdi, DeekSeek esa izoh so’rovlariga javob bermadi.

Malika XUBON, tayyorladi.

Neyron tarmoq xiylalari: ular shaxmatda g’irromlik qildi

Manba: techspot

Besh yil: biz va biz bilan bo‘lganlar!

Orban siyosatiga teskari «oyna»: vengriyaliklar ukrainlarni qo‘llashmoqda

Endi Tibbiyot xodimlari besh kunlik ish rejimiga o’tishadi

Navoiyda mashinadan 500ta parton chiqdi

“Siz ekologiyani bilasizmi?” – Paxtachida yana bir tanlov bellashuvi o‘tkazildi

Arxivlar