MOSKVA, 29-noyabr. Rossiyalik olimlar tez kontekstli mustahkamlashni o'rganish uchun birinchi ochiq muhitni yaratdilar (kontekstda RL). Bu haqda T-Bank AI Research sun'iy intellekt tadqiqot laboratoriyasida ma'lum qilindi.
«T-Bank AI Research sun'iy intellekt tadqiqot laboratoriyasi va AIRI instituti olimlari MIPT, Skoltech va Innopolis talabalari ishtirokida tadqiqot uchun birinchi ochiq muhitni yaratdilar va kontekstli mustahkamlashni o'rganish sohasida algoritmlarni ishlab chiqdilar – Xland – MiniGrid”, – deyiladi xabarda.
Laboratoriyada tushuntirilganidek, XLand-MiniGrid butun dunyo bo'ylab tadqiqotchilar uchun jamoat mulki sifatida nashr etilgan virtual muhit bo'lib, unda sun'iy intellekt (AI) uzoq muddatli treningni talab qiladigan, lekin o'zaro ta'sirni talab qiladigan «noldan» emas, balki qarorlar qabul qilish va yangi harakatlarni bajarishga o'rgatiladi. ishoralar va kontekstdan foydalangan holda atrof-muhit bilan.
Xland-MiniGrid’dagi testlar Google DeepMind, Berklidagi Kaliforniya universiteti va Oksford universiteti tadqiqotchilari tomonidan amalga oshirildi. Atrof-muhitning yaratilishini tavsiflovchi ilmiy maqola 10-15 dekabr kunlari Vankuverda (Kanada) boʻlib oʻtadigan sunʼiy intellekt sohasidagi eng yirik xalqaro konferentsiya – NeurIPS 2024ga qabul qilindi, deya xabar beradi T-Bank AI Research.
“Biz kontekstli mustahkamlashni o'rganish sohasiga u hali boshlang'ich davrida kirganmiz va shuning uchun yangi g'oyalarni baholash uchun mos vositani topa olmadik. Ko'rinishidan, bu ko'plab mutaxassislar uchun muammo, ya'ni bu vositalardan biri bo'lishi kerak. Vyacheslav Siny, AI Alignment ilmiy guruhining tadqiqotchisi (T-Bank AI Research qismi) birinchi ish hal qilinganini aytdi. Shunday qilib, Xland-MiniGrid paydo bo'ldi. .
AIRI institutining Adaptiv agent ilmiy guruhi rahbari Vladislav Kurenkovning aytishicha, XLand-MiniGrid yangi algoritmlarni yaratishni tezlashtiradi. “Kontekstni mustahkamlash boʻyicha oʻrganish sunʼiy intellekt sohasidagi eng istiqbolli ilmiy yoʻnalishlardan biridir, chunki u tashqi fikr-mulohazalar asosida yangi vaziyatlarga tez moslasha oladigan agentlarni olish imkonini beradi. Biz ishlab chiqqan ramka taqqoslash jarayonini sezilarli darajada tezlashtiradi. va bu sohada yangi algoritmlarni yarating», – dedi Kurenkov, uning so'zlari xabarda.
Ilova
Shuni ta'kidlash kerakki, RL kontekstda, ayniqsa, shaxsiylashtirilgan tavsiyalar, robotlarni boshqarish va avtonom transport vositalari kabi sohalarda foydalidir, bu erda yangi sharoitlarga tezda moslashish kerak bo'ladi.
Shu bilan birga, yirik kompaniyalar kontekstida RL tashqi foydalanuvchilar uchun mavjud emas va ommabop vositalar asosan o'xshash vazifalarni ta'minlaydi va o'rganish oson, bu esa murakkab algoritmlarni ishlab chiqish va sinab ko'rishni qiyinlashtiradi.
Boshqa mavjud muhitlardan farqli o'laroq, Xland-MiniGrid ochiq kirish imkoniyatiga ega bo'lib, o'rganish shartlarini jarayon davomida o'zgartirish imkonini beradi. Bu turli xil murakkablikdagi vazifalarni modellashtirishni soddalashtiradi va sun'iy intellektning yanada moslashuvchan va ishonchli modellarini yaratishga yordam beradi, deyiladi hisobotda.
Atrof-muhit JAX – yuqori samarali dasturlarni ishlab chiqish texnologiyasi asosida yaratilgan. Sekinroq analoglardan farqli o'laroq, Xland-MiniGrid soniyada milliardlab operatsiyalarni bajaradi, deydi T-Bank AI Research.
“XLand-MiniGrid 30 ming vazifada AI harakatlarining 100 milliard misolini o'z ichiga oladi. Bu sizga noldan boshlash o'rniga, mavjud ma'lumotlar to'plamidan trening uchun foydalanish imkonini beradi. Bularning barchasi sohadagi yangi kashfiyotlarga yordam beradi. RL kontekstda, xarajatlarni kamaytiradi va tadqiqot uchun resurslarni tejaydi”, deyiladi bayonotda.