هوش مصنوعی خودش را شکست می دهد

آتی جو: پژوهشگران می گویند هوش مصنوعی با استفاده از چیزی به نام «یادگیری تقویتی» می تواند خودش را بهبود ببخشد و به عنوان مثال بازی های آتاری را 6000 برابر سریعتر از قبل یاد بگیرد و انجام دهد.

به گزارش آتی جو به نقل از ایسنا و به نقل از انگجت، چیزهای زیادی وجود دارند که مدلهای هوش مصنوعی در آنها خوب هستند، اما یکی از چیزهایی که در آن عملکرد مطلوبی ندارند، یادگیری کارآمد است و برای حل مسائلی که انسان می تواند حدودا فوراً آنها را حل کند، زمان و داده های زیادی نیاز دارند.
حالا پژوهشگران دریافته اند که خواندن دستورالعمل های هوش مصنوعی پیش از انجام یک کار می تواند مهارت های یادگیری آنها را تسریع کند. این راه حل، «یادگیری تقویتی» نامیده می شود و شامل تعیین هدف و پاداش دادن به هوش مصنوعی برای انجام اقداماتی است که به رسیدن به آن هدف کمک می نماید.
اگرچه این روش مؤثر است، اما برای یافتن یک استراتژی کارآمد به آزمون و خطا متکی است. این بدان معناست که این الگوریتم ها ممکنست سال ها طول بکشند تا یک فرمول برنده را پیدا کنند.
برمبنای گزارشی که بتازگی انتشار یافته است، حالا گروهی از دانشگاه کارنگی ملون راهی برای مساعدت با الگوریتم های یادگیری تقویتی با ترکیب آنها با یک مدل زبانی که می تواند دستورالعمل ها را بخواند، ابداع کرده است و تا حالا آنها در آموزش هوش مصنوعی برای اجرای یک بازی ویدئویی چالش برانگیز آتاری، هزاران بار سریعتر از مدلی که توسط DeepMind تولید شده است، موفق بوده اند.
یو وو، سرپرست این پژوهش می گوید: کار ما نخستین کاری است که امکان یک چارچوب یادگیری تقویتی کاملاً خودکار را برای بهره مندی از یک دستورالعمل برای یک بازی که به شکل گسترده مورد مطالعه قرار گرفته است، نشان میدهد. ما درحال انجام آزمایش هایی روی بازی های پیچیده تر دیگری مانند Minecraft هستیم و نتایج امیدوارکننده ای را دیده ایم. ما معتقدیم رویکرد ما باید برای مشکلات پیچیده تر اعمال شود.
خلاصه کردن اطلاعات کلیدی
این گروه از پژوهشگران با آموزش یک مدل زبانی برای استخراج و خلاصه کردن اطلاعات کلیدی از کتابچه راهنمای رسمی بازی آغاز کرد. سپس از این داده ها برای پرسیدن سؤالات در مورد بازی به یک مدل زبانی از قبل آموزش دیده استفاده شد.
سپس از پاسخ های به دست آمده برای ایجاد پاداش های اضافی برای الگوریتم تقویت استفاده شد و به یک الگوریتم یادگیری تقویتی تثبیت شده برای مساعدت با یادگیری سریع تر بازی وارد شد.
پژوهشگران برای ارزیابی رویکرد خود، آنرا روی بازی Skiing 6000 آزمایش کردند که در این بازی هوش مصنوعی باید ۸۰ میلیارد فریم از بازی را اجرا می کرد تا به عملکردی قابل مقایسه با یک انسان برسد.
در نهایت آنها دریافتند که این رویکرد جدید تنها به ۱۳ میلیون فریم نیاز دارد تا بازی را به انتها برساند.
در این گزارش عنوان شده است که حالا پژوهشگران به سمت بازی های سه بعدی پیچیده تر مانند Minecraft با نتایج اولیه امیدوارکننده رفته اند و بدنبال ارزیابی این هستند که چگونه پیشرفت های سریع در مدلهای زبانی هوش مصنوعی می تواند به عنوان یک عامل شتاب دهنده برای پیشرفت دراین زمینه عمل کند.
این پژوهش در پایگاه قبل از چاپ arXiv انتشار یافته است.

منبع: atijoo.ir

1401/12/23

08:33:13

5.0 / 5

712

تگهای خبر: آموزش , پژوهشگر , تولید , چاپ

این مطلب را می پسندید؟

(1)

(0)

تازه ترین مطالب مرتبط

نظرات بینندگان در مورد این مطلب

لطفا شما هم در مورد این مطلب نظر دهید

= ۱ بعلاوه ۳

فرستادن نظر