Учените са използвали ролева игра за да научат ИИ да манипулира и да убеждава
При машинно обучение се използват не само масиви с еднообразни данни. Изследователите от Технологичния институт на Джорджия и поделението на Facebook, занимаващо се с изкуствен интелект Facebook AI Research си поставили задача не просто да научат алгоритъма да прави нещо, но и да въздейства на другите. За тази цел те използвали текстова ролева игра, в която изкуственият интелект може да изпълнява куестове и да взаимодейства с другите участници, като се опитва да ги убеждава или манипулира.
Езиковите модели, такива като алгоритъмът за обработването на естествен език GPT-3, могат да пишат истории, да водят вестникарска колонка или да водят блогове, подражавайки на човешкия стил на писане. Но те са способни само да произвеждат текст. В същото време хората много често използват езика като инструмент за прокарване на своите идеи и за въздействие над останалите.
Изследователите от Технологичния институт на Джорджия в Атланта и поделението на Facebook, занимаващо се с изкуствен интелект Facebook AI Research, са решили да създадат ИИ, който ще използва думите целенасочено. За тази цел те обединили методите за обработка на естествен език и дълбоко обучение с утвърждение. Двете области активно се развиват в последните няколко години, но заедно се използват рядко.
За обучението на алгоритъма е била използвана многоползвателската ролева игра LIGHT, разработена от Facebook за изучаване на взаимодействието на хората и ИИ-играчи. В тази игра:
– Събитията се развиват във фантастичен свят, където има множество обекти, персонажи и локации;
– Играчите взаимодействат с тях с помощта на текст;
– За да изпълни ход играчът – човек или машина – използва такива команди като „прегръщам вълшебника“, „ поразявам дракона“ или „свалям шапката“.
– Играчите също така могат да общуват с персонажи, управлявани от чат-ботове.
По принцип ролевата игра е тип игра, в която участниците заемат ролите на персонажи и заедно създават истории. Участниците определят действията на персонажите си, според характерите им, а действията биват успешни или неуспешни, според установена система от правила или насоки. В рамките на тези правила, те могат свободно да импровизират, а техните избори оформят посоката и крайния резултат от игрите.
Изследователите са добавили в своята ролева игра около 7500 краудсорсингови куестове, които не били включени в оригиналната версия на LIGHT и създали специална база данни, която е давала на изкуствения интелект информация за игровия свят и връзката между персонажите. Например, търговецът ще се доверява на охранителя, само ако те са приятели. За да завършат куеста „Постройте най-голямото хранилище за съкровищата на дракона“ трябва да се изпълнят ходове като „Отивам в планината“ и „Изяждам рицаря“.
Благодарение на играта ИИ се е научил да използва езика като средство за убеждаване. За да се справи със задачата, машината е можела или да вкарва команда, или чрез езикови изрази да се обърне към други персонажи. Например, ако на ИИ му е бил нужен меч, той е можел да го открадне или да убеди друг персонаж да сподели своето оръжие с него.
Към настоящия момент разработеният алгоритъм може да се използва само в рамките на играта. Освен това, той използва понякога твърде резки и не дотам логични изрази. Ако му е нужна кофа, той може да напише „Дай ми кофата или аз ще нахраня с теб котката!“.
Но така или иначе, такова обединяване на технологиите на естествения език и обучението с утвърждение е огромна крачка в разработването на „по-умни“ системи. В бъдеще ще могат да бъдат създавани не само по-съвършени чат-ботове, способни да спорят и убеждават, но и такива които по-добре разбират, как е устроен нашия свят.