Дари

Специалната теория на относителността е помогнала на компютър да предскаже бъдещето

Британски специалисти по машинно обучение са разработили система за прогнозиране на бъдещи събития, базираща се на концепциите на специалната теория на относителността: причинността, пространство-времето на Минковски и светлинните конуси. Алгоритъмът е бил успешно изпробван в задача за предсказване и генериране на нови кадри на основата на изображения. По думите на разработчиците, създаденият от тях подход е универсален, може да се използва за множество задачи и ще бъде нужен там, където е необходимо прогнозиране на развитието на събития в бъдещето с отчитане на причинно-следствените връзки, например в областта на медицината и в автономните транспортни средства. Предпринтът на статията е публикуван в arHiv.org ( там се публикуват статии, които все още не са преминали независимо рецензиране).

Ежедневно, понякога даже не забелязвайки, ние се опитваме да предскажем как ще се развият събитията около нас. Например, ако на движещ се пред нас автомобил е включен мигача, то може да се предположи, че той с определена вероятност ще извърши маневра в съответната посока. Но също така автомобилът може да продължи движението си без промяна на посоката, може да спре или даже да завие в противоположната посока. Тези събития са вероятни в по-голяма или по-малка степен и ние можем да ги очакваме, базирайки се на нашия опит от взаимодействието ни с обкръжаващия ни свят и интуитивното разбиране на законите на физиката и причинно-следствените връзки. От друга страна, ние едва ли можем сериозно да разглеждаме възможността, че автомобилът внезапно ще изчезне и вместо него на пътя ще се появи древен динозавър.

За разлика от хората, компютрите нямат интуитивно разбиране на причинно-следствените връзки и затова прогнозирането на бъдещи събития за тях се оказва достатъчно сложна задача. При това в много области, където днес протича интензивно внедряване на системи с машинно обучение, появата на такава способност би повишило нивото на безопасност при използването им. Например, безпилотен автомобил би могъл да прогнозира и оцени вероятността на това, че стоящото на бордюра дете може внезапно да изскочи на пътното платно.

Съществуващите подходи за решаването на задачи, свързани с предсказването на бъдещето в машинното обучение се свеждат, например, до трениране на моделите на последователни кадри от видео. По този начин алгоритъмът се обучава да открива закономерности в събития, които впоследствие могат да се използват за генерирането на нови, по-рано несъществували кадри, продължаващи тази последователност. Например, на програмата може да се покаже последователност от кадри с движещ се човек, а след това да и се даде задача да генерира следващите няколко кадъра, които да продължат тази последователност. Но тези подходи, използващи серии и последователности на кадри, имат свойството бързо да натрупват грешки с увеличаването на броя на генерираните кадри.

Изследователи, под ръководството на Атанасиос Влонцос (Athanasios Vlontzos) от Имперския колеж на Лондон, са използвали друг подход. Те са разработили алгоритъм на базата на фундаменталните концепции на Специалната теория на относителността (СТО), такива като пространство-времето и светлинните конуси.

В СТО пространство-времето (или пространството на Минковски) представлява обединение на тримерното евклидово пространство с четвъртото времево измерение. В такова пространство на всяко събитие съответства точка, чиито пространствени координати описват мястото, където се е случило събитието, а времевата координата – момента на времето, когато то се е случило.

Ограничението на максимално достижимата скорост на разпространение на сигналите (в СТО това е скоростта на светлината) позволява да се отдели в пространство-времето определена област, наречена светлинен конус, с център първоначалното събитие. Множеството точки вътре в тази област ще са свързани с изходното събитие чрез причинно-следствените връзки. Така в конуса на бъдещето, лежащ над върха на първоначалното събитие, ще са разположени всички събития, на които то може да повлияе, а в долния конус на миналото – всички събития, които са могли да повлияят на разглежданото във върха на конуса събитие. При това точките, намиращи извън границите на светлинния конус, не са свързани с причинно-следствени връзки с изходното събитие.

Разработчиците са използвали тази концепция, за да ограничат възможните нови кадри, генерирани от алгоритъма, тоест такива, които са близки по съдържание към изходното изображение и да могат да отстранят изображения, които силно се отличават от него. В качеството на основа за алгоритъма е била избрана разновидност на популярния метод за обучение на генеративни модели – вариационния автоенкодер на Пуанкаре. Подаваните на входа изображения се преобразували от енкодерa в представа в скрито пространство, която притежава свойствата на пространството на Минковски с осем пространствени и една времева координати. Такава размерност на пространството е била избрана като оптимална по експериментален път. След това алгоритъмът строял светлинни конуси около тези точки и търсил техните пресичания, за да разграничи тази област на скритото пространство, в която могат да се намират бъдещите (или миналите в долния конус) кадри. Приличащите си по съдържание кадри се оказало, че са разположени близко едни до други. По-нататък, провеждайки подбор от това подпространство, можело са предсказват бъдещите кадри.

Пресичане на светлинни конуси
Източник: A. Vlontzos et al. / arXiv.org

В качеството на масив от данни за обучение изследователите са използвали модифицирания масив moving MNIST, състоящ се от малки фрагменти от видео с местещи се ръкописни цифри. Всеки фрагмент представлява последователност от 30 кадъра. При това, един от тях се взема от изходния масив от данни MNIST, а следващите кадри представлявали случайни непрекъснати премествания на изходното изображение. Били са използвани 10 000 фрагмента от този масив. Освен това, разработчиците са използвали масива от данни KTH action recognition dataset, състоящ се от кратки видеоклипове, демонстриращи движение на хора, например ходене и махане с ръце. Трябва да се отбележи, че кадрите в тренировъчните масиви са се приемали разпръснато, а не във вид на свързани последователности и серии.

След това изследователите дали задача на алгоритъма за генериране на множество възможни кадри на входен единичен тестов кадър. Въпреки че в невронната мрежа отсъствала времева информация, тъй като обучението преминало на съвкупност от отделни кадри, а не на последователности, се оказало, че алгоритъмът е способен да прогнозира подходящи бъдещи възможни кадри. Например, ако на входа се подава кадър, на който е изобразен вървящ човек с къса коса и в риза, то алгоритъмът генерира като най-подходящи кадри, такива на които е изобразен подобен човек и отхвърля силно различаващи се кадри, например хора с дълги коси или без риза.

Генериране на кадри на основа базата на данни MNIST
Източник: A. Vlontzos et al. / arXiv.org
Генериране на основа на базата данни KTH
Източник: A. Vlontzos et al. / arXiv.org

Както твърдят авторите на изследването, разработеният от тях алгоритъм не е подложен на ефекта на натрупване на грешки, тъй като той не разчита на възможностите на невронните мрежи да извличат и да запомнят структурна или времева информация от обработваните изображения. В това изследване диаметърът на конуса се избирал ръчно и се смятал за фиксиран, което означава постоянна скорост на еволюция за всички кадри и конуси. В бъдеще изследователите планират да внедрят автоматична настройка на диаметъра на светлинните конуси.

Алгоритъмът може да се използва в области, където се изисква прогнозиране на възможни варианти за развитието на събитията. Например, освен използването при автопилотите за повишаване безопасността на автономните транспортни средства, новият подход може да се използва в медицината за прогнозиране, как лекарствените препарати ще въздействат на състоянието на пациента или как ще прогресира заболяването на база данни от снимки от магнитно-резонансна томография и предписаното лечение.

0 0 votes
Article Rating
guest
0 Comments
Inline Feedbacks
View all comments
Дари
0
Would love your thoughts, please comment.x
()
x