Руски изкуствен интелект познава успеха на учащите се по постовете им в социалните мрежи
Руски учени са разработили алгоритъм, който по съобщенията в социалните мрежи може да различи отличниците от двойкаджиите с точност от 94%. Статия с резултатите от това изследване са публикувани в научното списание EPJ Science, a по-кратко описание на работата може да намерите в прес-релийза на Висшето училище по икономика в Москва.
В последното десетилетие социолози, математици, физици и даже епидемиолози активно изучават, как информацията се разпространява през социалните мрежи и как подобни данни могат да се използват за да се разберат чертите на характера и поведението на потребителите на подобни платформи.
Христоматиен пример в това отношение е работата на Cambridge Analytica, които определят в социалните мрежи профила на потребителя и неговите политически пристрастия, и след това с подходяща политическа реклама го насочват да гласува за определен кандидат (известният пример с Тръмп на миналите избори). Но има и други примери, които сочат за интензивната работа в тази посока. Преди две години американски социолози създадоха система, с помощта на която по съобщенията във Facebook се оценява вероятността за развод при потребителите. Техни руски колеги са се научили да определят семейното положение и пола по активността в социалните мрежи. По аналогичен начин британски учени са създали алгоритми, които оценявят IQ и петте основни черти на личността на човек („Голямата петорка“) по неговите лайкове.
Ръководителят на Лабораторията по изчислителни социални науки към Института по образование във Висшето училище по икономика в Москва Иван Смирнов заедно със своите колеги решили да използват изкуствен интелект, който да определя успеваемостта на ученици и студенти по техните постове във социалните мрежи, а освен това да се опитат да определят какви проблеми им пречат да се учат добре.
За обучение на невронната мрежа учените са използвали постове от открити страници в социалната мрежа „ВКонтакте” (руския аналог на Facebook). Били са селектирани съобщения на 2 468 учащи се, които през 2012 година са участвали в теста PISA. Този тест определя грамотността на участника и неговите умения да използва своите знания на практика. Като цяло в масива за обучение са попаднали повече от 130 000 текста. След като обучил изкуствения интелект, екипът на Смирнов проверил неговите възможности на постове на студенти в сто от най-големите руски университети. Прогнозите на компютъра се съпоставяли със средния бал на абитуриентите в единния държавен изпит след завършването на средното образование и официалната обща информация в учебните заведения за успеха на студентите и випусниците. Били са анализирани около милион поста на почти 39 хиляди потребителя.
Оказало се, че невронната мрежа се научила да различава участниците с добър успех от тези, които не се отличавали с особени успехи в ученето. Изкуственият интелект разграничил творенията на отличниците и двойкаджиите както по форма, така и по съдържание.
Така например, добре учещите се ученици и студенти били склонни да пишат дълги текстове, използвали разнообразна и богата лексика, като в постовете им често присъствали думи, заимствани от чужди езици. Друг маркер бил склонността им да употребяват глаголи като „мисля“, „смятам“ и други подобни, обозначаващи мисловен процес.
Тези, които не можели да се похвалят с особени успехи в ученето, предпочитали да пишат кратки постове. Също така, „двойкаджиите“ можело да се разпознаят по широкото използване на възклицателни знаци, смайли, думи, написани с главни букви, и (кой да предположи 🙂 ) по граматическите грешки.
Различавали се и темите на съобщенията. Постовете на отличниците често били свързани с литература, физика и когнитивни процеси. В тях се срещали имена и герои от книги, а също така научни термини. Тези, които не се отличавали с успехи в училище предпочитали да обсъждат хороскопи, пътно-транспортни произшествия и военната служба.
„На база на тези правила нашият модел с точност от 94% определяше учащите се с висок и нисък успех по постовете им във „ВКонтакте“. Освен това ние пробвахме да използваме алгоритъма при кратки съобщения в Twitter , което също беше успешно“ – разказва Смирнов.
Сега екипът се надява да научи изкуственият интелект да открива състояния на депресия сред учащите се по постовете им в социалните мрежи. От по-ранни изследвания има данни, че това е възможно.
Но заедно с това Иван Смирнов отбелязва, че развитието на новите технологии буди тревога за посоката на тяхното развитие.
„От една страна, такъв подход може да е полезен, например при откриването на депресия, влияеща на учебните успехи – отбелязва Смирнов – От друга страна, нашите резултати за пореден път показаха колко е уязвима конфиденциалността на потребителите на социалните мрежи. Хората се вълнуват заради навсякъде разположените камери и системите за лицево разпознаване, но даже такава незначителна цифрова следа, като кратък текст, може да стане източник на информация, която човек даже не си е помислил да разкрива“.