Вівторок, 25 квітня, 2017
© Передрук матеріалів тільки за наявністю активного посилання на Портал Косівщини

Вчені розробили детектор школярів у соцмережах

Косівщина - Новини Косівщини

Косів - Косівщина інформаційна | Публіцистика та аналіз | 2013-10-09 10:30:30

Вчені розробили детектор школярів у соцмережах Група соціологів продемонструвала можливість автоматично розпізнавати стать, вік і ряд психологічних характеристик користувачів соціальної мережі Facebook на основі їхніх статусів.

За словами вчених, це дозволяє формалізувати ряд спостережень і дає новий інструмент для проведення досліджень.

У ході своєї роботи співробітники Університету Пенсільванії (США) й Кембриджського університету у Великій Британії вивчали лексику, використовувану в статусах Facebook. Під статусом розуміється короткий текст, розташовуваний від свого імені у соцмережах. У тексті звичайно вказують поточне заняття, настрій або іншу інформацію.

Соціологи зібрали дані про 136 тисяч користувачів (всі вони підписалися на участь у науковому дослідженні), які в цілому обновили свій рядок статусу більше 13 мільйонів разів.

Щоб одержати коректну інформацію, учені брали тільки тих, хто за час експерименту написав більше 1000 слів у рядок статусу. У підсумку вибірка авторів дослідження включала 15,4 мільйони статусів з 309 мільйонами слів від 74941 особи.

Далі соціологи взяли заповнені тими ж людьми онлайн-анкети й спробували знайти кореляції зустрічальності тих або інших слів у статусі з тими або іншими характеристиками людини. Математичний аналіз матеріалу продемонстрував, що навіть сполучення символів, які були виділені в слова суто формально (як довільна комбінація між двома пробілами), дозволяють довідатися, приміром, стать користувача. Сполучення знака “менше” і цифри 3 дозволяє впевнено говорити про те, що рядок статусу оновлений жінкою, а не чоловіком. У той же час лайка “fuck” вказує на чоловічу стать власника аккаунта.

Дослідники також запропонували добровольцям установити онлайн-додаток My Personalіty із психологічними опросниками, заснованими на тесті NEO Personalіty Іnventory Revіsed (NEO-PІ-R). Цей тест видавав результати по п’яти різних шкалах: екстраверсія, зговірливість, свідомість, невротизм і відкритість; скорочена версія такого тесту вже використовувалася в іншій присвяченої Facebook роботі.

Аналіз матеріалу тестів показав, що екстраверти частіше використовують слова “вечірка” і “дівчата”, у той час як інтроверти віддають перевагу комп’ютерам й інтернету, а також аніме – хоча коефіцієнт кореляції для аниме та інтроверсії виявився нижче, ніж для інтроверсії й смайла “^_^”. Крім того, учені побачили й характерні для певного віку вирази: наприклад, “домашнє завдання” і назви предметів видають школярів, а “дочка” або “чоловік” характерні для тих, кому більше тридцяти років.

Дослідники думають, що їхня робота дозволяє відокремити стереотипи про ту або іншу категорію користувачів від її реальних характеристик. Вони вважають удалим рішення не підраховувати частотність того або іншого слова із закритого списку (скажемо, із числа “позитивних емоцій” або з безлічі “лайки”), а взяти слова й сполучення символів, попередньо присутні у вибірці. Ще одне достоїнство підходу - порівняльна швидкість відновлення даних.