Ученые обучили нейросеть определять пол человека по написанному тексту

Ученые обучили нейросеть определять пол человека по написанному тексту

МОСКВА, 24 апр – РИА Новости. Коллектив ученых Национального исследовательского ядерного университета «МИФИ», Национального исследовательского центра «Курчатовский Институт» и Воронежского государственного университета  разработали метод, обучающий компьютер распознавать пол человека по написанному им тексту с точностью до 80 процентов. Научная разработка относится к области компьютерной лингвистики. Исследование проводилось по гранту Российского Научного Фонда. Результаты  опубликованы в журнале Procedia Computer Science. 

Многочисленные научные исследования показывают, что в письменном тексте неизбежно отражаются характеристики его автора – пол, психологические особенности, уровень образования. Речь является ценным психодиагностическим инструментом, который используют специалисты кадровых служб крупных компаний, а также служб безопасности.

На основе анализа речи можно диагностировать наличие у человека некоторых заболеваний (деменции, депрессии) и склонность к суицидальному поведению. Потребность в установлении характеристик автора текста также растет с развитием интернет-коммуникаций: компаниям важно знать, каким группам лиц нравятся их товары и услуги.

Ученые, работающие в данном направлении (лингвисты, психологи, специалисты по информационным технологиям), на основе численных значений различных параметров текста строят математические модели для диагностирования тех или иных параметров личности.

Коллектив специалистов проанализировал эффективность различных технологий машинного обучения с использованием нейронных сетей для анализа текстов.

В ходе исследования они сравнили точность решения задачи гендерной идентификации текстов на основе двух подходов к моделированию на основе данных: с одной стороны, алгоритмы машинного обучения (метод опорных векторов и градиентный бустинг), с другой стороны – нейронные сети глубокого обучения (сверточные нейронные сети и рекуррентные нейронные сети с долгой краткосрочной памятью).

«Мы достигли высоких результатов в определении пола автора текста благодаря продвинутым нейросетевым моделям, в условиях, когда  автор не скрывает свой пол. На очереди задача определения пола в условиях его намеренного сокрытия», – говорит доцент НИЯУ МИФИ Александр Сбоев.

Так, в следующих текстах, размещенных изначально на сайте знакомств, нейросеть без труда находит подвох в десяти случаях из десяти, притом, что автор намеренно ставит в подписи имя противоположного пола.

Текст написан девушкой: «Я красивый, накачанный мужчина 30 лет. Работаю в крупной нефтегазовой компании на хорошей должности с приличной зарплатой. Живу в собственной квартире в Москве. В собственности также находится небольшой, но симпатичный домик в одной из деревушек Италии. Увлекаюсь спортом, в частности, футболом. Люблю выбираться куда-нибудь на выходные, не терплю домоседок. Девушка, которая мне бы подошла, должна обладать скромным нравом, красивой внешностью и привлекательной фигурой по современным стандартам. Она должна разделять мои интересы, не должна быть ревнивой и не должна пытаться вызвать чувство ревности у меня. Содержать девушку я не собираюсь, так как считаю, что в семье должны работать оба. Бюджет также предпочитаю вести раздельно. Не потерплю измены».

Текст написан мужчиной: «Здравствуйте! Я крайне недовольна, крайне! Почему вы так себя с нами ведете?! Мы же тоже люди, мы все равны! Вы сексист? Я больше не буду это терпеть! Я твою машину вообще всю разобью, разрисую. Жди, нелюдь. Финишу таким быть».

Результаты этого исследования показали, что подход, основанный на использовании сверточной нейронной сети и методов глубокого обучения для распознавания пола человека, написавшего текст, является наиболее оптимальным.

Сейчас группа исследователей работает над задачей распознавания возраста.

11:00
36
RSS
Нет комментариев. Ваш будет первым!
Читайте также
Трамп принял детей журналистов и заявил, что они ведут себя лучше родителей
ВАШИНГТОН, 27 апр — РИА Новости. Президент США Дональд Трамп принял в Овальном кабинете Белого дома детей журналистов президентского пула и заявил, что они ...
Торговцы человеческими органами задержаны в Египте
Сотрудники египетской полиции задержали в Каире группу - семь человек - врачей и посредников, занимавшихся торговлей человеческими донорскими органами.
Украина хочет иметь план действий по членству в НАТО
Президент Украины Петр Порошенко направил генеральном секретарю НАТО Йенсу Столтенбергу письмо, в котором попросил предоставить план действий по членству стр...
Обстрелы Восточной Гуты: один мирный житель погиб, девять ранены
За прошедшие сутки по Дамаску и его окрестностям боевиками из Восточной Гуты выпущено 12 мин, погиб один и ранены девять мирных жителей, сообщил начальник ро...
Смешанную эстафету биатлонистов выиграли французы. Россияне - девятые
На биатлонном турнире Олимпиады в Пхенчхане завершилась смешанная эстафета – последний вид программы, в котором участвовали россияне. В мужской и женской ком...
Мигранты жестоко избили и раздели китайского предпринимателя на юго-востоке Москвы
Торгующий на рынке "Садовод" китайский предприниматель пал жертвой своих же подчиненных - трое приезжих из СНГ избили его обрезком металлической трубы у подъ...