Разработчики: | Институт системного программирования (ИСП РАН) |
Дата премьеры системы: | 2017/03/14 |
На 14 марта 2017 года Текстерра - технология многоязычного интеллектуального анализа текста.
14 марта 2017 года пресс-служба ИСП РАН сообщила о разработке институтом технологии "Текстерра", предназначенной для анализа больших массивов данных социальных сетей.
В основе "Текстерра" программный комплекс, способный накапливать и анализировать информацию, устанавливать взаимосвязь между понятиями и проводить интеллектуальный анализ текстов. Технология "Текстерра" использует объем понятий и терминов, почти на порядок превышающий размеры Британской энциклопедии, и может при необходимости расширить свою базу знаний еще больше, заявила компания-разработчик.
Используя эту технологию представляется возможным - вычислить лексически сходные тексты, принадлежащие одному автору или созданные по единому плану, содержащие сходные семантические конструкции, выявить факты и структуру информационных "вбросов".
При применении подобных технологий необходимо, чтобы не нарушались права пользователей социальных сетей, не разглашались персональные данные. Мы проводим научные исследования, дорабатываем "Текстерру" и "Талисман". Всеобъемлющий анализ соцсетей пока затруднен, прорыв еще предстоит, но ждать его осталось недолго. Денис Турдаков, заведующий отделом Информационных систем ИСП РАН |