Целью данной разработки стало предоставление аналитикам средств для быстрого выделения знаний из множества разнородных источников текста. Подобные исследования сейчас ведутся в активно развивающемся проекте “Knowledge Discovery and Dissemination (KDD)”, DARPA. Предтечей нового продукта явились методы и технологии, реализованные «Ай-Теко» в системе «Аналитический курьер».
Создаваемые специалистами компании облачные сервисы 2Толк будут применяться для мониторинга web-ресурсов, highload-обработки текста на нескольких языках, включающей анализ сущностей, их связей, мнений, тональности высказываний, социального графа авторов и сообществ. Программный компонент для хранения документов и знаний использует Open Source-платформы Big Data.
Разработчики говорят, что инновационность проекта «Ай-Теко» связана с поддержкой:
- Управляемых данными гибких сценариев аналитической обработки результатов поиска, когнитивных карт, персональных рубрикаторов, конструкторов инфопанелей и отчетов. Сценарий может включать последовательное применение методов Text & Data Mining к коллекциям документов, полученным на предыдущих этапах.
- Персонализации поисковой выдачи с учетом профиля и истории работы пользователей.
- Извлечения и представления знаний в открытых форматах.
- Полного цикла обработки сообщений: от поиска в источниках и доставки до получения полезных результатов.
- Online-процессов семантического агрегирования всех сущностей до доминант синсетов в кластерных, когнитивных картах, частотных распределениях и рефератах. Например, в частотном распределении будет выполняться объединение категорий из одного синсета (набора именований объекта) в одну категорию.
- Обеспечения чувствительности всех результатов к изменениям в составе базы знаний в режиме Near real-time.
«Появление огромных объемов контента увеличивает спрос на «осмысление» естественного языка в системах поддержки принятия решений и мониторинга социальных медиа, в когнитивных приложениях. Для удовлетворения непрерывно растущих потребностей рынка нами было принято решение о создании на основе результатов внедрений «Аналитического курьера» нового продукта – программно-технологической платформы 2Толк для семантической обработки больших объемов текстовой информации из соцсетей в Инновационном центре «Сколково», – рассказывает Сергей Киселев, директор департамента систем управления знаниями компании «Ай-Теко». – Хочу отметить, что на базе сервисов 2Толк предполагается разработка приложений для различных областей, а предоставление полученных с помощью комплекса знаний будет соответствовать открытым международным стандартам».
Редактор раздела: Тимофей Белосельцев (info@mskit.ru)