+7 499 135-41-63 (ВЦ РАН)
   info@forecsys.ru
      или посмотреть карту сайта
20 октября 2017
Состоялась научная конференция «Математические методы распознавания образов 18»

 

11 сентября 2017
«Форексис» приглашает студентов старших курсов и аспирантов пройти стажировку в московском офисе компании

 

31 августа 2017
Специалисты компании «Форексис» завершили расчет экономических показателей по каждому из трех рынков Московской Биржи

 

29 августа 2017
Завершился первый этап совместного проекта «Форексис» и IBS по развитию прикладного ПО государственной автоматизированной информационной системы ГАС «Управление»

 

23 августа 2017
Завершилась совместная работа компании «Форексис» и специалистов из Высшей школы информатики и прикладной математики Политехнического института г. Гренобля (Франция).

 

27 июля 2017
Подведены итоги совместного проекта компаний «Форексис» и «SOLUT» по разработке прототипа системы распознавания вида деятельности сотрудника строительной компании

 

21 июля 2017
Стартовал совместный проект «Форексис» и IBS по модернизации государственной автоматизированной информационной системы «Управление»

 

19 июля 2017
Компания «Форексис» запустила проект разработки подсистемы управления данными в оперативной памяти (In Memory) для Системы мониторинга и анализа финансовых рынков «САФРАН 4.0»

 

18 июля 2017
Специалисты компании «Форексис» завершили исследовательский проект по прогнозированию влияния новостного потока на изменение цен инструментов

 

10 июля 2017
«Форексис» проводит расчет экономических показателей по фондовому, валютному и срочному рынкам Московской Биржи

 

Новости

Специалисты компании «Форексис» завершили исследовательский проект по прогнозированию влияния новостного потока на изменение цен инструментов

Для анализа текстовых данных были выбраны экономические новости за период 01.04.2016-30.06.2016. По каждой новости анализировались следующие показатели: уникальный идентификатор, рубрика, теги, дата публикации, заголовок, подзаголовок и текст новости. Исследование включало в себя этапы предобработки текстовых данных, построения и тестирования модели прогнозирования.

На этапе предобработки тексты были переведены в нижний регистр, были удалены неинформативные знаки и символы (числа, запятые, стоп-слова и др.) Для коллекции текстов был построен словарь, для слов в словаре подсчитаны значения важности (TF-IDF). Для каждого текста был построен набор признаков по принципу «мешка слов» с использованием наиболее важных слов.

В качестве данных с финансового рынка были взяты временные ряды цен акций «Газпром» за аналогичный временной период. Для каждой новости, опубликованной в рабочее время, была вычислена вещественная оценка влияния новости на цену акции, превышение среднего значения цены после выхода новости. Признаковое описание текстов и оценки влияния новостей составили выборку для модели прогнозирования.

В качестве моделей прогнозирования использовались наивный байесовский классификатор, случайный лес на бинарных признаках, а также случайный лес на признаках TF-IDF. Модели сравнивались по критерию площади под кривой (ROC-AUC), усредненной по тестовым выборкам кросс-валидации. Наилучший результат показала модель байесовского классификатора с отбором признаков.

Исследование проводилось в рамках работ по модернизации системы Check4Trick для мониторинга и анализа результатов торгов.

Ознакомиться с результатами исследования вы можете, прислав заявку в аналитический отдел компании «Форексис» на адрес info@forecsys.ru.

Дата публикации: 18.07.2017

вернуться к другим новостям