+7 495 185-09-77
   +7 499 135-41-63 (ВЦ РАН)

   info@forecsys.ru
      или посмотреть карту сайта
10 октября 2018
Пополнение команды «Форексис» молодыми и талантливыми специалистами с ведущих вузов России

 

16 августа 2018
Внесены поправки в 224-ФЗ «О противодействии неправомерному использованию инсайдерской информации и манипулированию рынком и о внесении изменений в отдельные законодательные акты Российской Федерации»

 

12 августа 2018
Создана Рабочая группа НАУФОР по вопросам регулирования злоупотреблений на рынке ценных бумаг

 

02 августа 2018
Компания «Форексис» заключила соглашение о сотрудничестве с международной аудиторско-консалтинговой компанией КПМГ

 

20 июля 2018
Новые методы выявления мошеннических действий на финансовых рынках

 

17 июля 2018
Вышла обновленная версия пользовательского приложения системы Check4Trick

 

25 июня 2018
Завершен проект по разработке АРМ клиента мониторинга системы САФРАН

 

08 июня 2018
Компания «Форексис» продолжает работы по модернизации технологии распознавания движений SOLUT

 

24 мая 2018
Сотрудничество компании «Форексис» и ФИЦ «Информатика и управление» РАН

 

27 апреля 2018
Высокая оценка работы компании «Форексис» со стороны ПАО Московская Биржа

 

Новости

Специалисты компании «Форексис» завершили исследовательский проект по прогнозированию влияния новостного потока на изменение цен инструментов

Для анализа текстовых данных были выбраны экономические новости за период 01.04.2016-30.06.2016. По каждой новости анализировались следующие показатели: уникальный идентификатор, рубрика, теги, дата публикации, заголовок, подзаголовок и текст новости. Исследование включало в себя этапы предобработки текстовых данных, построения и тестирования модели прогнозирования.

На этапе предобработки тексты были переведены в нижний регистр, были удалены неинформативные знаки и символы (числа, запятые, стоп-слова и др.) Для коллекции текстов был построен словарь, для слов в словаре подсчитаны значения важности (TF-IDF). Для каждого текста был построен набор признаков по принципу «мешка слов» с использованием наиболее важных слов.

В качестве данных с финансового рынка были взяты временные ряды цен акций «Газпром» за аналогичный временной период. Для каждой новости, опубликованной в рабочее время, была вычислена вещественная оценка влияния новости на цену акции, превышение среднего значения цены после выхода новости. Признаковое описание текстов и оценки влияния новостей составили выборку для модели прогнозирования.

В качестве моделей прогнозирования использовались наивный байесовский классификатор, случайный лес на бинарных признаках, а также случайный лес на признаках TF-IDF. Модели сравнивались по критерию площади под кривой (ROC-AUC), усредненной по тестовым выборкам кросс-валидации. Наилучший результат показала модель байесовского классификатора с отбором признаков.

Исследование проводилось в рамках работ по модернизации системы Check4Trick для мониторинга и анализа результатов торгов.

Ознакомиться с результатами исследования вы можете, прислав заявку в аналитический отдел компании «Форексис» на адрес info@forecsys.ru.

Дата публикации: 18.07.2017

вернуться к другим новостям