• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Фильтрация финансово-экономической информации и восстановление пропущенных данных.

В последние годы все чаще в практике финансовых институтов находят применение количественные методы обработки информации о ходе торгов ценными бумагами и производными финансовыми инструментами. Данные методы широко используются при построении различных моделей прогнозирования цен тех или иных активов, измерения рисков портфеля, а также при проведении более сложных расчетов, например, при построении бескупонных кривых доходностей.

 

Подобные исследования, как правило, используют большие объемы информации о торговле финансовыми активами. Так что зачастую реализация такого рода моделей требует значительных вычислительных мощностей и применения сложных вычислительных алгоритмов,  в том числе использующих параллельные вычисления. Однако на первый план выходит вопрос о полноте и достоверности имеющейся в наличии у исследователя информации. Очевидно, что невозможно получить на выходе модели внятные результаты при условии обработки недоброкачественных данных. Наиболее емко данная идея нашла выражение в информатике в виде принципа GIGO (Garbage In, Garbage Out, «Мусор на входе - мусор на выходе»).

 

Несоблюдение условий полноты и достоверности информации о ходе торгов активами приводит к наличию пропусков в данных. Причины их возникновения могут быть различны. Прежде всего, это отсутствие сделок вследствие низкой ликвидности рынка, что характерно для российского фондового рынка. Кроме того, на финансовых рынках часто возникают ситуации, приводящие к временному приостановлению торгов. Также возможны различные технологические сбои при получении и накоплении рыночной информации. Самое пристальное внимание должно быть уделено периодически происходящим на рынке малоправдоподобным или нерыночным сделкам, которые сильно искажают рыночную ситуацию. Исключение этих сделок, проводящееся особыми процедурами фильтрации, тоже ведёт к возникновению пропусков. Наконец, возможно применение тех же методов для прогнозирования будущих цен активов. В этом случае будущие значения цен рассматриваются как пропуски.

 

Наиболее часто используемыми на практике способами восстановления информации о пропущенных по тем или иным причинам ценах являются использование известной цены на предыдущем временном участке и вычисление среднего арифметического между заявками на покупку или продажу на момент пропуска цены. Оба эти метода страдают очевидными недостатками.

 

Что касается продвинутых методов восстановления пропущенной информации, то фактически существует два способа борьбы с проблемой некачественных данных – модификация численных методов с целью адаптации их к некачественной входной информации или её предварительная подготовка. Одним из таких методов является EM алгоритм, предложенный к использованию в техническом документе группы RiskMetrics и ставший уже стандартом индустрии. Однако даже незначительная модификация численных методов может привести к многократному возрастанию их сложности. Как правило, это означает невозможность использования аналитических выражений, а последовательное применение различных численных методов означает потерю точности вычислений. На первое место, однако, выходят проблемы быстродействия, так как финансовые институты не могут позволить себе использовать медленные численные процедуры в повседневной практике.

 

Коллективом Лаборатории по финансовой инженерии и риск-менеджменту ГУ-ВШЭ была разработана уникальная методика решения проблемы некачественной информации путём её предварительной подготовки – восстановления пропущенных данных, позволяющая с высокой точностью воспроизводить распределение пропущенных значений. Одной из ее особенностей является использование метода сопряженных семейств распределений, который по причине очень малого числа известных семейств крайне редко применяется на практике. Данная методика в ряде вопросов превосходит широко используемый EM алгоритм, в частности дает более устойчивые оценки корреляций. Результаты работы могут быть использованы для решения самого широкого круга задач финансовой инженерии и риск-менеджмента, имеющих повышенную чувствительность к качеству используемой входной информации.

 

В настоящее время Лаборатория занимается построением алгоритма параллельных вычислений для решения задачи восстановления данных на основе методики, разработанной Лабораторией.


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!