В прошлой части мы рассмотрели теоретическую модель, лежащую в основе вычисления вероятности присутствия на рынке информированных трейдеров PIN. Продолжим с эмпирической реализации этой модели.
Для уменьшения пространства параметров модели, обычно предполагают, что частоты прихода ордеров на продажу и на покупку равны. В день "хорошей новости" вероятность наблюдения последовательности сделок купли и продажи соответствует:
, где B и S - число сделок купли и продажи соответственно.
Для дней "плохой новости":
.
И для дней с отсутствием новостей вероятность равна:
.
Предполагая, что торговая активность независима от одного дня к другому в течении T дней, вероятность торговой активности принимает форму:
с пространством параметров . За h независимых дней вероятность наблюдения равна произведению дневных вероятностей:
.
Для сходимости при численной максимизации преобразуем функцию вероятности следующим образом:
где .
Найти параметры можно методом численной максимизации вышеприведенной вероятности (в заглавии поста приведены графики полученных параметров для акций NYSE с 1983 по 2009 год). После этого мы сможем найти индикатор информированной торговли PIN, который равен безусловной вероятности того, что информированные участники покупают или продают актив в каждый момент времени:
.
Когда значение PIN велико, неинформированные трейдеры сталкиваются с высоким риском того, что их контрагент в сделках лучше информирован. В своих алгоритмах необходимо учитывать этот индикатор и предпринимать соответствующие действия при его высоком значении, например, снимать ордера, противоположные текущему направлению движения цены.
Пакет PIN языка R содержит функцию для вычисления логарифма вероятности торговой активности. На вход она принимает значения параметров - - и временную последовательность дневных данных с числом сделок купли и продажи, помещенных в матрицу размерностью n х w, где n - число торговых дней. Первая колонка матрицы содержит число сделок купли, вторая - число сделок продажи.
В следующей части мы рассмотрим практический пример с использованием языка R, где применим численную максимизацию упомянутой выше функции и получим значения параметров, а затем, соответственно, вычислим PIN.
Мне кажется, что тут ошибка в формуле вероятности L. Частота сделок (mu + eps) должна быть в числителе у покупок, когда вероятность событий = delta (хорошие новости). И наоборот в третьем слагаемом. Соответственно возможно, что далее она неверно была прологарифмирована. Ну и вычисления все мимо. Смотрел статью, там такая же ошибка.
там же так и есть ...