Анализ выживаемости
Анализ выживаемости является важной концепцией как в академических финансах, так и в практических торговых стратегиях. Он касается феномена смещения выживаемости, которое возникает, когда в анализе данных учитываются только “выжившие” в определенном процессе. В мире финансов это обычно означает фокусирование только на компаниях, которые в настоящее время котируются, без учета тех, которые обанкротились, были исключены из листинга или объединились. Последствия игнорирования этих субъектов могут привести к искаженным и чрезмерно оптимистичным результатам набора данных, что, следовательно, может исказить результаты бэктестинга и прогнозы будущей производительности торговых стратегий.
Понимание смещения выживаемости
В контексте финансовых рынков смещение выживаемости обычно проявляется в виде наборов данных, которые включают только акции, торгуемые в настоящее время, и исключают те, которые обанкротились или были исключены из листинга. Это создает восходящее смещение в анализе исторической производительности, поскольку непропорционально отражает компании, которые были достаточно успешными, чтобы остаться в листинге.
Историческая база данных и смещение выживаемости
Большинство исторических баз данных фондового рынка подвержены смещению выживаемости. Они часто не включают исключенные из листинга акции, что может значительно изменить результаты бэктестов и видимую эффективность торговых стратегий. Например, предположим, что алгоритм тестируется на десятилетнем периоде с использованием набора данных, который не учитывает компании, которые обанкротились или были исключены из листинга в течение этого периода. Доходность, рассчитанная на основе такого набора данных, будет представлять более высокую, чем истинная производительность, поскольку плохо работающие акции систематически исключаются.
Ключевые последствия
- Оптимистичные показатели производительности: Бэктестинг торговой стратегии на наборе данных, страдающем от смещения выживаемости, часто приводит к чрезмерно оптимистичным показателям производительности.
- Неточная оценка рисков: Акции, которые были исключены из листинга или обанкротились, могли представлять более высокий риск, который не отражен в наборе данных со смещением выживаемости.
- Неэффективная разработка стратегий: Стратегии, разработанные на смещенных наборах данных, могут потерпеть неудачу в реальных приложениях, потому что они были оптимизированы на искаженных данных.
Методы снижения смещения выживаемости
Смещение выживаемости может быть снижено с использованием различных подходов, включая:
Включение исключенных из листинга акций
Обеспечение того, чтобы набор данных включал все ценные бумаги, включая те, которые были исключены из листинга, обанкротились или объединились, может обеспечить более точное представление исторической производительности. Некоторые базы данных, такие как база данных CRSP (Центр исследований цен на ценные бумаги), включают эту информацию.
Анализ выживших
Другой метод - проведение двух отдельных анализов: одного на выжившей вселенной и другого на всей исторической вселенной, включая исключенные из листинга акции. Сравнение этих результатов может дать представление о степени смещения выживаемости.
Скорректированные исторические данные
Многие поставщики и компании финансовых данных теперь предлагают наборы данных без смещения выживаемости, которые корректируют исторические данные с учетом акций, которые не выжили. Например, наборы данных Reuters и Bloomberg часто включают корректировки для смещения выживаемости.
Инструменты и ресурсы
Для проведения анализа выживаемости и снижения смещения выживаемости доступны несколько инструментов и ресурсов:
StockSharp
StockSharp - это платформа алгоритмической торговли, которая предоставляет доступ как к текущим котируемым, так и к историческим исключенным из листинга ценным бумагам, что позволяет проводить более точный бэктестинг:
Tiingo
Tiingo предлагает базу данных без смещения выживаемости, которая позволяет трейдерам и исследователям получать доступ к данным, включающим исключенные из листинга ценные бумаги:
AlgoTrader
AlgoTrader - это еще одна платформа, которая предлагает инструменты и наборы данных, предназначенные для устранения смещения выживаемости из бэктестинга:
Практический пример: бэктестинг торговой стратегии
Рассмотрим алгоритмического трейдера, разрабатывающего моментум-стратегию. Если трейдер использует набор данных, который включает только акции, в настоящее время котируемые на NYSE, бэктест может показать, что стратегия производит годовую доходность 15%. Однако, если исключенные из листинга акции включены, производительность может упасть до годовой доходности 10%, поскольку набор данных теперь отражает включение компаний, которые обанкротились или были исключены из листинга. Эта существенная разница может значительно повлиять на восприятие трейдером эффективности стратегии и связанных уровней риска.
Пошаговый процесс
- Выбор источника данных: Выберите историческую базу данных, которая, как известно, не имеет смещения выживаемости, например CRSP, или используйте такие платформы, как StockSharp и Tiingo.
- Подготовка данных: Очистите и предварительно обработайте данные, чтобы включить как котируемые, так и исключенные из листинга акции, обеспечив учет всех исторических данных о ценах.
- Бэктест стратегии: Запустите свою торговую стратегию на очищенном наборе данных. Убедитесь, что вы отслеживаете ключевые показатели, такие как доходность, риск и коэффициенты Шарпа.
- Анализ результатов: Сравните результаты вашего бэктеста с аналогичным тестом, использующим смещенный набор данных. Отметьте различия в показателях производительности.
- Корректировка стратегии: Если результаты значительно отличались, рассмотрите возможность изменения вашей стратегии, чтобы лучше справляться с реалиями полного рынка, включая неудачи и исключения из листинга.
Тщательно учитывая смещение выживаемости, алгоритмические трейдеры могут разрабатывать более надежные, реалистичные и, в конечном итоге, более прибыльные торговые стратегии. Анализ выживаемости остается критическим шагом для любого серьезного квантового трейдера, стремящегося понять и снизить смещения в рыночных данных.
Этот всесторонний анализ обеспечивает целостность процессов бэктестинга и укрепляет разработку торговых алгоритмов против подводных камней чрезмерно оптимистичных исторических показателей производительности.