포트폴리오 선택을위한 수동적 인 공격적 평균 회귀 전략
포트폴리오 선택을위한 수동적 인 공격적 평균 회귀 전략
이 프로젝트는 "Passive Aggressive Mean Reversion (PAMR)"이라는 온라인 포트폴리오 선택 전략을 제안한다. 전통적인 추세 접근 방식과 달리, 제안 된 접근 방식은 금융 시장의 평균 회귀 관계에 의존한다. 기계 학습을 통한 온라인 수동 공격 학습 기법을 통해 제안 된 포트폴리오 선택 전략은 시장의 평균 회귀 특성을 효과적으로 활용할 수 있습니다. PAMR의 업데이트 계획을 분석함으로써 포트폴리오 수익률과 변동성 위험 사이의 거래가 좋고 평균 수익률 거래 원칙을 반영한다는 것을 알 수 있습니다. 또한 PAMR과 다른 전략을 혼합 한 혼합 알고리즘을 포함하여 PAMR 알고리즘의 여러 변형을 제시합니다. 우리는 다양한 실제 데이터 세트에서 제안 된 알고리즘의 경험적 성능을 평가하기 위해 광범위한 수치 실험을 수행합니다. 권장되는 결과는 대부분의 경우 제안 된 PAMR 전략이 다양한 성능 메트릭에 따라 모든 벤치 마크와 거의 모든 최첨단 포트폴리오 선택 전략보다 우수한 것으로 나타났습니다. 우수한 성능 외에도 제안 된 PAMR은 매우 빠르게 실행되므로 실제 온라인 거래 응용 프로그램에 매우 적합합니다.
제안 된 기사.
이 백서에 대한 업데이트 또는 게시 중단 요청을 제출하려면 업데이트 / 수정 / 삭제 요청을 제출하십시오.
PAMR : 포트폴리오 선택을위한 수동적 인 공격적 평균 회귀 전략.
Bin Li Peilin Zhao 스티븐 C. H. 호이 저자 비브 카난 고파 크리슈 난.
이 기사에서는 "Passive Aggressive Mean Reversion"(PAMR)이라는 온라인 포트폴리오 선택 전략을 제안합니다. 전통적인 추세 접근 방식과 달리, 제안 된 접근 방식은 금융 시장의 평균 회귀 관계에 의존한다. 기계 학습을 통한 온라인 수동 공격 학습 기법을 통해 제안 된 포트폴리오 선택 전략은 시장의 평균 회귀 특성을 효과적으로 활용할 수 있습니다. PAMR의 업데이트 계획을 분석함으로써 포트폴리오 수익률과 변동성 위험 사이의 거래가 좋고 평균 회귀 거래 원칙을 반영한다는 것을 알 수 있습니다. 또한 PAMR과 다른 전략을 혼합 한 혼합 알고리즘을 포함하여 PAMR 알고리즘의 여러 변형을 제시합니다. 우리는 다양한 실제 데이터 세트에서 제안 된 알고리즘의 경험적 성능을 평가하기 위해 광범위한 수치 실험을 수행합니다. 권장되는 결과는 대부분의 경우 제안 된 PAMR 전략이 다양한 성능 메트릭에 따라 모든 벤치 마크와 거의 모든 최첨단 포트폴리오 선택 전략보다 우수한 것으로 나타났습니다. 탁월한 성능 외에도 제안 된 PAMR은 매우 빠르게 실행되므로 실제 온라인 거래 응용 프로그램에 매우 적합합니다. 소스 코드와 데이터 세트를 포함한 실험용 테스트 베드는 cais. ntu. edu. sg/에서 구할 수 있습니다.
편집자 : Nicolo Cesa-Bianchi.
1. 소개.
포트폴리오 선택 (PS)은 장기적으로 누적 자산이나 리스크 조정 수익을 극대화하는 것과 같은 특정 목표를 달성하기 위해 자산 집합간에 자산을 투자하는 전략을 결정해야하는 실용적인 금융 공학 문제입니다. 이 기사에서는 공개적으로 사용 가능한 정보를 기반으로 포트폴리오를 순차적으로 결정하는 순차적 포트폴리오 선택 (온라인 포트폴리오 선택이라고도 함) 전략을 조사합니다.
전통적으로 금융 분야에서 포트폴리오는 종종 수익률과 위험 사이의 거래를 위해 평균 분산 이론 (Markowitz 1952, 1959) 또는 그 변형에 따라 선택됩니다. 최근 몇 년 동안, 이 문제는 기계 학습, 데이터 마이닝, 정보 이론 및 통계의 분야에서 뿌리를두고 포트폴리오 관점을 선택하는 학습에서 활발히 연구되었습니다. 전산 인텔리전스 기술을 사용하여 단일 재고로 거래하는 대신 포트폴리오 접근 방식을 선택하는 학습은 여러 자산 / 주식으로 구성된 포트폴리오에 초점을 맞 춥니 다. 기계 학습 공식 및 효과적인 최적화 솔루션으로 종종 특징 지어지는 온라인 포트폴리오 선택을위한 몇 가지 접근법이 문헌 (Kelly 1956, Breiman 1961, Cover 1991, Ordentlich and Cover 1996, Helmbold 외 1996, Borodin and El-Yaniv 1998 Borodin et al 2000, 2004, Stoltz and Lugosi 2005, Hazan 2006, Györfi et al 2006, Blum and Mansour 2007, Levina and Shafer 2008, Györfi et al 2008). 광범위하게 연구되고 있음에도 불구하고, 대부분의 접근법은 일부 측면이나 다른면에서 제한적입니다.
이 연구의 목표는 온라인 학습 기법을 사용하여 금융 시장을 개척하는 새로운 온라인 포트폴리오 선택 전략을 조사하는 것입니다. 기존의 전략 중 일부는 추세를 따르는 방식을 채택합니다. 즉, 가격 상대가 과거 거래일을 따른다고 가정합니다. 그러나 가격 친척이 특정 방향으로 가지 않고 일정 범위 내에서 적극적으로 움직이는 경우이 철학은 실패합니다. 따라서이 연구에서 온라인 기계 학습 프레임 워크를 통해 재무에 대한 또 다른 잘 알려진 원리, 즉 평균 회귀 (Jegadeesh 1990)를 활용합니다. 이를 위해 우리는 온라인 패시브 공격 학습 (Crammer et al. 2006)에 의한 금융 시장의 평균 회귀 재산을 이용하는 "수동 공격적 회귀 분석 (Passive Aggressive Mean Reversion : PAMR)"이라는 새로운 포트폴리오 선택 전략을 제안합니다. PAMR의 주요 아이디어는 평균 회귀 재산을 효과적으로 활용할 수있는 새로운 손실 함수를 공식화 한 다음 누적 수익을 극대화하기 위해 수동적 인 공격적 온라인 학습을 채택하여 자산 풀 중에서 최적의 포트폴리오를 검색하는 것입니다.
다른 시나리오 하에서 제안 된 PAMR 전략은 수동적으로 마지막 포트폴리오를 유지하거나 평균 복귀 원칙을 따라 적극적으로 새로운 포트폴리오에 접근합니다. 세 가지 잘 정의 된 최적화 문제를 해결함으로써 우리는 세 가지 간단한 포트폴리오 업데이트 규칙에 도달합니다. 마지막 포트폴리오 업데이트 계획이 포트폴리오 수익률과 변동성 위험 간의 특정 절충에 도달하고 평균 회귀 매매 룰을 명시 적으로 반영한다는 사실을 발견하는 것은 흥미 롭습니다. 또한, PAMR과 다른 전략을 혼합 한 혼합 알고리즘을 제안하고 하나의 보편적 인 전략이 포함될 경우 그 혼합이 보편적 일 수 있음을 보여줍니다. PAMR의 주요 이점은 경쟁 우위의 성능과 상당히 매력적인 계산 시간 효율성입니다. 다양한 실제 데이터 세트에 대한 광범위한 수치 실험 결과에 따르면 대부분의 경우 제안 된 PAMR 전략은 다양한 성능 메트릭에서 최첨단 포트폴리오 선택 전략에 비해 상당히 효율적입니다. 동시에 제안 된 전략은 주식 수와 거래일 수에 대한 선형 시간 비용이 소요되며 백 테스트에서의 계산 시간은 경쟁 업체보다 훨씬 적어 실제 규모로의 적용 가능성을 보여줍니다 온라인 응용 프로그램.
우리는 "Passive Aggressive Mean Reversion"(PAMR)이라는 온라인 포트폴리오 선택을위한 새로운 알고리즘을 제안합니다. 우리가 아는 한, 금융에서의 평균 복귀 속성과 기계 학습에서의 강력한 온라인 수동 공격 형 학습 기술을 모두 활용 한 최초의 포트폴리오 선택 전략입니다.
우리는 제안 된 PAMR 알고리즘과 다른 보편적 인 전략을 혼합하여 이론적으로 보장 된 보편적 혼합 전략의 결과로 혼합 알고리즘을 제안한다.
우리는 PAMR의 최종 포트폴리오 업데이트 계획을 분석하여 포트폴리오 수익률과 변동성 위험 간의 특정 상충 관계와 근본적으로 관련이 있음을 보여줍니다.
우리는 다양한 시장의 많은 최신 데이터 세트에 대한 광범위한 수치 실험을 수행합니다. 결과는 대부분의 경우 제안 된 PAMR 전략이 벤치 마크 (시장 지수, 최선의 주식 및 뒤늦은 관찰에서 일정한 균형 잡힌 포트폴리오 (Cover 1991) 포함)을 능가 할뿐만 아니라 아래의 다양한 최첨단 전략을 능가한다는 것을 보여줍니다 테스트 된 다양한 성능 메트릭.
우리는 또한 실제 포트폴리오 선택 작업, 즉 거래 비용 및 마진 구매에 대한 실제 문제를 다루기 위해 제안 된 전략을 확장하고 광범위한 경험적 연구를 통해 실용 가능성을 보여줍니다.
제안 된 알고리즘의 시간 복잡도는 거래일 당 주식수에 대해 선형 적이며, 백 테스트에서의 경험적 계산 시간은 예술과 비교할 때 상당히 경쟁적이어서 제안 된 전략이 온라인 대규모 실제 응용 프로그램.
나머지 기사는 다음과 같이 구성됩니다. 2 절에서는 공식적으로 온라인 포트폴리오 선택 문제를 기술합니다. 3 절에서는이 문제를 다루는 기존의 최첨단 접근법을 검토하고 한계를 강조합니다. 4 장에서는 제안한 PAMR 전략을 제시하고 알고리즘을 분석한다. 5 장에서는 역사적인 금융 시장에 대한 광범위한 경험적 연구를 통해 PAMR의 유효성을 검증한다. 마지막으로, Sect. 6에서는이 기사를 요약하고 향후 방향을 제시합니다.
... 2. 제점 설정.
우리가 투자하고자하는 자산이있는 금융 시장을 고려해 봅시다. n 개의 거래 기간에 대한 자산 가격의 변화는 음이 아닌 0이 아닌 가격의 상대 벡터 \ (> _, \ ldots,> _ \ in> _ ^ \)의 시퀀스로 표현됩니다. xn을 사용하여 이러한 벡터 시퀀스를 나타냅니다. t 번째 벡터 x ti의 i 번째 구성 요소는 t 번째 거래일에 i 번째 자산의 종가와 마지막 종가의 비율을 나타내므로 t 번째 거래일의 i 번째 자산에 대한 투자는 x ti.
순차적 의사 결정 문제로서의 포트폴리오 선택.
거래 비용 :이 포트폴리오 선택 모델에는 거래 비용이나 세금이 없다고 가정합니다.
시장 유동성 : 주어진 거래 기간의 마지막 종가로 필요한 수량을 매매 할 수 있다고 가정합니다.
충격 비용 : 본 연구에서는 시장 행동이 포트폴리오 선택 전략에 영향을받지 않는다고 가정합니다.
3 관련 연구.
이 섹션에서는 인기있는 포트폴리오 선택 접근법과 제안 된 접근 방식에 영감을주는 일부 기계 학습 및 거래 철학을 검토합니다.
3.1 벤치 마크 접근법.
가장 보편적 인 기준은 BAH (Buy-and-Hold) 전략입니다. 즉, 자산 포트폴리오에 자산을 투자하고 초기 포트폴리오를 보유하고 항상 포트폴리오를 보유합니다. 균일 한 초기 포트폴리오를 가진 BAH 전략은 본 연구에서 시장 지수를 산출하는 시장 전략으로 채택 된 획일적 BAH 전략이라고합니다. 정적 BAH 전략과는 달리, 활성 거래 전략은 일반적으로 전체 거래 기간 동안 정기적으로 포트폴리오를 변경합니다. 고전적인 적극적인 전략은 매 거래일마다 각 기초 자산에 투자자의 부의 일정 부분을 유지하는 CRP (Constant Rebalanced Portfolios) (Cover and Gluss 1986)입니다. 가장 좋은 CRP 전략은 종종 Best CRP (BCRP)라고 불리는데, 이는 궁극적으로는 뒷전 전략 일뿐입니다. CRP 전략은 적극적인 거래에 대한 시장 변동을 활용할 수 있으며 그 기본 아이디어는 평균 회귀 원칙에 기초하거나 "Buy Low, Sell High"로 알려져 있습니다. CRP 전략에 대한 거래 비용 문제를 처리하기 위해 Blum과 Kalai (1999)는 매 거래일이 아닌 거래 기간의 끝 부분에서 잠재적 인 수익 및 잠재적 거래 비용과 초기 포트폴리오의 균형을 부분적으로 조정하는 준 CRP를 제안했습니다.
3.2 온라인 학습.
이 섹션에서는 온라인 컴퓨터 학습 (Rosenblatt 1958, Crammer and Singer 2003, Cesa-Bianchi 외 2004, Crammer 외 2006, Fink 외 2006)에 대한 관련 작업을 간략하게 소개합니다. 작업. Perceptron 알고리즘 (Rosenblatt 1958, Freund and Schapire 1999)은 잘못 분류 될 때 일정한 무게로 새로운 예를 추가하여 학습 기능을 업데이트하는 중요한 온라인 접근 방법 중 하나입니다. 최근 온라인 학습 알고리즘은 최대 마진의 기준에 근거하여 제안되었다 (Li and Long 1999, Gentile 2001, Kivinen 외 2001, Crammer and Singer 2003, Crammer 외 2006, Zhao et al 2011). 예를 들어, Relaxed Online Maximum Margin (ROMMA) (Li 및 Long 1999) 알고리즘은 반복적으로 기존 학습 예제를 최대 마진으로 분류하는 하이퍼 평면을 선택합니다. Passive Aggressive (PA) (Crammer et al. 2006) 알고리즘은 새로운 예제가 잘못 분류되거나 분류 점수가 사전 정의 된 임계 값을 초과하지 않을 때 분류 기능을 업데이트합니다. 경험적 연구에서 보듯이 최대 마진 기반 온라인 학습 알고리즘은 일반적으로 퍼셉트론 알고리즘보다 효과적입니다. 이 기사에서, 우리는 Passive Aggressive Learning이라는 개념을 주로 채택합니다. 왜냐하면 그것은 Sect에 더 자세히 설명 된 것처럼 우리의 동기에 적합하기 때문입니다. 4.1.
3.3 포트폴리오 선택 학습.
포트폴리오 선택을 배우는 것은 정보 이론과 기계 학습에서 광범위하게 연구되었습니다. 일반적으로 전략은 하나의 최적 전략 (시장 전략, BCRP 전략 도전, 또는 매 거래일마다 가장 좋은 주식을 선택하는 Oracle 전략 일 수도 있음)을 선택하고 동일한 누적 수익을 얻으려고 시도합니다. 전략의 후회는 달성 된 대수 적 누적 부의 성과 최적의 전략의 누적 틈 사이의 격차로 정의됩니다.
포트폴리오를 선택하는 학습의 중요한 유형 중 하나는 최적 전략으로 BCRP 전략을 선택하는 후회 최소화 접근 방식입니다. Cover (1991)는 유니버설 포트폴리오 (UP) 전략을 제안했는데, 포트폴리오는 모든 지속적인 균형 조정 된 포트폴리오 전문가의 과거 성과 가중 평균이다. Cover의 UP에 의해 얻어진 후회는 O (m log n)이고, 실행 시간의 복잡도는 O (n m)이다. 여기서 m은 주식의 수를 나타내고 n은 거래 일수를 나타낸다. 구현은 주식 수에 기하 급수적이므로 실험 및 실제 응용에 사용되는 자산의 수를 제한합니다. Kalai와 Vempala (2002)는 빠른 혼합 시간 (O (m 7 n 8))을 요구하는 급속하게 혼합되는 비 균일 랜덤 보행을 기반으로 Cover 's UP을 시간 효율적으로 구현했습니다. Cover & Ordentlich (1996)는 부차적 인 정보 1이 유한 값으로 고려 될 때 보편적 인 절차를 개발했다. Cross and Barron (2003)은 표준 CRP 클래스보다 더 일반적인 선형 매개 변수화 된 포트폴리오 시퀀스의 목표 클래스 내에서 달성 할 수있는 최고의 원근감을 추적하는 새로운 보편적 포트폴리오 전략을 제안하고 포트폴리오가 과거 가격 또는 기타 부가 정보. Belentepe (2005)는 Cover 's UP에 대한 통계적 관점을 제시하여 Cover의 UP를 전통적인 평균 분산 이론과 연결하는 제약적인 순차적 포트폴리오 최적화와 거의 동일하다는 것을 보여주었습니다.
또 다른 유명한 전략은 곱셈 업데이트를 사용한 온라인 포트폴리오 선택을위한 지수 기온 변화도 (EG) 전략 (Helmbold 외 1997, 1996)입니다. 일반적으로 EG 전략은 예상되는 로그 포트폴리오의 일일 수익률 (최종 가격 상대 값을 사용하여 근사값)을 최대화하고 다음 포트폴리오와 마지막 포트폴리오 간의 편차를 최소화하려고 시도합니다. EG에 의해 얻어진 후회는 O (mn) 실행 시간과 함께 O (\ (\ sqrt \))입니다. 후회가 Cover의 UP만큼 단단하지는 않지만 선형 시간 복잡도는 후자보다 훨씬 적습니다.
최근 볼록 최적화가 포트폴리오 선택 문제를 해결하기 위해 적용되었다 (Agarwal et al 2006, Agarwal and Hazan 2005, Hazan 2006, Hazan et al 2007). 예를 들어 예상되는 로그 누적 부를 최대화하고 (역사적 가격 친척을 사용하여 근사화 함) 예상 포트폴리오의 변동을 최소화하기위한 Online Newton Step (ONS) 전략 (Agarwal et al. 2006)이 있습니다. ONS는 로그 자산 기능의 2 차 정보를 이용하여이를 온라인 시나리오에 적용합니다. 그것은 이론적으로 Cover의 UP와 같은 O (m log n)의 후회를 성취하며 O (m 3 n)의 시간 복잡성을 가지고있다. ONS에 이어, Hazan과 Seshadhri (2009)는 근본적으로 ONS 기반 전략 인 좀 더 적절한 이론 결과로 새로운 적응 후회 접근법을 제안했다.
포트폴리오 선택을위한 또 다른 유망한 방향은 최적 전략으로 오라클에 접근한다는 개념에 기반한 자산 최대화 접근 방식입니다. 이 아이디어는 Borodin et al. (2004)는 Anti-Correlation (Anticor)이라는 이름의 비 유니버설 포트폴리오 전략을 제안했다. 후회 최소화 접근법과 달리 Anticor 전략은 금융 시장의 통계적 특성을 이용합니다. 근본적인 동기는 긍정적 인 지연된 교차 상관 관계 및 부정적인 자기 상관의 일관성에 내기하는 것입니다. 역사적인 주가 친척의 통계 정보를 활용하고 포트폴리오의 자산을 이전하기위한 고전적 평균 회귀 거래 아이디어를 채택합니다. 이론적 인 보장은 없지만 경험적 결과 (Borodin et al. 2004)는 Anticor가 대부분의 기존 전략보다 우수한 것으로 나타났다. Anticor 전략에 의한 욕심 많은 알고리즘과는 달리, Li et al. (2011b)는 Anticor보다 우수한 성능을내는 포트폴리오의 평균 회귀 특성과 2 차 정보를 적극적으로 활용하기 위해 최근에 CWMR (Confidence Weighted Mean Reversion) 전략을 제안했습니다.
또한, Györfi et al. (2006)는 최근 비모수 적 예측 기법 (Györfi and Schäfer 2003)에 기반한 포트폴리오 선택을위한 Nonparametric Kernel-based Moving Window (B K) 학습 전략의 프레임 워크를 소개했다. 그들의 알고리즘은 먼저 최근의 시장 창과의 유클리드 거리가 임계 값보다 작은 유사한 과거 가격 상대 순서의 목록을 식별 한 다음 비슷한 순서의 목록과 관련하여 포트폴리오를 최적화합니다. 동일한 틀 하에서, Györfi et al. (2007)은 Nonparametric Kernel 기반 Semi-log-optimal 전략이라고 불리는 또 다른 변종을 제안했다. 이것은 주로 계산 효율을 향상시키기 위해 B K 전략의 근사치이다. Markowitz 유형 유틸리티 함수에 의한 로그 유틸리티 함수를 대체 한 Ottucsák and Vajda (2007)는 수익 및 위험 (또는 평균 및 분산)을 온라인 포트폴리오 선택 전략과 연결하는 비모수 적 커널 기반 Markowitz 유형 전략을 제안했습니다. B K 전략과 동일한 구조에 따라, Györfi et al. 에서 제안 된 Nonparametric Nearest Neighbor 학습 (B NN) 전략. (2008)는 특정 유클리드 공 (Euclidean ball) 내의 검색 가격 친척이 아닌 역사 가격 상대 순서로 ℓ 가까운 이웃을 검색하는 것을 목표로한다. 이 방법은 경험적으로 강력한 거래 전략으로 나타났습니다. 이 방향을 따라, Li et al. (2011a)는 최근에 상관 계수를 통해 유사한 가격 친척을 검색하고 비모수적 학습 접근법의 경험적 성과를 크게 향상시키는 Correlation-driven Nonparametric learning (CORN) 전략을 제안했다.
포트폴리오를 선택하는 학습의 주요 흐름 외에도, 다양한 유형의 거래 전략은 다양한 전략 간 전환, 즉 전략 간의 확률 분포 유지에 기반합니다. Singer (1997)는 매 거래일마다 시장이 행동을 바꿀 가능성을 고려하여 변화하는 시장을 다루기 위해 Switching Portfolios (SP)를 제안했다. 그것은 일련의 기본 투자 전략 사이를 전환하고 하나의 기본 전략을 사용하는 선험적 기간이 기하학적으로 분산되어 있다고 가정합니다. Levina and Shafer (2008)는 Markov 스위칭 전략 인 Gaussian Random Walk (GRW) 전략을 제안했다. GRW는 포트폴리오의 단순성에서 Gaussian random walk와 같은 기본 투자 전략을 전환합니다.
마지막으로 우리는 우리의 연구가 문학 작품의 다른 위대한 작품과 매우 다르다는 것을 주목한다 (Kimoto et al., Tay and Cao 2001; Cao and Tay 2003; Tsang 외 2004; Lu et al. 2009). 신경 네트워크 (Kimoto et al. 1993), 의사 결정 나무 (Tsang et al. 2004), 지원 벡터 머신 (SVM)과 같은 기계 학습 기술을 적용하여 금융 시계열 예측 및 주가 예측을 시도했습니다 (Tay and Cao 이러한 작업과 우리의 주요 차이점은 학습 목표가 미래의 가격 / 추세에 대한 명시적인 예측을하는 것이고 학습 목표는 예측하지 않고 포트폴리오를 직접 최적화하는 것임을 알 수 있습니다 가격.
3.4 기존 연구의 분석.
실제로 인기있는 트레이딩 아이디어 중 하나는 트렌드 추세 또는 모멘텀 전략으로, 역사적으로 실적이 좋은 종목이 향후 다른 종목보다 실적이 좋을 것으로 가정합니다. EG 및 ONS와 같은 일부 기존 알고리즘은 역사적 가격 친척을 사용하여 예상되는 로그 일일 수익 및 로그 누적 수익을 각각 추정합니다. 이 아이디어는 이해하기 쉽고 세계의 많은 상인과 투자자들에게 운명을 안겨주지만 추세는 효과적으로 구현하기가 어렵습니다. 또한 단기적으로 Jegadeesh (1990)와 Lo와 MacKinlay (1990)에 의해 경험적으로 증명 된 바와 같이 주가 친척들은 이전의 추세를 따르지 않을 수도있다.
경향 추종 접근법 외에도 학습 공동체에서 널리 채택 된 또 다른 접근법은 반전 접근법 (Cover and Gluss 1986; Cover 1991, Borodin et al. 이 접근법은 CRP 전략 (Cover and Gluss 1986)에 기인하며 매 거래일마다 초기 포트폴리오에 균형을 맞 춥니 다. 이 접근 방식의 아이디어는 한 주식이 다른 주식보다 나 빠지면 다음 거래일에 다른 주식보다 실적이 좋은 경향이 있다는 것입니다. 결과적으로 역 투자 전략의 특징은 과거 실적이 저조한 유가 증권 매매와 잘 수행 된 유가 증권 매각, 또는 단순히 "매도인 매도, 매수인 매도"입니다. Lo와 MacKinlay (1990)에 따르면, 평균 회귀의 효과는 증권을 가로 지르는 긍정적 인 교차 - 자동 변이의 결과이다. 기존 알고리즘 중에서 CRP, UP 및 Anticor는이 거래 아이디어를 채택합니다. 그러나 Anticor 알고리즘 (Borodin et al. 2004)의 경험적 증거는 평균에 대한 능동적 인 복귀가 금융 시장의 변동을보다 잘 활용할 수 있으며 훨씬 높은 수익을 얻는 것으로 나타났음을 CRP 및 UP가 수동적으로 평균으로 되돌립니다. 반대로 Anticor는 적극적으로 평균으로 돌아가지만 통계적 상관 관계에 기반한 발견 적 방법으로 포트폴리오 내의 부를 이전합니다. 즉, 평균 회귀 특성을 효과적으로 활용하지 못할 수 있습니다.
그 사이에, 패턴 매칭 기반 비모수 적 학습 알고리즘 (B K 및 B NN 등)은 평균 복귀 및 추세 추적을 포함한 많은 시장 조건을 식별 할 수 있습니다. 그러나 유사한 가격 친척을 찾을 때, 비모수적 학습 접근법은 패턴이 본질적으로 반대 인 가격 친척에 따라 평균 회귀와 추세를 찾아 예상 누적 부의 최대화를 약화시킬 수 있습니다.
즉, 추세 추종과 평균 회귀는 모두 적절하게 사용된다면 금융 시장에서 이익을 창출 할 수 있습니다. 다음에서 우리는 적극적인 평균 회귀 기반 포트폴리오 선택 방법을 제안 할 것이다. 업데이트 규칙은 간단하지만, 대부분의 경우 위의 기존 포트폴리오 선택 전략보다 경험적으로 더 우수합니다. 제안 된 포트폴리오 선택 전략의 성공은 평균 회귀 매매 아이디어를 적절하게 활용하고 실제 시장 데이터를 사용하여 백 테스트에서 상당히 높은 수익을 창출한다는 것을 나타냅니다.
4 포트폴리오 선택을위한 수동적 인 공격적 평균 회귀 접근법.
4.1 직감과 개요.
평균 반향 거래 아이디어를 보여주기 위해 CRP의 동기 부여 예.
제안 된 PAMR 알고리즘의 또 다른 동기는 금융 위기에서 모든 주식이 동 기적으로 떨어지거나 특정 주식이 현저히 떨어지는 사실로부터 영감을 얻습니다. 이러한 상황에서 최근의 금융 위기 당시 Bear Stearns와 같은 "광산"주식에 너무 많은 부를 쏟기 때문에 적극적으로 재조정하는 것은 적절하지 않을 수 있습니다. 그러한 "광산"주식과 관련한 잠재적 인 위험을 피하기 위해 CRP 전략을 구성하는 이전 포트폴리오를 고수하는 것이 좋은 선택입니다. 여기서 수동적 인 CRP 전략을 선택하는 이유는 이러한 "광산"주식을 선험적으로 식별하는 것이 거의 불가능하기 때문에 일반적으로 추후에 알려져 있습니다. 따라서 PAMR은 그러한 상황에서 너무 많은 고통을 피하기 위해 시장 상황에 따라 전략을 "적극적"및 "수동적"반향으로 전환합니다. 수동적 평균 회귀 전략은 이러한 "광산"주식에 거의 모든 부를 축적 할 수있는 공격적인 접근 방식의 위험성을 피할 수 있습니다.
이 기사에서 우리는 "Passive Aggressive Mean Reversion"이라는 짧은 거래 전략, 즉 PAMR을 제안합니다. 한편으로, 우리의 접근 방법의 기본 가정은 다음 거래일에 실적이 좋은 종목이 다른 종목보다 더 나쁠 것이라는 것입니다. 반면에 시장이 너무 많이 떨어지면 특정 "광산"주식과 그와 관련된 위험을 피하기 위해 포트폴리오의 재조정을 적극적으로 중단 할 것입니다. 이러한 직감을 이용하기 위해서는 원래 분류 작업을 위해 제안 된 Passive Aggressive (PA) 온라인 학습 (Crammer 외. 2006)을 채택하는 것이 좋습니다. 느슨하게 말하자면 분류를위한 PA의 기본 아이디어는 손실이 0이면 이전 솔루션을 수동으로 유지하는 반면 고통 손실이 0이 아닌 경우 공격적으로 솔루션을 업데이트한다는 것입니다.
이제 제안 된 전략의 기본 아이디어를 자세히 설명해 보겠습니다. 첫째, 포트폴리오 일일 수익률이 특정 임계 값보다 낮 으면 잠재적 인 "광산"주식을 피하기 위해 수동적으로 평균으로 되돌아 가도록 이전 포트폴리오를 유지하려고 노력할 것입니다. 둘째, 포트폴리오 일일 수익률이 임계치를 초과하는 경우, 우리는 다음 주 거래일에 주가가 하락할 것이라는 믿음으로 예상 포트폴리오 일일 수익률이 임계치 이하가되도록 포트폴리오를 재조정합니다. 이것은 반 직관적 인 것으로 들리지만, 주가 상대 수익률로 돌아 오면 예상 포트폴리오를 일일 수익률보다 낮게 유지하는 것이 다음 거래일에 높은 포트폴리오 일일 수익률을 유지할 수 있기 때문에 실제로 합리적입니다. 여기서 예상 포트폴리오 수익률은 예를 들어 우리의 연구에서 EG 알고리즘 (Helmbold et al. 1997, 1996)과 일치하는 마지막 가격 상대 값과 같은 역사적 가격 친척에 대해 계산됩니다.
BCRP와 PAMR 전략 비교의 동기 부여 예.
PAMR 업데이트에 대한 임계 값이 1로 설정되어 있다고 가정합니다. 즉, 포트폴리오 일일 수익이 1 미만인 경우 기존 포트폴리오를 그대로 유지합니다. 우리의 전략은 포트폴리오 \ ((\ frac, \ frac) \)로 시작합니다. 첫 번째 거래일의 수익은 \ (\ frac & gt; 1 \)입니다. 그런 다음 2 거래일 초에 마지막 가격 친척에 기초한 포트폴리오 일일 수익률이 임계 값 1 미만인 조건을 만족하도록 포트폴리오를 재조정하고 결과 포트폴리오는 \ ((\ frac, \ frac) \) . 대략적인 포트폴리오 수익률이 임계치 이하인 포트폴리오를 구축 한 것으로 보이지만 실제로는 평균 수익률의 반전으로 인해 다음 영업일에 포트폴리오 수익률을 극대화합니다. 우리가 볼 수 있듯이 2 거래일의 수익은 \ (\ frac> 1 \)입니다. 같은 규칙에 따라 포트폴리오를 \ ((\ frac, \ frac) \)에 재조정합니다. 결과적으로, 그러한 시장에서, 제안 된 전략의 성장률은 BCRP보다 월등히 우수한 기간 동안 \ (\ frac \ times (\ frac) ^ \), 즉 \ ((\ frac) ^ \).
4.2 정립.
이제 포트폴리오 선택 문제에 대한 PAMR (Passive Aggressive Mean Reversion) 전략을 공식적으로 고안해 보겠습니다. PAMR 전략은 Sect에 설명 된 평균 회귀 아이디어를 기반으로합니다. 4.1이며 Passive Aggressive (PA) 온라인 학습 기술을 갖추고있다 (Crammer et al., 2006).
다음 부분에서는 제안 된 전략의 세 가지 변형을 공식화하고 후속 절에서이를 해결하기위한 특정 알고리즘을 제안합니다. b t가 t 번째 거래일의 포트폴리오 벡터를 나타냄을 상기하자면 PAMR (Passive Aggressive Mean Reversion)에 대한 첫 번째 제안 된 방법은 아래의 제약 최적화로 공식화됩니다.
최적화 문제 1.
위의 공식은 우리의 우려 사항을 해결하기에 합리적이지만 현실적인 금융 시장에서 흔히 볼 수있는 가격이 비싼 친척이있는 상황에서는 바람직하지 않은 속성이있을 수 있습니다. 예를 들어, 일부 추세 순서에 나타나는 시끄러운 가격의 상대적인 가격이 공격적인 업데이트로 인해 갑자기 잘못된 방향으로 변경 될 수 있습니다. 이러한 문제를 피하기 위해 우리는 공격성과 수동성 사이에서 균형을 유지할 수있는 PAMR의 두 가지 변종을 제안합니다. 두 가지 PAMR 변형을 공식화하려는 아이디어는 최적화에 비 음수 슬랙 변수를 도입하여 소프트 마진 지원 벡터 머신과 유사합니다. 특히, 첫 번째 변형에서 ξ에 대해 선형 적으로 비례하는 항을 도입하여 목적 함수를 수정함으로써 다음과 같은 최적화를 얻습니다.
최적화 문제 2.
여유 변수의 선형 항을 사용하는 대신 두 번째 변형에서 ξ에 대해 2 차적으로 비례하는 여유 변수를 도입하여 목적 함수를 수정합니다. 다음과 같은 최적화 문제가 발생합니다.
최적화 문제 3.
4.3 알고리즘.
볼록 분석의 표준 기법을 사용하여 위의 세 가지 PAMR 공식에 대한 근사 솔루션을 유도하고 포트폴리오 선택 작업을 위해 제안 된 PAMR 알고리즘을 제시합니다. 특히, 다음 세 가지 제안은 PAMR 방법에 대한 솔루션을 요약합니다.
명제 1.
증거는 부록 A에 나와 있습니다. □
발의안 제 2 호.
증거는 부록 B에 나와 있습니다. □
명제 3.
증거는 부록 C에 나와 있습니다. □
제안 된 Passive Aggressive Mean Reversion (PAMR) 전략.
4.4 분석과 해석.
평균 회귀 거래 개념을 반영하기 위해 제안 된 PAMR 알고리즘의 결과 업데이트 규칙을 분석하는데 관심이 있으며, 주로 포트폴리오 b t +1과 단계 크기 τ t가 관련된다. 특히 포트폴리오 선택 작업에서 가장 중요한 두 가지 고려 사항 인 업데이트 규칙이 수익 및 위험과 어떻게 관련되어 있는지 살펴보고자합니다.
우선, 3 개의 PAMR 알고리즘에 대해 (5)에서 결과로 나온 포트폴리오 업데이트 규칙을 분석합니다. 즉, \ (\ mathbf _ = \ mathbf _ - \ tau_ (_ - \ bar _ \ mathbf \) \)입니다. 업데이트 규칙에서 단계 크기 τt는 음수가 아니며 \ (\ bar> _ \)는 평균 수익 또는 시장 수익률입니다. For term \( _ -\bar _ \mathbf >\) , we can see it represents stock abnormal returns with respect to the market on the t th trading day. More precisely, we can interpret it as the directional vector for the weight transfer. The negative sign before the term indicates that the resulting update scheme is consistent with the motivation, that is, the weights shall be transferred from better performing stocks (with positive abnormal returns) to worse performing stocks (with negative abnormal returns) at the beginning of next day.
Besides, another important update is the step size τ t calculated as ( 6 ), ( 7 ), and ( 8 ), for three PAMR methods, respectively. The step size τ t adaptively controls the weights to be transferred by taking effect on the directional vector. One interesting term in common for the three updates of τ t is \(\frac ^ > _ -\bar _ \mathbf \Vert ^ >\) . The numerator of the term equals to the t th portfolio daily return minus the mean reversion threshold. Assuming other variables are constant, if the return is high (low), it leads to a large (small) value of τ t , which would more (less) aggressively transfer the wealth from better performing stocks to worse performing stocks. The denominator is essentially the market quadratic variability, that is, the number of stocks times the market variance of the t th trading day. In modern portfolio theory, variance of stock return is typically regarded as a volatility risk term for a portfolio (Markowitz 1952 ). As indicated by the denominator, if the risk is high (low), the step size τ t would become small (large). As a result of small (large) step size, the weight transfer made by the update scheme will be weakened (strengthened), which is consistent with our intuition that prediction would be not accurate in drastically dropping markets, and we opt to make relatively less transfer in order to reduce risk. Moreover, PAMR-1 caps the step size by a constant C , while PAMR-2 decreases the step size by adding a constant \(\frac \) to its denominator. Both measures can prevent drastic weight transfer in case of noisy price relatives, which is consistent with their motivations.
From the above analysis on the updates of direction and step size, we can conclude that PAMR nicely balances between return and risk and clearly reflects the mean reversion trading idea. To the best of our knowledge, this important trade-off between return and risk has been considered by only one existing approach, that is, nonparametric kernel-based Markowitz-type strategy (Ottucsák and Vajda 2007 ). While the kernel-based Markowitz-type strategy trades off the return and risk with respect to similar historical price relatives, the proposed PAMR explicitly trades off the return and risk with respect to last price relatives. This nice property distinguishes the proposed approach from most existing approaches that often cater to return, but ignore the risk concern, and are therefore undesirable according to modern portfolio theory (Markowitz 1952 ).
Now let us briefly analyze the time complexity of the proposed PAMR algorithms. From Fig. 2 , we can see that besides the normalization step, PAMR strategy takes O( m ) per trading day, where m denotes the number of assets. Moreover, the normalization or projection step (Step 7 in Fig. 2 ) can be efficiently implemented (Michelot 1986 ; Duchi et al. 2008 ). In our implementation, we adopt the projection 2 according to Duchi et al. ( 2008 ), which takes linear time with respect to m . Thus, the total time complexity is O( mn ), where n is the total number of trading days. Such time complexity is the same as that of EG algorithm and is much superior to other existing methods. Linear time complexity enables the proposed algorithm to handle transactions in certain scenarios where low latency is of crucial importance, such as high frequency trading (Aldridge 2009 ).
4.5 Discussions.
4.5.1 Discussion on intuitions.
Although the motivating example in Sect. 4.1 demonstrates the effectiveness of PAMR over BCRP strategy, PAMR may not always outperform BCRP. In general, PAMR is an online algorithm while BCRP is offline optimal for an i. i.d. market (see Cover and Thomas 1991 , Theorem 15.3.1). Next, we discuss some possible situations where PAMR may fail to outperform BCRP.
Consider a special case where one stock crashes and the other explodes, e. g., a market sequence of two stocks as \((\frac , 2 ),(\frac , 2 ), \ldots\) . Assuming the same parameter settings as the motivating example, BCRP will increase at an exponential rate 2 n as it wholly invests in the 2nd asset, while PAMR will keep a fixed wealth on \(\frac \) over the trading period. Obviously, in such a situation, PAMR performs much worse than BCRP does, i. e., PAMR produces a cumulative wealth of \(\frac \) against 2 n achieved by BCRP over a n trading period. Though not shiny in such situations, PAMR still bounds its losses. Moreover, such a market, which violates the mean reversion assumption, is occasional, at least from the view point of our empirical studies.
4.5.2 Discussion on loss function.
In our definition of loss function, that is, ( 1 ), we use the original portfolio expected return b ⋅ x t , while it is possible to use log utility (Latané 1959 ) on the return, that is, log( b ⋅ x t ). With this log utility, the optimization problems ( 2 ), ( 3 ), and ( 4 ) are all non-convex and nonlinear, and thus difficult to solve. One way to solve these non-convex optimization problems is to use log’s first-order Taylor expansion at last portfolio and ignore the higher order terms, that is, \(\log (\mathbf \cdot\mathbf _ ) \approx\log (\mathbf _ \cdot\mathbf _ )+\frac _ > _ \cdot\mathbf _ > (\mathbf -\mathbf _ )\) . After linear approximation, the optimization problems can be solved using the same techniques used in our derivation. However, such linear approximation of loss function may have some drawbacks. First of all, linear approximation yields a upper bound on regret in terms of a log utility loss function. There is no way to justify the goodness of the linear approximation. Moreover, if we use log utility, then the loss function is flat, then sharply rises and finally flattens out. While linear approximation is good in the two flat regimes, it is typically terrible at the point of non-differentiability and sub-par in the sharply rising region.
On the other hand, for the loss function in form of ( 1 ) without log utility or with linear approximation of log utility, the best possible regret in a minimax sense is at most O( \(\sqrt \) ) (Abernethy et al. 2009 ), while true log loss minimization algorithm can routinely achieve O(log n ). However, although our loss function is non-differentiable and it would achieve a potential regret of O( \(\sqrt \) ), it is not a traditional loss function maximizing return (like traditional loss function, −log( b ⋅ x t )), but only a tool to realize mean reversion. Thus the regret achieved using our loss function does not represent a regret about return, which may not be meaningful as traditional regret bound is.
Anyway, the potential worse bound may have unknown weaknesses, which may not be elicited by the following empirical evaluations. Though on our experiments PAMR works well, anyone who cares about its theoretical aspects should be notified about the possible worse bound.
4.5.3 Discussion on formulation.
Although our formulations mainly focus on the portfolio daily return without explicitly dealing with risk (e. g., volatility of daily returns), the final derived algorithms can be nicely interpreted as certain trade-offs between risk and return, as discussed in Sect. 4.4 . Such interesting observation is further verified by our empirical evaluation in Sect. 5.4.2 , which shows that the proposed PAMR algorithms achieve good risk-adjusted return in terms of two risk-related metrics (i. e., volatility risk and drawdown risk, respectively).
Similar to previous studies, we avoid incorporating transaction cost in the original formulations, which simplifies the formulations and clearly highlights PAMR’s key ingredients. To further show the impact of transaction costs, it is not difficult to evaluate the effect of transaction costs, as shown in Sect. 5.2.2 . In the following empirical study, we present results on both cases: with and without transaction costs. From the empirical results in Sect. 5.4.5 , we find that in most markets, the proposed PAMR algorithms work well without or even with moderate transaction costs.
Besides, it is important to note that there are two key parameters in the proposed PAMR algorithm and its variants, viz., the sensitivity parameter ϵ and the aggressiveness parameter C . In practice, the choice of these parameters could affect the performance of the proposed algorithms. To achieve a good performance in a specific market, these parameters have to be finely tuned. We will thoroughly examine the effects of the two parameters on real-life datasets in Sect. 5.4.4 , and make suggestions for the empirical selection of their values.
4.5.4 Discussion on PAMR variants.
In this section, we will show an example to illustrate different behaviors of the three update rules, viz., PAMR, PAMR-1, and PAMR-2. As discussed in Sect. 4.2 , one objective for PAMR-1 and PAMR-2 is to prevent the portfolio being affected too much from noisy price relatives, which might drastically change the portfolio. Let us assume the environments and parameter settings as follows. Let the t th price relative x t =(1.00,0.01), which represents the situations that the 2nd price relative is a noise, and the t th portfolio b t =(1,0). Setting the parameters ϵ =0.30 and C =1.00, let us calculate next portfolio b t +1 . This market environment describes the situations where certain price relatives drop significantly, which is similar to some stocks during recent financial crisis. Without tuning, the original PAMR algorithm would transfer a large proportion of wealth to the 2nd asset in the next trading day. This can be verified by examining the portfolio calculated by PAMR, viz., PAMR calculates the update step size τ t =1.43 and obtains the subsequent portfolio b t +1 =(0.29,0.71). However, a natural choice of avoiding such noisy price relatives is to put less proportion of wealth to the second asset. Now, when calculating the next portfolios by PAMR-1 and PAMR-2, we obtain the update step size τ t =1.00 and τ t =0.71, respectively, which are smaller than the update step size of the original PAMR, that is, τ t =1.43. Accordingly, we obtain the next portfolios b t +1 =(0.50,0.50) and b t +1 =(0.65,0.35) for PAMR-1 and PAMR-2, respectively. Clearly, PAMR-1 and PAMR-2 transfer less wealth to the 2nd asset than the original PAMR does. Thus, PAMR-1 and PAMR-2 in general suffer relatively less from noisy price relatives, though we cannot completely avoid such suffering situation.
4.6 Mixture algorithm.
One theoretical result desired by existing online portfolio selection algorithms is universal property (Cover 1991 ). Since mean reversion trading idea is counter-intuitive (Borodin et al. 2004 ), we find it is hard to prove the universality of PAMR. Alternatively, we present a general mixture algorithm, which guarantees worst-case performance, not for PAMR itself but for the mixture algorithm.
Briefly speaking, the proposed mixture algorithm frames PAMR as one “expert” in a mixture-of-experts setting, while at least one universal algorithm serves as other “experts”. Then, the proposed mixture adopts no-regret expert learning (Cesa-Bianchi and Lugosi 2006 ) to bound the regret of the overall system with respect to the best of these experts. If the mixture algorithm contains at least one universal algorithm, 3 then the universality of the mixture algorithm can be straightforwardly proved according to Cesa-Bianchi and Lugosi ( 2006 ) (see Example 10.3 and Theorem 10.3 for rigorous proofs). In our implementation, we adopt uniform buy and hold (BAH) mixture strategy, that is, we give equal proportion of portfolio wealth to each expert, let them run, and finally pool them again. We denote the BAH mixture algorithm as “MIX”. Other expert learning methods, such as exponential weighted, can also replace the buy and hold strategy, and they can also provide provable guarantees and get potentially stronger empirical performance. Though MIX seems trivial since it has a more involved mixing rule, one can make it nontrivial by extending the setting in a more general setting, such as the framework proposed by Akcoglu et al. ( 2002 ) and Das and Banerjee ( 2011 ). Obviously, such a mixture algorithm can be applied to any portfolio selection algorithm, either universal or not.
Though it is convenient to propose a mixture model consisting of PAMR such that the mixture model can achieve universality, PAMR’s universal consistency is still an open question and deserves further exploration.
5 Numerical experiments.
To examine the empirical efficacy of the proposed PAMR strategy, we conduct an extensive set of numerical experiments on a variety of real datasets. In our experiments, we adopt six real datasets, which were collected from several diverse financial markets. The performance metrics include cumulative wealth and risk-adjusted returns (volatility risk and drawdown risk). We also compare the proposed PAMR algorithms with all existing algorithms stated in the related work section.
5.1 Experimental testbed on real data.
Summary of the six real datasets in our numerical experiments.
Jul. 3rd 1962–Dec. 31st 1984.
Jan. 1st 1985–Jun. 30th 2010.
Jan. 4th 1994–Dec. 31st 1998.
Jan. 2nd 1998–Jan. 31st 2003.
Apr. 1st 2006–Mar. 31st 2010.
Jan. 14th 2001–Jan. 14th 2003.
The first one is NYSE dataset, one “standard” dataset pioneered by Cover ( 1991 ) and followed by several other researchers (Singer 1997 ; Helmbold et al. 1996 ; Borodin et al. 2004 ; Agarwal et al. 2006 ; Györfi et al. 2006 , 2008 ). This dataset contains 5651 daily price relatives of 36 stocks 5 in New York Stock Exchange (NYSE) for a 22-year period from Jul. 3rd 1962 to Dec. 31st 1984. We denote this dataset by “NYSE (O)” for short.
The second dataset is the extended version of the above NYSE dataset. For consistency, we collected the latest data in New York Stock Exchange (NYSE) from Jan. 1st 1985 to Jun. 30th 2010, which consists of 6431 trading days. We denote this new dataset as “NYSE (N)”. 6 It is worth noting that this new dataset consists of 23 stocks rather than the previous 36 stocks owing to amalgamations and bankruptcies. All self-collected price relatives are adjusted for splits and dividends, which is consistent with the previous “NYSE (O)” dataset.
The third dataset “TSE” is collected by Borodin et al. ( 2004 ), which consists of 88 stocks from Toronto Stock Exchange (TSE) containing price relatives of 1259 trading days, ranging from Jan. 4th 1994 to Dec. 31st 1998. The fourth dataset “SP500” is collected by Borodin et al. ( 2004 ), which consists of 25 stocks with the largest market capitalizations in the 500 SP500 components. It ranges from Jan. 2nd, 1998 to Jan. 31st 2003, containing 1276 trading days.
The fifth dataset is “MSCI”, a collection of global equity indices which are the constituents of MSCI World Index. 7 It contains 24 indices which represent the equity markets of 24 countries around the world, and consists of a total of 1043 trading days, ranging from Apr. 1st 2006 to Mar. 31st 2010. The final dataset is the “DJIA” dataset collected by Borodin et al. ( 2004 ), which consists of Dow Jones 30 composite stocks. DJIA contains 507 trading days, ranging from Jan. 14th 2001 to Jan. 14th 2003.
Besides the above six real market data, in the experiments, we also ran each dataset in their reverses (Borodin et al. 2004 ). For each dataset, we created a reversed dataset, which reverses the original order and inverts the price relatives. We denote these reverse datasets using a ‘−1’ superscript on the original dataset names. In nature, these reverse datasets are quite different from the original datasets, and we are interested in the behaviors of the proposed algorithm on these artificial datasets.
Unlike the previous studies, the above testbed covers much longer trading periods from 1962 to 2010 and much more diversified markets, which enables us to examine how the proposed PAMR strategy performs under different events and crises. For example, it covers several well-known events in the stock markets, such as dot-com bubble from 1995 to 2000 and subprime mortgage crisis from 2007 to 2009. The five stocks datasets are mainly chosen to test the capability of the proposed PAMR on regional stock markets, while the “MSCI” dataset aims to test PAMR’s capability on global indices, which may be potentially applicable to “Fund on Fund” (FOF). 8 As a remark, although we numerically test the PAMR algorithm on stock markets, we note that the proposed strategy could be generally applied to any type of financial markets.
5.2 Experimental setup and metrics.
Regarding the parameter settings, there are two key parameters in the proposed PAMR algorithms. One is the sensitivity parameter ϵ and the other is the aggressiveness parameter C . Roughly speaking, the best values for these parameters are often dataset dependent. In the experiments, we simply set these parameters empirically without tuning for each dataset separately. Specifically, for all datasets and experiments, we set the sensitivity parameter ϵ to 0.5 in the three algorithms, and set the aggressiveness parameter C to 500 in both PAMR-1 and PAMR-2, with which the cumulative wealth achieved tends to be stable for the proposed PAMR on most datasets. It is worth noting that these choices for parameters are not always the best. Our experiments on the parameter sensitivity in Sect. 5.4.4 show that the proposed PAMR algorithms are quite robust with respect to different parameter settings.
For the proposed mixture algorithm (MIX), we set the expert pool 9 as initial uniform combination of PAMR, ONS, Anticor, and B NN , and individual experts are set according to their respective studies.
We adopt the most common metric, cumulative wealth , to primarily compare different trading strategies. In addition to the cumulative wealth, we also adopt annualized Sharpe Ratio (SR) to compare the performance of different trading algorithms. In general, the higher the values of the cumulative wealth, and the annualized Sharpe Ratio, the better the performance of the compared algorithm. Besides, we also adopt Maximum Drawdown (MDD) and Calmar Ratio (CR) for analyzing the downside risk of the PAMR strategy. The lower the MDD value, the more preferable the trading algorithm concerning the downside risk. The higher the CR value, the more performance efficient the trading algorithm concerning the downside risk. The performance criteria are detailed in the following section.
5.2.1 Performance criteria.
One of the standard criteria to evaluate the performance of a strategy is portfolio cumulative wealth achieved by the strategy until the end of the whole trading period. In our study, we simply set the initial wealth S 0 =1 and thus the notation S n also denotes portfolio cumulative return at the end of the n th trading day, which is the ratio of the portfolio cumulative wealth divided by the initial wealth. Another equivalent criterion is annualized percentage yield (APY) which takes the compounding effect into account, that is, \( >=\sqrt[y] _ >-1\) , where y is the number of years corresponding to n trading days. APY measures the average wealth increment that one strategy could achieve compounded in a year. Typically, the higher the value of portfolio cumulative wealth or annualized percentage yield, the more performance preferable the trading strategy is.
For some process-dependent investors (Moody et al. 1998 ), it is important to evaluate risk and risk-adjusted return of portfolios (Sharpe 1963 , 1994 ). One common way to achieve this is to use annualized standard deviation of daily returns to measure the volatility risk and annualized Sharpe Ratio (SR) to evaluate the risk-adjusted return. For portfolio risk, we calculate the standard deviation of daily returns, and multiply by \(\sqrt \) (here 252 is the average number of annual trading days) to obtain annualized standard deviation. For risk-adjusted return, we calculate annualized Sharpe Ratio according to, \( >=\frac >-R_ > >\) , where R f is the risk-free return (typically the return of Treasury bills, fixed at 4% in this work), and σ p is the annualized standard deviation of daily returns. Basically, higher annualized Sharpe Ratios indicate better performance of a trading strategy concerning the volatility risk.
The investment community often analyzes DrawDown (DD) (Magdon-Ismail and Atiya 2004 ) to measure the decline from a historical peak in the cumulative wealth achieved by a financial trading strategy. Formally, let S (⋅) denote the process of cumulative wealth achieved by a trading strategy, that is, S 1 ,…, S t ,…, S n >. The DrawDown at any time t , is defined as DD( t )=max[0,max i ∈(0, t ) S ( i )− S ( t )]. The Maximum DrawDown for a horizon n , MDD( n ) is defined as, MDD( n )=max t ∈(0, n ) [DD( t )], which is an excellent way to measure the downside risk of different strategies. Moreover, we also adopt Calmar Ratio (CR) to measure the return relative of the drawdown risk of a portfolio, calculated as \( > = \frac > >\) . Generally speaking, the smaller the Maximum DrawDown, the more downside risk tolerable the financial trading strategy. Higher Calmar Ratios indicate better performance of a trading strategy concerning the drawdown risk.
To test whether simple luck can generate the return of the proposed strategy, we can also conduct a statistical test to measure the probability of this situation, as is popularly done in the fund management industry (Grinold and Kahn 1999 ). First, we separate the portfolio daily returns into two components: one benchmark-related and the other non-benchmark-related by regressing the portfolio excess returns 10 against the benchmark excess returns. Formally, s t − s t (F)= α + β ( s t (B)− s t (F))+ ϵ ( t ), where s t stands for the portfolio daily returns, s t (B) denotes the daily returns of the benchmark (market index) and s t (F) is the daily returns of the risk-free assets (here we simply choose Treasury bill and set it to 1.000156, or equivalently, annual interest of 4%). This regression estimates the portfolio’s alpha ( α ), which indicates the performance of the investment after accounting for the involved risk. Then we conduct a statistical t - test to evaluate whether alpha is significantly different from zero, by using the t statistic \(\frac (\alpha )>\) , where SE( α ) is the standard error for the estimated alpha. Thus, by assuming the alpha is normally distributed, we can obtain the probability that the returns of the proposed strategy are generated by simple luck. Generally speaking, the smaller the probability, the higher confidence the trading strategy.
5.2.2 Practical issues.
While our model described in Sect. 2 is concise and not complicate to understand, it omits some practical issues in the portfolio management industry. We shall now relax some constraints in our model to address these issues.
Another practical issue in portfolio selection is margin buying , which allows the portfolio managers to buy securities with cash borrowed from security brokers. Following previous studies (Cover 1991 ; Helmbold et al. 1996 ; Agarwal et al. 2006 ), we relax this constraint in the model and evaluate it empirically in Sect. 5.4.5 . In this study, the margin setting is assumed to be 50% down and 50% loan, at an annual interest rate of 6%, so the interest rate of the borrowed money, c is set to 0.000238. Thus, for each security in the asset pool, a new asset named “Margin Component” is generated. Following the down and loan percentage, the price relative for the “Margin Component” of asset i would be 2∗ x ti −1− c , where x ti is the price relative of the i th asset for the t th trading day. In cases of \(x_ \leq\frac \) , that is, certain stocks drop more than half, we simply set “Margin Component” to 0. By adding this “Margin Component”, we magnify both the potential profit and loss of the trading strategy on the i th asset.
5.3 Comparison approaches.
Market: Market strategy, that is, uniform Buy-And-Hold (BAH) strategy;
Best-Stock: Best stock in the market, which is a strategy in hindsight;
BCRP: Best Constant Rebalanced Portfolios strategy in hindsight;
UP: Cover’s Universal Portfolios implemented according to Kalai and Vempala ( 2002 ), where the parameters are set as δ 0 =0.004, δ =0.005, m =100, and S =500;
EG: Exponential Gradient (EG) algorithm with the best parameter η =0.05 as suggested by Helmbold et al. ( 1996 );
ONS: Online Newton Step (ONS) with the parameters suggested by Agarwal et al. ( 2006 ), that is, η =0, β =1, \(\gamma=\frac \) ;
SP: Switching Portfolios with parameter \(\gamma=\frac \) as suggested by Singer ( 1997 );
GRW: Gaussian Random Walk strategy with parameter σ =0.00005 recommended by Levina and Shafer ( 2008 );
M0: Prediction based algorithm M0 with parameter β =0.5 as suggested by Borodin et al. ( 2000 );
Anticor: BAH 30 (Anticor(Anticor)) as a variant of Anticor to smooth the performance, which achieves the best performance among the three solutions proposed by Borodin et al. ( 2004 );
B K : Nonparametric kernel-based moving window (B K ) strategy with W =5, L =10 and threshold c =1.0 which has the best empirical performance according to Györfi et al. ( 2006 );
B NN : Nonparametric nearest neighbor based strategy (B NN ) with parameters W =5, L =10 and \(p_ =0.02+0.5\frac \) as the authors suggested (Györfi et al. 2008 ).
5.4 Experimental results.
5.4.1 Experiment 1: evaluation of cumulative wealth.
Cumulative wealth achieved by various trading strategies on the six datasets and their reversed datasets. The top two best results in each dataset are highlighted in bold font.
First of all, we observe that learning to select portfolio strategies generally perform better than three common benchmarks, which shows that it is promising to investigate learning algorithms for portfolio selection. Second, we find that although the cumulative wealth achieved by the regret minimization approaches (UP, EG and ONS) is higher than market strategy, their performance is significantly lower than that achieved by the wealth maximization approaches (Anticor, B K and B NN ). This shows that to achieve better investment return, it is more powerful and promising to exploit the wealth maximization approaches for portfolio selection. Third, from the top two results indicated on each original dataset, it is clear that the proposed PAMR strategy (PAMR, PAMR-1, and PAMR-2) significantly outperforms most (except DJIA datasets) competitors including Anticor, B K and B NN , which are the state of the arts. The encouraging results in cumulative wealth validate the importance of exploiting the mean reversion property in the financial markets by an effective online learning strategy. On the other hand, though MIX beats the benchmarks on the DJIA dataset, PAMR algorithms perform bad on the DJIA dataset. This may be attributed to the reason that the motivating mean reversion does not exist in this dataset. This raises an important question, “How to select the portfolio pool such that the motivating mean reversion exists on target portfolio?” Sect. 5.5.2 provides some discussions on this question.
Further examining the details, we find that the most impressive performance is achieved by PAMR on the standard NYSE (O) dataset, where its initial wealth grows by a factor of more than 5 quadrillion at the end of the 22-year period. We note that the main reason PAMR achieved such exceptional results is that it is powerful to exploit highly volatile price relatives. To verify this, we examine the detailed performance of PAMR in Table 4 by looking into individual stocks, and we find that it relies considerably on one single stock (“Kin Ark”) which has the highest volatility in terms of standard deviation. After removing this stock from the portfolio, we find that the cumulative wealth significantly reduces to 1.27E+08. We will investigate the volatility issue in more details by another experiment on dataset sensitivity in Sect. 5.4.3 .
On the reverse datasets, though not performing as shiny as the original datasets, PAMR also performs well. Though some algorithms fail badly, in all cases, PAMR beats the benchmarks, including the market and BCRP strategies. In certain cases, it beats all competitors. It is worth noting these reverse datasets are artificial datasets, which never exist in real markets. PAMR’s performance on these datasets provides strong evidences that mean reversion does exist in even reverse market datasets and PAMR can successfully exploit it.
Trends of cumulative wealth achieved by various strategies during the entire trading periods on the stock datasets.
Statistical t - test of the performance of the PAMR on the stock datasets.
Mean excess return (PAMR)
Mean excess return (Market)
5.4.2 Experiment 2: evaluation of risk and risk-adjusted return.
Risk and risk-adjusted performance of various strategies on the six different datasets. In each diagram , the rightmost bars represent the results achieved by PAMR.
In previous cumulative wealth results, we find that PAMR achieved the highest cumulative return on most original datasets. Of course, high return is associated with high risk, which is commonly acceptable in finance, as no real financial instrument can guarantee a high return without risk. The volatility risk in Fig. 4 (a) shows that PAMR almost achieves the highest risk in terms of volatility risk. On the other hand, the drawdown risk in Fig. 4 (b) shows that PAMR achieves modest drawdown risk in most datasets. These results validate the above notion that high return is often associated with high risk.
To further evaluate the return and risk, we examine the risk-adjusted return in terms of annualized Sharpe ratio and Calmar ratio. The results shown in Figs. 4 (c) and 4 (d) clearly show that PAMR achieves excellent performance in most cases, except DJIA dataset. These encouraging results show that PAMR is able to reach a good trade-off between return and risk, even though we do not explicitly consider risk in our problem formulation.
5.4.3 Experiment 3: dataset sensitivity.
As observed in Sect. 5.4.1 , it is interesting that PAMR gained the excess return from the stock markets. In this section, we aim to examine how the dataset sensitivity affects the proposed PAMR strategy by evaluating performance on datasets of different volatilities.
Cumulative wealth achieved by various strategies on portfolios of extreme volatilities. The “ H/L ratio ” column shows the ratio between the cumulative wealth achieved on the high-volatility dataset and that achieved on the low-volatility dataset.
From the results, we find that different strategies perform diversely on these two datasets. The regret minimization approaches (UP, EG and ONS), perform well regardless of the market volatilities as the theoretical universal property shows, while the wealth maximization approaches (Anticor, B K and B NN ) and the proposed PAMR strategy achieved significantly higher cumulative wealth on NYSE (H), the high-volatility dataset. These results show that the volatility of datasets does considerably affect some algorithms, including the wealth maximization approaches and the proposed PAMR strategy. Specifically, we find that the proposed PAMR strategy could benefit much from a high-volatility dataset. For example, on the NYSE (L) dataset, the cumulative wealth achieved by PAMR algorithm is about 132, which is significantly boosted to 1.35E+05 on the NYSE (H) dataset. To further examine which algorithm can benefit most from high-volatility dataset, we calculate the “H/L ratio” value, which is the ratio of cumulative wealth achieved on the high-volatility dataset over that achieved on the low-volatility dataset. From the ratios, we can observe that the PAMR strategy obtained the highest H/L ratio, indicating that PAMR can benefit most from the high-volatility dataset among all the competing methods.
5.4.4 Experiment 4: parameter sensitivity.
We now evaluate how different choices of parameters affect the performance of the proposed PAMR strategy. All three PAMR algorithms require to set sensitivity parameter ϵ , while aggressiveness parameter C is needed for PAMR-1 and PAMR-2.
Parameter sensitivity of the cumulative wealth achieved by PAMR with respect to sensitivity parameter ϵ.
Parameter sensitivity of the cumulative wealth achieved by PAMR-1 with respect to sensitivity parameter ϵ and aggressiveness parameter C.
Parameter sensitivity of the cumulative wealth achieved by PAMR-2 with respect to sensitivity parameter ϵ and aggressiveness parameter C.
5.4.5 Experiment 5: evaluation of practical issues.
For a real-world application, there are some important practical issues for portfolio selection, including the issues of transaction cost and margin buying. This experiment aims to examine how these practical issues affect the proposed PAMR strategy.
Scalability of the cumulative wealth achieved by PAMR with respect to transaction cost rate ( γ ). The break-even transaction cost rates to the market index are about 0.7%, 0.4%, 0.1%, 0.3% and 0% on the six datasets, respectively.
From the results shown in the figure, we can observe that PAMR can withstand reasonable transaction cost rates. For example, with a transaction cost rate of 0.2%, PAMR can beat the BCRP strategy on the four datasets. The break-even transaction cost rates with respect to the market index ranges from 0.1% to 0.7% on the datasets, except DJIA. Since PAMR more actively reverts to the mean and thus results in more drastic portfolio changes, it surpasses Anticor with low or medium transaction costs while it underperforms Anticor with high transaction costs, On the other hand, it outperforms B NN in most cases. Note that the transaction cost rate in real market is low. 11 This experiment clearly shows the practical applicability of the proposed PAMR strategy when we take transaction cost into consideration.
Cumulative wealth achieved by various strategies on the stock datasets with/without margin loans (ML). Top two achievements on each dataset are highlighted.
5.4.6 Experiment 6: evaluation of computational time cost.
Computational time cost on the real datasets (in seconds)
From the results, we can clearly see that in all cases the proposed PAMR takes significant less computational time than the three performance comparable strategies. Even though the computational time in the back tests, especially per trading day, is small, it is important in certain scenarios such as high frequency trading (Aldridge 2009 ), where transactions may occur in a fraction of a second. Nevertheless, the results clearly demonstrate the computational efficiency of the proposed PAMR strategy, which is also an important concern for real-world large-scale applications.
5.5 Discussions and threads to validity.
5.5.1 Discussion on model assumption.
Any statement about such encouraging empirical results would be incomplete without acknowledging the simplified assumptions made in Sect. 2. To recall, we had made several assumptions regarding transaction cost, market liquidity and market impact, which would affect the practical deployment of the proposed algorithm.
The first assumption is that no transaction cost exists. In Sect. 5.4.5 we have already examined the effect of varying transaction costs, and the results show that the proposed algorithm can withstand moderate transaction costs. Currently, with the wide-spread adoption of electronic communication networks (ECNs) and multilateral trading facilities (MTFs) on financial markets, various online trading brokers charge very small transaction cost rates, especially for large institutional investors. They also use a flat-rate, 12 based on the volume threshold one reaches. Such measures can facilitate the portfolio managers to lower their transaction cost rates.
The second assumption is that the market is liquid and one can buy and sell any quantity at the quoted price. In practice, low market liquidity results in a large bid-ask spread — the gap between prices quoted for an immediate bid and an immediate ask. As a result, the execution of orders may incur a discrepancy between the prices sent by the algorithm and the prices actually executed. Moreover, stocks are often traded in multiples of lot , which is the standard trading unit containing certain number of stock shares. In this situation, the quantity of the stocks may not be arbitrary divisible. In the experiments, we have tried to minimize the effect of market liquidity by choosing the stocks that have large market capitalization, which usually have small bid-ask spreads and discrepancy, and thus have a high market liquidity.
The other assumption is that the portfolio strategy would have no impact on the market, that is, the stock market will not be affected by the trading algorithm. In practice, the impact can be neglected if the market capitalization of the portfolio is not too large. However, as the experimental results show, the portfolio wealth generated by PAMR increases astronomically, which would inevitably impact the market. One simple way to handle this issue is to scale down the portfolio, as done by many quantitative funds. Moreover, the development of algorithmic trading, which slices a big order into multiple smaller orders and schedules these orders to minimize the market impact, can significantly decrease the potential market impact of the proposed algorithm.
Here, we emphasize again that this study assumes a “perfect market”, which is consistent with previous studies in literature. It is important to note that even in such a perfect financial market, no algorithm has ever claimed such high performance, especially on the standard NYSE (O) dataset. Though it is common investment knowledge that past performance may not be reliable indicator of future performance, such high performance does provide us confidence that the proposed PAMR algorithm may work well in future unseen markets.
5.5.2 Discussion on PAMR assumption.
Though the proposed algorithm performs well on most datasets, we can not claim that PAMR can perform well on arbitrary portfolio pools. It is worth noting that PAMR relies on the assumption that mean reversion exists in a portfolio pool, that is, buying worse performing stocks is profitable. Preceding experiments seem to show that in most cases mean reversion does exist in the market. However, it is still possible that this assumption fails to exist in certain cases, especially when portfolio components are wrongly selected. PAMR’s performance on DJIA dataset indicates that mean reversion may not exist in its portfolio components. Though both based on mean reversion, PAMR and Anticor are formulated with different time periods of mean reversion, which may interpret why Anticor achieves a good performance on DJIA. Thus before investing in real market, it is of crucial importance to ensure that the motivating mean reversion does exist among the portfolio pools. In academic, mean reversion property in single stock has been extensively studied (Poterba and Summers 1988 ; Hillebrand 2003 ; Exley et al. 2004 ), one natural way is to calculate the sign of auto-correlation (Poterba and Summers 1988 ). On the contrary, the mean reversion property among a portfolio lacks academic attention. Compared with mean reversion in single stock, for a portfolio, not only the mean reversion of single stock matters, but rather the interaction among stocks matters.
On the other hand, the mixture algorithm, that is, MIX, performs well on the DJIA dataset, beating three benchmarks. As we discussed in Sect. 4.6 , the mixture algorithm can provide a worst-case guarantee, which is lacked for the original PAMR algorithms. This can somehow solve the problem that PAMR itself does not have a worst-case guarantee. Moreover, it is worth noting that even with worst-case guarantee, some existing universal algorithms also perform poorly on the dataset.
Average daily return and standard deviation of the test strategy.
It is interesting to observe above results, however, we cannot claim that this method can definitely identify successful portfolio pools. Analyzing the mean reversion property in portfolio scenario and selecting portfolio components such that the portfolio satisfies mean reversion deserve further attention.
5.5.3 Discussion on back tests.
Back tests in historical markets may suffer from “data-snooping bias” issue. One common “data-snooping bias” is dataset selection issue. On the one hand, we selected four datasets, that is, NYSE (O), TSE, SP500, and DJIA datasets, based on previous studies without consideration to the proposed approach. On the other hand, we developed the PAMR algorithm based solely on NYSE (O) dataset, while other five datasets (NYSE (N), TSE, SP500, MSCI and DJIA datasets) were obtained after the algorithm was fully developed. However, even we are cautious about the dataset selection issue, it may still appear in the experiments, especially for the datasets with relatively long history, that is, NYSE (O) and NYSE (N). The NYSE (O) dataset, pioneered by Cover ( 1991 ) and followed by other researchers, becomes one “standard” dataset in the learning community. Since it contains 36 large cap NYSE stocks that survived in hindsight for 22 years, thus it suffers from extreme survival bias. Nevertheless, it still has the merit to compare the performance among algorithms as done in all previous work. The NYSE (N) dataset, as a continuation of NYSE (O), contains 23 assets survived from previous 36 stocks for another 25 years. Therefore, it becomes even worse than the previous NYSE (O) dataset in terms of survival bias. In a word, even the experiment results on these datasets clearly show the effectiveness of the proposed PAMR algorithm, one can not make claims without noticing the deficiencies of these datasets.
Another common bias is asset selection issue. Four of the six datasets (NYSE (O), TSE, SP500, and DJIA) are collected by others, and to the best of our knowledge, their assets are mainly the largest blue chip stocks in their respective markets. As a continuation of NYSE (O) dataset, we self-collected NYSE (N) , which again contains several largest survival stocks in NYSE (O). The remaining dataset (MSCI) is chosen according to the world indices. In a word, we try to avoid the asset selection bias via arbitrarily choosing the representative stocks in their respective markets, which usually have large capitalization and thus high liquidity. Moreover, investing in these largest assets may reduce the market impact caused by the proposed portfolio strategy. Finally, following existing model assumption and experimental setting, we do not consider the assets of low quality, such as the bankrupt stocks and penny stocks. On the one hand, the bankrupt stock data is difficult to acquire, thus we cannot observe their behaviors and predict the behaviors of PAMR on datasets with bankrupt stocks. In reality, the bankruptcy situation happens rarely for the blue chip stocks as typically a bankrupt stock would be removed from the list of blue chip stocks before it actually goes bankruptcy. On the other hand, the penny stocks lack the required liquidity to support the trading frequency in current research. Besides, one could also explore many practical strategies to exclude the low quality stocks from the asset pool at some early stage, such as some financial methods via either technical or fundamental analysis.
6 Conclusion.
In this article, we proposed a novel portfolio selection strategy, “Passive Aggressive Mean Reversion” (PAMR). Motivated by the idea of mean reversion and passive aggressive learning, PAMR outperforms all benchmarks and various existing strategies on a number of real datasets from different markets. PAMR can also be easily extended to handle certain practical issues, e. g., transaction cost and margin buying. At the same time, PAMR executes in much less time than existing approaches, making it suitable for online applications. We also find that the update scheme of PAMR is based on the trade-off between the return and volatility risk, which is ignored by most existing learning strategies. This interesting property connects the PAMR strategy with modern portfolio theory, which may provide further explanation from the aspect of finance.
Although in most cases the proposed PAMR strategy achieves encouraging empirical results, it is still far from perfect for a real investment task, and may be improved in the following aspects. First of all, though universality may not be required in real investment, PAMR’s universality is still an open question. Second, none of existing algorithms considers the bankrupt assets, which may happen in real investment. It is thus interesting to study the behaviors of the bankrupt assets and design strategies to exploit them. Besides, we note that PAMR sometimes fails when the mean reversion property does not exist in the portfolio components. Then it is crucial to propose efficient methods to test mean reversion. Finally, though PAMR handles the issue of transaction costs well, it is not formally addressed in our problem formulation. It would be interesting to incorporate the transaction cost issue when formulating the problem in order to improve the performance in case of high transaction costs and gain higher break-even ratios with respect to the market index.
Side information includes interest rates, consumer confidence figures, etc.
The precise matlab routine ProjectOntoSimplex can be found on cs. berkeley. edu/
Such statement also appeared in footnote 1 of Borodin et al. ( 2004 ).
All the datasets and their compositions can be downloaded from cais. ntu. edu. sg/
libin/portfolios . Borodin et al. ( 2004 )’s datasets can also be downloaded from cs. technion. ac. il/
According to Helmbold et al. ( 1996 ), the dataset was originally collected by Hal Stern. The stocks are mainly large cap stocks in NYSE, however, we do no know the criteria of choosing these 36 stocks.
The dataset before 2007 was collected by Gábor Gelencsér ( cs. bme. hu/
oti/portfolio ), we collected the remaining data from 2007 to 2010 via Yahoo Finance.
The constituents of MSCI World Index can be found from MSCI Barra ( mscibarra ), accessed on 28 May 2010.
It is worth noting that not every index is tradable through exchange traded funds (ETFs).
One can arbitrarily select experts, however, at least one universal algorithm should be included in order to guarantee the worst-case performance of the mixture algorithm.
Excess return is daily return less risk-free return.
For example, without consideration taxes and bid-ask, Interactive Broker charges 0.005$ per share traded. Considering the average price of Dow Jones Composite is around 50$ (accessed on June 2011), the percentage is about 0.01%.
For example, for US equities and options, E ∗ Trade ( global. etrade/gl/home , accessed on 16 March 2011) charges only $9.99 for $50000+ or 30+ stocks per quarter.
Acknowledgements.
This paper was fully supported by Singapore MOE Tier-1 Research Grant (RG67/07).
Appendix A: Proof of Proposition 1.
First, if \(\ell_ ^ =0\) then b t satisfies the constraint in ( 2 ) and is clearly the optimal solution.
Appendix B: Proof of Proposition 2.
Appendix C: Proof of Proposition 3.
참조.
저작권 정보.
저자 및 제휴사.
Bin Li 1 Peilin Zhao 1 Steven C. H. Hoi 1 author Vivekanand Gopalkrishnan 2 1. School of Computer Engineering Nanyang Technological University Singapore Singapore 2. Deloitte Analytics Institute Singapore Singapore.
이 기사에 관하여.
개인화 된 권장 사항.
기사를 인용하십시오.
.RIS 논문 참조 관리자 RefWorks Zotero.
.BIB BibTeX JabRef Mendeley.
기사 공유.
기사를 인용하십시오.
.RIS 논문 참조 관리자 RefWorks Zotero.
.BIB BibTeX JabRef Mendeley.
기사 공유.
Table of contents.
손끝에서 천만 가지 이상의 과학적 문서를 제공합니다.
전환 판.
&부; 2017 Springer International Publishing AG. 스프링거 자연의 일부입니다.
Paper: Passive aggressive mean reversion strategy for portfolio selection.
Matthias Knab, Opalesque:
This article proposes a novel online portfolio selection strategy named "Passive Aggressive Mean Reversion" (PAMR).
Unlike traditional trend following approaches, the proposed approach relies upon the mean reversion relation of financial markets. Equipped with online passive aggressive learning technique from machine learning, the proposed portfolio selection strategy can effectively exploit the mean reversion property of markets.
By analyzing PAMR's update scheme, we find that it nicely trades off between portfolio return and volatility risk and reflects the mean reversion trading principle. We also present several variants of PAMR algorithm, inc.
To view our full article Click here.
Top Forwarded Top Tracked Top Searched.
최신 비디오.
Featuring : Spain's first regulated hedge fund, Cygnus Asset Management (2006): The Power of Cycles.
On this site people currently.
read about:
MARKET BRIEFING The Only Hedge Fund Newswire Read By Elite Managers.
Near Term Trend: Potentially bullish.
As of 12/15/17 close: 0.76405.
UPDATE: Last week, I suggested buying AUDUSD near 0.74951 with stops on a daily close below that. Target of 0.85651 was given.
The AUDUSD rallied sharply off of support down near (new) pivot support at 0.74951. If my read on things is correct, we could see an extended rally up towards the 0.85651 target mentioned here previously.
Buy dips to 0.75496 with stops below 0.74800 and with a target of 0.85651.
Passive aggressive mean reversion strategy for portfolio selection
This project proposes a novel online portfolio selection strategy named ``Passive Aggressive Mean Reversion\u22 (PAMR). Unlike traditional trend following approaches, the proposed approach relies upon the mean reversion relation of financial markets. Equipped with online passive aggressive learning technique from machine learning, the proposed portfolio selection strategy can effectively exploit the mean reversion property of markets. By analyzing PAMR\u27s update scheme, we find that it nicely trades off between portfolio return and volatility risk and reflects the mean reversion trading principle. We also present several variants of PAMR algorithm, including a mixture algorithm which mixes PAMR and other strategies. We conduct extensive numerical experiments to evaluate the empirical performance of the proposed algorithms on various real datasets. The encouraging results show that in most cases the proposed PAMR strategy outperforms all benchmarks and almost all state-of-the-art portfolio selection strategies under various performance metrics. In addition to its superior performance, the proposed PAMR runs extremely fast and thus is very suitable for real-life online trading application.
Suggested articles.
To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.
No comments:
Post a Comment