量化交易_展.718

今天读了一篇论文:

优化加密货币回报:基于因子的投资的定量研究

网址:Optimizing Cryptocurrency Returns: A Quantitative Study on Factor-Based Investing

Submission received: 22 March 2024 / Revised: 20 April 2024 / Accepted: 24 April 2024 / Published: 29 April 2024

摘一些觉得有用的:

1. 对 “只用横截面方法(拍合照)” 的启发:预测时别被 “历史包袱” 拖累,聚焦 “当下对比”

加密货币预测比赛里,最容易踩的坑之一是:过度依赖 “过去的趋势”(比如 “过去 30 天涨得快,未来也会涨”),但市场波动太快,昨天的规律可能今天就失效了(比如政策突变、资金出逃会瞬间颠覆趋势)。

而 “拍合照” 的思路告诉你:预测时更该聚焦 “当前时间点的因子对比”。比如在预测 “明天的价值排序” 时,别盯着 “某币过去一个月的因子变化”,而是重点看 “今天这个时间点,所有货币的因子表现差异”—— 比如:

  • 今天 A 币的交易量是 B 币的 5 倍(流动性因子);
  • 今天 C 币的市值占比是 D 币的 3 倍(规模因子);
  • 今天 E 币的社交媒体讨论量比 F 币高 200%(关注度因子)。

这些 “同一时间点的横向对比”,比 “某币自己的历史变化” 更能反映当下的市场真实状态,而短期预测(比赛常见的 “未来 1-7 天排序”)往往更依赖这种 “当下状态”。

2. 对 “只用等权重和价值权重(两类座位)” 的启发:别搞 “复杂加权”,用 “简单透明” 的方式处理因子,减少主观偏差

预测比赛中,另一个常见问题是:为了 “优化” 搞出太复杂的权重计算(比如 “用风险模型算每个因子的权重”“用机器学习调参让权重更‘完美’”),但结果可能因为 “过度拟合训练数据” 或 “权重逻辑太主观”,在真实比赛数据中失效。

“两类座位” 的思路告诉你:用最简单、最客观的方式给因子 / 货币分配权重,反而更稳健:

  • 等权重:比如你选了 5 个因子(交易量、市值、关注度、开发活跃度、波动率),每个因子在模型中占比 20%;或者对所有货币一视同仁,不因为某币 “过去表现好” 就多给权重。这种方式避免了你主观判断 “哪个因子更重要”,尤其适合比赛中 “因子效果可能突然反转” 的场景(比如某天波动率因子突然失效,但若权重低,影响也小)。
  • 价值权重:按 “当前市值” 给货币加权(比如市值前 10 的货币在模型中占比更高),因为市值本身反映了市场的 “真实用脚投票结果”,大市值货币的排序变化通常更稳定(小币可能乱涨乱跌,但大币排序相对有规律),用这种权重能让你的预测更贴合市场实际运行逻辑,减少 “被小币极端波动带偏” 的风险。

总结:比赛中可以这么用

  • 数据处理:别用 “时间序列滑动窗口” 过度拟合历史,而是按 “时间点切片”,每个时间点单独计算所有货币的因子横向对比(比如每天切一个 “横截面样本”)。
  • 模型权重:优先用等权重或价值权重处理因子 / 货币 —— 比如先用等权重跑一轮 baseline,再用价值权重(结合当前市值)跑一轮,两者结果对比,甚至简单融合(比如取平均排序),既简单又能规避复杂加权的坑。

不同加密货币之间这种正相关的一致性凸显了比特币在加密货币市场中的影响力;BTC 的表现是更广泛市场情绪的风向标。这可能表明,在这个市场中,投资者的决策在很大程度上受比特币价格变动的影响

文章中重点研究了市场、规模、价值、动量四个因子对加密货币回报的影响,具体结论如下:

1. 市场因子(整体市场表现)

  • 定义:反映加密货币市场的整体趋势,类似股市的“大盘走势”。
  • 影响:在部分模型中显示对回报有正向影响(如模型1中系数为2.2999,显著度5%),但在多因子组合中影响力减弱,说明单一市场趋势对加密货币回报的预测力有限,需结合其他因子。

2. 规模因子(市值大小)

  • 定义:以加密货币的市值为衡量标准,区分“小盘币”(市值小)和“大盘币”(市值大)。
  • 影响:呈现显著的负向影响(如模型2中系数为-0.8706,显著度1%),即市值越小的加密货币,反而可能带来更低的回报(与传统股市“小盘股跑赢大盘”的规律不同)。
    原因可能与加密货币市场的特殊性有关:小盘币流动性差、波动性过高,反而增加风险。

3. 价值因子(估值高低)

  • 定义:用“网络价值/交易量(NVT)比率”衡量,类似股市的“市盈率”,比率低则被认为“低估”。
  • 影响:是最稳定的正向影响因子(所有模型中均显著,如模型3中系数1.5568,显著度1%),即被低估的加密货币(NVT比率低)未来回报更高。
    这表明加密货币市场中,“捡便宜”策略有效,估值合理的资产更可能上涨。

4. 动量因子(价格趋势延续性)

  • 定义:反映加密货币过去一段时间的价格趋势(文中用“前一周回报”衡量),过去涨得好的币被认为有“动量”。
  • 影响:呈现显著的正向影响(如模型4中系数2.0573,显著度1%),即过去表现好的加密货币,未来短期内更可能继续上涨。
    这说明加密货币市场存在“追涨”效应,趋势延续性较强。

总结:各因子的综合影响

  • 价值和动量因子是预测加密货币回报的核心:两者在单因子和多因子模型中均显著,且正向影响稳定,说明“低估+趋势好”的加密货币更易获得高回报。
  • 规模因子反向作用:小盘币并非更优选择,可能因风险过高导致回报不佳。
  • 市场因子独立性弱:需结合其他因子才能更好解释回报,单一市场趋势影响有限。

这些结论表明,加密货币市场虽波动剧烈,但通过关注“估值低估”和“价格趋势”,能更有效地制定投资策略。

因子 定义(论文核心) 计算方法(可直接代码实现)
动量因子 过去表现对未来的影响(追趋势) 取 “前 1 周的回报率”:(当前价格 - 1 周前价格) / 1 周前价格
规模因子 市值大小(反映资产体量) 直接使用 “市值”(market cap):流通量 × 当前价格
价值因子 估值高低(是否被低估) 用 NVT 比率(网络价值 / 交易量):市值 / 24 小时交易量(比率越低,越被低估)
市场因子 整体市场趋势(可选辅助因子) 用 “加密货币市场指数”(如等权重 / 价值加权指数,计算方法见论文 3.1 节公式 1-2)

这几个因子在官方demo中的使用情况:

因子类型 demo1.py中有用到吗? 具体体现/备注
市场因子 :cross_mark: 未用到 没有全市场/大盘相关特征
规模因子 :cross_mark: 未用到 没有市值相关特征
价值因子 :cross_mark: 未用到 没有NVT/估值相关特征
动量因子 :white_check_mark: 已用到 4h_momentum, 7d_momentum

在cursor demo中的情况:

因子类型 CryptoRankerDemo中有用到吗? 具体体现/备注
市场因子 :cross_mark: 未用到 没有全市场/大盘相关特征
规模因子 :white_check_mark: 有用到(但未分组) market_cap作为特征输入
价值因子 :cross_mark: 未用到 没有NVT/估值相关特征
动量因子 :white_check_mark: 已用到 momentum_5, momentum_10

规模因子(市值大小)

定义:用市值区分大盘币和小盘币。

在CryptoRankerDemo项目中的情况:

  • 有用到市值(market_cap)这个字段,在数据模拟和特征工程阶段都包含了市值。
  • 市值只是作为一个普通特征输入模型,没有做分组(如“小盘币/大盘币”标签),也没有专门做市值排序或分层回测。
  • 你可以理解为“规模因子”被隐式包含在特征里,但没有像学术论文那样专门分析其影响。

其他参赛者的demo:

因子类型 你的项目是否有用到? 说明
市场因子 :cross_mark: 没有整体市场表现相关特征
规模因子 :cross_mark: 没有市值相关特征
价值因子 :cross_mark: 没有NVT或估值相关特征
动量因子 :white_check_mark: 有4小时、7天动量
2 个赞