6  结论

6.1 总结

本次作业完成了从数据获取到最终分析的完整流程:

  1. 数据获取:使用baostock成功下载了10只股票、2个指数的日线行情数据,使用akshare获取了CPI、M2宏观数据和财务指标数据
  2. 数据清洗:系统地处理了缺失值、异常值,统一了数据格式,计算了收益率和离群值标注
  3. 数据存储:采用CSV(方式A)和SQLite(方式C)两种存储方式,设计了合理的数据库表结构
  4. 统计分析:完成了描述性统计、4个可视化图表和CAPM回归分析
  5. 报告呈现:使用Quarto将分析整理为在线电子书

6.2 主要发现

  • 行业分化显著:样本期内(2020-2026)行业表现差异巨大,新能源汽车板块(比亚迪)取得正收益,而房地产板块(万科A、保利发展)跌幅较大
  • 风险收益特征:高收益通常伴随高波动,新能源股票波动率最高,银行股波动率最低
  • 尖峰厚尾:所有股票收益率分布均呈现尖峰厚尾特征,不符合正态分布假设
  • 分散化效应:同行业股票相关性较高,跨行业配置可有效降低组合风险
  • CAPM解释力弱:样本期内个股Beta估计不稳定,R²很低,市场因子对个股收益解释力较弱

6.3 展望

未来可进一步拓展的方向:

  • 多因子模型:引入Fama-French三因子、五因子模型,探索更丰富的风险因子
  • 时间序列预测:使用机器学习或传统计量模型进行收益率预测
  • 投资组合优化:基于均值-方差框架构建最优投资组合
  • 宏观经济分析:加入更丰富的宏观经济变量,探索宏观-金融联动关系
  • 事件研究:分析重大政策或事件对股票价格的影响

GitHub仓库:https://github.com/Freyabot/dshw-p02

在线电子书:https://Frereyabot.github.io/dshw-p02/