3  数据获取

3.1 股票数据下载

使用baostock API下载10只股票的后复权日度行情数据,字段包括:日期、开盘价、收盘价、最高价、最低价、成交量、成交额。

下载函数设计了完善的日志记录机制,每次下载都会记录到download_log.txt

[2026-04-08 09:33:30] SUCCESS  stock_sh_600036  shape=(1515, 7)  source=baostock
[2026-04-08 09:33:32] SUCCESS  stock_sh_601328  shape=(1515, 7)  source=baostock
[2026-04-08 09:33:38] SUCCESS  stock_sz_002594  shape=(1515, 7)  source=baostock
...

每只股票约1515个交易日数据(2020-01-02至2026-04-07)。

3.2 指数数据下载

下载了两个主要指数:

  • 沪深300(000300):作为CAPM分析的市场基准
  • 中证500(000905):代表中小盘股票表现

两个指数同样有1515个交易日数据。

3.3 宏观经济数据

使用akshare获取宏观数据:

  • CPI同比增速:2020-01至2026-02,共74个月数据
  • M2同比增速:2020-01至2026-04,共76个月数据

注:akshare返回的中文日期格式(如”2026年02月份”)需要特殊解析处理。

3.4 财务指标数据

使用akshare获取了10只股票的财务指标:

  • 净资产收益率(ROE)
  • 净利润率

财务数据整理为长格式(Long format),每行包含:code, year, indicator, value。共100条记录(10只股票×5年×2个指标)。