3 数据获取
3.1 股票数据下载
使用baostock API下载10只股票的后复权日度行情数据,字段包括:日期、开盘价、收盘价、最高价、最低价、成交量、成交额。
下载函数设计了完善的日志记录机制,每次下载都会记录到download_log.txt:
[2026-04-08 09:33:30] SUCCESS stock_sh_600036 shape=(1515, 7) source=baostock
[2026-04-08 09:33:32] SUCCESS stock_sh_601328 shape=(1515, 7) source=baostock
[2026-04-08 09:33:38] SUCCESS stock_sz_002594 shape=(1515, 7) source=baostock
...
每只股票约1515个交易日数据(2020-01-02至2026-04-07)。
3.2 指数数据下载
下载了两个主要指数:
- 沪深300(000300):作为CAPM分析的市场基准
- 中证500(000905):代表中小盘股票表现
两个指数同样有1515个交易日数据。
3.3 宏观经济数据
使用akshare获取宏观数据:
- CPI同比增速:2020-01至2026-02,共74个月数据
- M2同比增速:2020-01至2026-04,共76个月数据
注:akshare返回的中文日期格式(如”2026年02月份”)需要特殊解析处理。
3.4 财务指标数据
使用akshare获取了10只股票的财务指标:
- 净资产收益率(ROE)
- 净利润率
财务数据整理为长格式(Long format),每行包含:code, year, indicator, value。共100条记录(10只股票×5年×2个指标)。