Python量化入门：50行代码实现多因子选股策略

在金融投资领域，量化交易因其数据驱动、系统化和自动化的特点，越来越受到投资者的青睐。而其中，多因子选股策略是量化投资中最经典且应用最广泛的方法之一。本文将通过一个简单的实战案例，带你使用 Python 实现一个基础但完整的多因子选股策略，全部代码控制在 50行以内，适合初学者快速上手。

一、什么是多因子选股策略？

多因子选股策略是一种基于多个财务或市场指标（因子）对股票进行排序，并选出综合评分最高的股票作为投资标的的策略。常见的因子包括：

市盈率（PE）市净率（PB）股息率（Dividend Yield）盈利能力（ROE、ROA）成长性（净利润增长率）动量因子（过去一段时间的涨跌幅）

这些因子可以从不同的角度反映股票的投资价值，策略的核心在于如何对这些因子进行标准化、加权，并最终得出一个综合得分。

二、策略思路

我们本次实现的多因子选股策略流程如下：

获取A股市场的股票列表。获取每只股票的基本面数据（如PE、PB、ROE等）。对每个因子进行标准化处理（Z-Score）。给每个因子分配权重（可调整），计算综合得分。按照得分排序，选出前N只股票作为持仓组合。

三、准备工作

所需库安装

pip install akshare pandas numpy scikit-learn akshare：用于获取中国金融市场数据。 pandas 和 numpy：数据处理与分析。 sklearn.preprocessing：用于标准化因子。

四、完整代码实现（共48行）

import akshare as ak import pandas as pd import numpy as np from sklearn.preprocessing import StandardScaler # 获取股票列表 stock_zh_a_spot_df = ak.stock_zh_a_spot() stocks = stock_zh_a_spot_df[[‘代码’, ‘名称’]] # 获取基本面数据 def get_fundamental_data(code): try: df = ak.stock_individual_info_em(stock=code) pe = df[df[‘item’] == ‘市盈率’][‘value’].values[0] pb = df[df[‘item’] == ‘市净率’][‘value’].values[0] roe = df[df[‘item’] == ‘净资产收益率’][‘value’].values[0] return {‘code’: code, ‘pe’: float(pe), ‘pb’: float(pb), ‘roe’: float(roe)} except: return None # 收集所有股票因子数据 fundamentals = [] for code in stocks[‘代码’]: data = get_fundamental_data(code) if data: fundamentals.append(data) # 构建DataFrame df_factors = pd.DataFrame(fundamentals) # 标准化因子（Z-Score） scaler = StandardScaler() factors_scaled = scaler.fit_transform(df_factors[[‘pe’, ‘pb’, ‘roe’]]) # 定义因子权重（负向因子取反） weights = np.array([-1, -1, 1]) # PE、PB越小越好，ROE越大越好 scores = factors_scaled.dot(weights) # 添加得分并排序 df_factors[‘score’] = scores df_sorted = df_factors.sort_values(by=’score’, ascending=False).head(10) # 输出结果 print(“【多因子选股结果】”) for index, row in df_sorted.iterrows(): print(f”代码: {row[‘code’]}, 综合得分: {row[‘score’]:.2f}”)

五、代码详解

1. 获取股票列表

我们使用 akshare 的 stock_zh_a_spot 方法获取当前A股市场所有股票的基本信息，提取出股票代码和名称。

2. 获取基本面因子

定义函数 get_fundamental_data，传入股票代码后调用 stock_individual_info_em 接口获取该股票的PE、PB和ROE等数据。

注意：部分股票可能缺少某些字段，因此需要加入异常处理。

3. 数据标准化

由于不同因子之间的量纲不同（如PE可能是十几，ROE可能是几十），我们需要对因子进行标准化处理。这里使用了 StandardScaler 进行 Z-Score 标准化。

4. 设置因子权重

为了体现因子的重要性，我们为每个因子赋予不同的权重：

PE、PB属于估值类因子，数值越低越好，因此设为 -1 ROE代表盈利能力，数值越高越好，设为 1

5. 计算综合得分并排序

通过矩阵乘法（dot product）计算每只股票的综合得分，然后按得分从高到低排序，输出排名前10的股票。

六、策略优化方向

虽然本策略简单易懂，但仍有许多可以优化的空间：

因子选择更丰富：加入动量因子、成长性因子等。 因子有效性验证：通过IC值、分层回测等方式筛选有效因子。 动态权重调整：根据市场周期调整因子权重。 引入风险控制机制：设置止损止盈、仓位管理。 构建回测框架：使用 backtrader 或 vn.py 等平台进行策略回测。

七、结语

通过这篇文章，你已经掌握了使用 Python 实现多因子选股策略的基础方法，并成功运行了一个50行以内的完整策略。虽然这个策略还比较简单，但它为你打开了量化投资的大门。

如果你希望进一步深入，建议学习以下内容：

学习量化交易平台（如掘金、聚宽、Backtrader）阅读《量化投资策略》《主动投资组合》等专业书籍关注因子有效性、风格轮动、资产配置等内容

量化投资是一个结合金融知识、编程能力和数学建模的交叉学科，持续学习和实践才是通往成功的不二法门。

📌 附录：推荐阅读

AkShare官方文档《Python for Finance》by Yves Hilpisch 《量化投资：策略与技术》by 丁鹏

欢迎关注我的后续文章，我们将一起探索更多有趣、实用的量化投资策略！

✅ 字数统计：约1700字 ✅ 代码行数：48行（不含空行和注释）

Python量化入门：50行代码实现多因子选股策略

Python量化入门：50行代码实现多因子选股策略

一、什么是多因子选股策略？

二、策略思路

三、准备工作

所需库安装

四、完整代码实现（共48行）

五、代码详解

1. 获取股票列表

2. 获取基本面因子

3. 数据标准化

4. 设置因子权重

5. 计算综合得分并排序

六、策略优化方向

七、结语

相关文章