智通财经APP数据显示,大发地产(06111)、大唐集团控股(02117)、中梁控股(02772)上一交易日沽空比率位于前三位,分别为86.22%、70.75%、64.82%。腾讯控股(00700)、阿里巴巴-SW(0本站
精品案例 基于因子分析和聚类分析的北交所股票投资价值研究本站
北京证券交易所(简称“北交所”),于2021年9月3日注册成立,是经国务院批准设立的中国第一家公司制证券交易所,11月15日,北交所正式开市。截至2021年12月11日,北交所共有82只股票上市。北交所和沪深板块最大的不同在于服务对象,北交所主要服务于“专精特新”的中小企业,突出“更早、更小、更新”的特点。北交所的设立相当于为中小企业单独开辟了一块成长的土壤,吸引资本助力他们走向成熟。
从北交所上市股票的行业分布来看,根据GICS行业分类,工业和信息技术“两开花”,原材料和医疗保健紧随其上;根据证监会行业分类,“制造业为王”,其次为信息传输和软件行业、科学研究和技术服务业,展现出了“更新”的特色。
从北交所上市公司的规模来看,以占比最高的制造业、信息传输、软件和信息技术服务业为代表,超过75%的制造业公司员工人数小于1000人,60%左右的信息技术服务业员工人数小于300人。按照工信部的划分标准,大多数公司均属于中小企业,突出了北交所服务对象“更小”的特征。
从北交所上市公司的注册地分布来看,江苏、北京、广东领跑,分别是13家、11家、10家,其次为山东、安徽和四川,分别是7家、5家、4家。可以看出,我国发展势头较强的中小企业集中在京津冀、长三角和珠三角地区。
与此同时,北交所将涨跌幅扩大至30%并且加快了退市节奏,投资者面临的风险不容小觑。不同的投资者有着不同的风险偏好,部分投资者属于稳健型,部分投资者属于激进型,部分投资者手中握有的流动资金较多。本案例的研究目的是以北交所股票为核心,通过将股票划分成不同的类别并归纳它们的特征,为不同类型的投资者提供一些建议。
本案例的数据来源于财汇金融大数据终端,选取了常用的9个行情指标与10个公司基本面指标进行分析。由于部分指标存在缺失,去除缺失值后,最终选取66只股票进行后续分析。
行情指标包括股票均价、最高价、最低价、振幅、换手率、周涨跌幅等反映股票交易情况的指标。由于行情指标随时处于波动状态,除周涨跌幅外,本案例统一选取12月6日至12月11日的日行情指标并计算其平均值作为各项行情指标的取值。
由于股票价格变动较小,所以关于价格的五个指标取值差异均较小。以均价为代表,北交所66只股票的均价分布在4.58元至152.35元之间,价格差异较大。虽然均价最大值取到152.35元,但均价大于30元的股票仅有5只,即北交所大部分股票价格较低。此外,换手率取值范围为0.16到3.77,这说明北交所整体交易不算特别活跃,交易风格较为温和。
公司基本面指标包括总资产报酬率、流动比率、资产负债率、总资产同比增长率等反映公司财务与经营状况的常用指标。由于北交所11月才正式开市,大多数公司仅披露了2021年第三季度的财报,故公司基本面指标对应的报告期均为2021年第三季度,具体指标如表所示。
其中,总资产报酬率和净资产收益率衡量的是借助公司现有资本可以创造多大的利润。销售毛利率和销售净利率衡量的是公司的主营业务可以创造多例的利润。流动比率、速动比率、资产负债率都可以理解为负债除以资产,衡量的是一个公司的偿债能力。其中,流动比率、速动比率越大,代表偿债能力越高,而资产负债率越小代表偿债能力越高。总资产同比增长率和净资产同比增长率相当于报告期内增加的资产占原来资产的比例,用于衡量一个公司资产的扩张情况。存货周转率衡量的是存货的周转速度,存货周转率越高,表明企业存货资产变现能力越强,存货及占用在存货上的资金周转速度越快。
为了对不同用户进行股票推荐,本案例考虑使用聚类模型。然而,由于变量之间存在高度相关,不利于直接进行聚类,因此,在聚类前先使用因子分析对数据进行降维。
在对数据进行标准化后,进行Bartlett检验,发现其p值小于0.0001,说明可以对数据进行因子分析;再对数据进行KMO检验,得到的KMO值为0.65,说明变量之间的确存在一定的相关性,可以用因子分析提取出公共因子。
接下来,利用碎石法得出最佳因子个数,使用各因子的特征根绘制碎石图。由碎石图可知,共有5个因子的特征根大于1,因此初步选取因子数量为5。
由下表可知,当选取五个因子时,特征根累计占比达到了73.68%,说明因子数量的选取有一定的合理性。
最后,本文使用正交旋转法进行旋转,得到了最终的因子载荷矩阵。为便于得到结论,本文将因子载荷矩阵取绝对值后,对其绘制热力图,从而得到每一个因子的特征。
因子1在均价、最高价、最低价、开盘价、收盘价等价格变量上载荷较高,且均为正值,可以反映股票在价格上的表现。因此,本文将其命名为价格因子。
因子2在流动比率、速动比率、资产负债率上载荷较高,流动比率和速度比率可以反映公司在短期内的偿债能力,资产负债率可以反映公司在长期的偿债能力。因此,本文将其命名为偿债因子。
因子3在总资产报酬率、净资产收益率和销售净利率上载荷较高。总资产报酬率和净资产收益率正向反映了公司在资产上的盈利情况,销售净利率正向反映了公司在销售上的盈利情况。因此,本文将其命名为盈利因子。
因子4在总资产同比增长率、净资产同比增长率上载荷较高。总资产同比增长率和净资产同比增长率均正向反映了公司在成长方面的表现。因此,本文将其命名为成长因子。
因子5在换手率、成交量、振幅上载荷较高。换手率和成交量均正向反映了股票在交易上的表现,而振幅也与交易表现有一定的相关性。因此,本文将其命名为交易因子。
在对每只股票的因子得分通过标准化消除量纲影响后,进行K-means聚类分析。本文利用各个簇内的样本点到所在簇质心的距离平方和(SSE)作为性能度量,该值越小则说明各个类簇越收敛。因此绘制了如下所示的类似“碎石图”的图形寻找拐点,即最优k值。
在k为4时,上图出现变缓趋势。因此决定将股票分为4类,建立模型后,可得到各类股票得分的中心。
接下来,本文将各类股票的中心用“最大最小标准化”方法转化为取值在1-5之间的得分。为了突出地体现每类特征,绘制各类中心得分雷达图。
由上图可知,类别1股票在成长因子和交易因子上表现优异,说明其成长能力强且交易活跃,因此,将其命名为“潜力新星股”;类别2股票在价格因子上明显高于股票,其盈利因子、交易因子也均排名第一,说明这类股票价格高、盈利能力强且交易活跃,将其命名为“豪门高价股”;类别3股票在偿债因子上表现显著优于类别的股票,在盈利因子、交易因子上表现较好,说明其具有较强的偿债能力,公司经营较为稳定,将其命名为“成熟稳重股”;类别4股票在各因子上表现均较为普通,将其命名为“平平无奇股”。
最后,本文对各类型股票进行计数,可以发现大多数股票都属于“平平无奇股”,只有少数股票有自己的突出优势,这也符合中大部分股票都较为平庸、只有少数股票能脱颖而出的现状,说明聚类结果有一定的合理性。
此类型的股票共有10只,绝大多数来自于制造业,集中于信息技术、非日常生活消费品、医疗保健、工业四个赛道。这一类型的股票在市场上非常活跃,流动性很高,交易因子在四类股票中排名第二。
此类股票最引人注目的是其成长因子得分高居第一,成长因子主要由总资产同比增长率、净资产同比增长率两个指标构成。整体66只股票平均总资产增长率为13.75%,净资产增长率为14.70%,而此类型下10只股票平均总资产增长率高达52.40%,净资产增长率高达74.76%。资产的增加一方面来源于发行债务,另一方面来源于增资扩股。潜力新星股下的净资产增长率均大于总资产增长率,说明总资产的扩张主要来源于增资配股,企业的资金储备有了真正的提高,正处于加速扩张的发展阶段。
然而值得关注的是,此类型下公司大多处于发展的相对初期,并没有在当下这个时刻就展现出很高的盈利能力。盈利因子主要是由总资产报酬率、净资产收益率、销售净利率组成。此类型股票公司的平均盈利因子较低,其中五只股票盈利因子取值均为负数,它们的平均总资产报酬率和净资产收益率在4%-6%之间,低于全体平均水平7%-9%,平均销售净利润仅为6.31%,远低于全体平均水平13.64%,在销售盈利方面表现不足。
综上所述,此类股票是“处于高速扩张的发展初期、资本结构良好、但盈利能力尚未完全显现出来”的“潜力股”。相应地,它们的股票价格也不会过高,最高一只的每股均价为30.50元,最低一只的每股均价仅为5.59元。
德瑞锂电是一家专注于锂锰电池、锂铁电池等锂一次电池的研发、生产和销售的公司,是国内圆柱形锂锰电池最大生产商之一,是一个“小而美”的企业,从业人员500人左右,一季度营收在亿元数量级。在成长性方面,2021年上半年,德瑞锂电在新三板精选层发行时,吸引到了10家战投,共拟认购金额3000万元以上,因此第三季度的总资产同比增长率高达90.95%。在盈利能力方面,总资产和净资产回报率在11%左右,略低于北交所全体水平14%。
由上图可知,该类别下股票价格因子、盈利因子、交易因子得分较高,偿债因子和成长因子得分较低。价格因子方面,此类股票均价为109.97元,远高于北交所均价19.0元。盈利因子方面,此类股票总资产报酬率与净资产收益率分别为10.72%、20.85%,远高于整体66只股票7.60%、9.44%,表现出了强劲的盈利能力。然而值得注意的是,此类型股票的偿债因子排名末位,偿债能力表现并不尽如人意。
长虹新能源科技股份有限公司是集一次碱锰电池、二次锂离子电池等产品研发、制造、销售为一体的国家级高新技术企业,属于中国电池百强企业。在价格方面,此股均价高达135.64元,符合“高价”的特征。在盈利能力方面,2021年上半年公司营业收入13.97亿元,同比增长81.42%,和同行业股票德瑞锂电的9246.6万元相比,规模更大,资产价值更高,同时,该公司归属于母公司净利润1.27亿元,同比增长98.34%,盈利能力强劲。美中不足的是,偿债能力方面,流动比率、速动比率只有0.98和0.75,资产负债率高达66.83%,资本结构较差,财务风险相对较高。
“成熟稳重股”类型股票的突出优势在于偿债因子。短期偿债能力方面,该类型股票流动比率平均为18.81,速动比率平均为17.01,远高于北交所其余61支股票的流动比率、速动比率均值3.66和2.99,短期债务风险极低。长期偿债能力方面,该类型股票资产负债率平均为8.61%,低于其余61支股票资产负债率为29.32%,可以看出该类型公司对自身经营较为保守以及有对行业或自身发展看淡的倾向,主要靠自有资金运作,且可能有内部货币资金闲置、不善理财或融资能力较低、难以发挥财务杠杆作用的问题。
另一方面, “成熟稳重股”在成长因子上得分较低,总资产和净资产的同比增长率平均仅为14.05%和15.11%,结合在上述偿债因子中的分析可以看出相较于其他股票,“成熟稳重股”举债经营的倾向更低一些,负债在资产的增长中贡献的力量较弱,总资产的增长比较平缓,成长性不太明显。
另外,统计公司的成立时间发现:相较于北交所其他股票,“成熟稳重股”的公司成立时间集中在更早的年份,最早的三元基因成立于1992年,其余主要分布在2000年的前后一两年。也就是说,“成熟稳重股”主要对应的是传统老牌公司,发展至今,他们的经营也较为稳定和谨慎,这也与上述分析得到该类型股票偿债风险极低、经营较为保守、成长较为平缓的特点是相对应的。
生物谷公司属于医疗保健行业中的中药细分行业,是北交所中医疗保健板块公司成立时间最早的三只股票之一。生物谷公司成立于1999年,在过去的20多年里始终深耕于云南特色药材灯盏花的药品研究、开发、生产和销售,是国家多个重点科技计划项目的承担单位,是云南省首批、国家第二批创新型试点企业。
偿债能力方面,流动比率、速动比率分别为18.65和16.25且资产负债率为18.45%,短期和长期的偿债能力都较强;成长能力方面,总资产和净资产的同比增长率仅为3.88%和0.23%,扩张趋势较弱。盈利能力方面,净资产报酬率为4.38%仅接近北交所平均水平9.44%的一半,可以看出由于生物谷专注的中成药领域研发时间跨度大,投入往往不能快速获得盈利回报,所以公司在经营过程中更注重风险的规避,可能更多地以自有资本进行运作经营,且可能由于盈利见效慢导致借贷成本大部分高于利润空间,故资产增长缓慢,最终呈现出“偿债风险很低、成长增速较缓”的特点。
“平平无奇股”包含本次研究的北交所66支股票中的47支,数量约占70%,这与实际中优质股、成长股、稳定股可遇不可求,而大多数人遇到的都是资质平平的股票这一现象是相吻合的。如图5-6所示,可以发现该类型股票并没有任何一个因子较为突出。
进一步地,我们挑选出每个因子下面的代表性变量,绘制“平平无奇股”和北交所所有股票在这些变量上各自的分布,如图5-7所示。图5-7中虚线代表各变量的均值水平,可以看出“平平无奇股” 资产负债率数值表现为偏高,在其余各个变量上都表现在中等甚至偏下水平。
基于本次因子分析和聚类分析结果,我们对不同资金实力和风险偏好的投资者提出以下对应的投资建议:
(2)对于激进型投资者,由于其更注重高收益而不惧承担风险,故建议考虑处于高速扩张期、成长性较强的“潜力新星股”;
(3)对于有钱任性型投资者,由于其资金实力雄厚、具有高价股票的购买能力和风险承担能力,故建议选择股票价格和盈利能力均较高的“豪门高价股”。
狗熊会特别感谢案例素材提供者:黄依诺、杨艺霞、卫思妤、夏子胭,四位小伙伴均来自中国人民大学统计学院。
本案例为狗熊会精品案例库收录。狗熊会精品案例库为狗熊会核心商业产品,目前收录了超过100个案例,包括探索性数据分析、回归分析、机器学习、文本分析、时间序列分析等模块,涉及电商、金融、餐饮等行业。狠戳阅读原文,查看狗熊会精品案例库。狗熊会精品案例库面向机构收费授权开放,有意洽谈者,请加熊二微信clubear2详细沟通。
本站 2020年是中国产业区块链元年,中央将区块链定调为“核心技术自主创新的突破口”并将 区块链纳入新基建的重要技术基础设施。 2020年是中国产业区块链元年,中央将区块链定调为“核心技术
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186