本文以全A股股票为股票池,建立了一个基于logistic回归的高转送预测模型。虽说现在在刘主席的监管下,高转送等炒作可能会逐渐失效。但没关系,通过找一些feature建立模型来预测事件发生的可能性,这种思路永远都不可能过时。倘若高转送不行了,我们大家可以很容易的切换到预测有党性的高分红事件嘛。
这里我们调用DataAPI,EquDivGet获取历史上各只股票的分红送转情况,参考了兴业证券的研报,将高转送定义为转股比例加上送股比例大于0.5。
如上便是各年份的发生高送转的数量,我国07年会计准则发生过大的改变,我们选取07年至16年作为我们的样本区间。
得到解释变量与被解释变量构成的矩阵,其中Total_PS是每股资本公积金与每股留存收益之和,EPS是TTM的每股盈利、Total_Shares是总股本单位为亿、listYear是上市时间单位年、ifNew是虚拟变量表示是否是新股、MidHasTransfer是虚拟变量表示年中是否有过高转送、LastHasTransfer是虚拟变量表示去年是否有过高转送,一共7个解释变量;isTransfer是被解释变量表示年终是不是真的高转送。
最终的回归结果如上所示,能够准确的看出Total_PS(每股资本公积金与每股留存收益之和)与EPS越大,年终进行高转送的概率也越大,并且显著性非常高;Total_Shares(总股本)和listYear(上市时间)越小,年终进行高转送的概率也越大,并且显著性非常高;而ifNew(是否是新股)系数是正的,但是不显著性,MidHasTransfer(年中是否高转送)也不显著;LastHasTransfer(去年是否高转送)比较显著。
大家可以对比其预测高转送概率(predict_probability)与是否发生了高转送(isTransfer)。以2015年年终的高转送真实的情况,作为样本外点预测。
可以看出,在2015年末2762只股票有383只股票进行了高转送;如果我们瞎蒙的线%的概率蒙中。依照我们的预测模型,选取发生概率大于0.5的股票共有25只,其中13只实际发生了高转送,准确度为52%;选取发生概率大于0.4的股票共有62只,其中32只实际发生了高转送,准确度为51.6%;选取发生概率前383只的股票有153只实际发生了高转送,准确度为40%。总体来说,我们模型的效果相对于瞎猜有了很大的提高,但准确度看起来还不够高,有逐步优化的空间。
优矿专业版除了已有的 400+因子库、归因、并行计算及风险模型,即将推出深度学习框架!