摘要:重大好消息!经过半个月的熬夜加班,今天终于完成了概念匹配度V47版本的重大升级,这个版本意义重大,不仅增加了新的板块,并且通过新的算法,更加贴近实战。我们一共800多个概念,请问有那个软件的概念,有我们的丰富。 下一步的计划,就是用我们这个最新的板块数据,去计
重大好消息!经过半个月的熬夜加班,今天终于完成了概念匹配度V47版本的重大升级,这个版本意义重大,不仅增加了新的板块,并且通过新的算法,更加贴近实战。我们一共800多个概念,请问有那个软件的概念,有我们的丰富。 下一步的计划,就是用我们这个最新的板块数据,去计算板块RPS,更快、更准、更好的去发现潜力板块。这个版本,我们已经上传到了秘密基地。
今天我随便选几个板块,来贴一下截图,我们是选择板块中最核心的8个股票。
先来看看宠物经济吧
再来看看PCB概念
再来看看共封装光学(CPO)概念概念
再来看看节能电机概念:
经常看我文章的朋友,肯定都是知道,我们有一个最底层的数据,也是我们最核心的数据,就是板块匹配度数据。这是最核心的。我先给大家看一个数据,通达信的概念板块数据一共268个。而且把含H股、含B股这样的概念板块,也混在一起。大家可以想想,这种把各种分类方式混在一起,这种分类的精准度如何?
那么同花顺有多少种概念分类,我告诉你是397种,同样这种分类方式里也同样存在各种分类方式混杂的问题。
那经过升级后的,我们的概念板块有多少个呢?867个。我们在上一个版本的基础上,增加到了867个,而且我们的分类方式,不是静态的,而是根据市场热点、市场实实在在被认可过的实战板块。所以,我们的数据,突出一个实战价值。
为什么说这次是重大升级呢?如果只是数量上的增加,那肯定不能算是重大升级。这次我们每个概念板块选出8-10个最核心的个股中,我们首次引入了随机森林(Random Forest)的集成学习算法,通过结合多个决策树的预测结果来提升分类精度和泛化能力。
引入这个算法,主要是为了解决过拟合的问题,我们以前实战中,会发现一个问题,根据历史数据,某一个股票,在历史上确实是这个概念最核心的股票,只有这个概念一启动,那这个股票就是急先锋,妥妥的根红苗正,但是这里面就存在一个问题,这个相关性,是不是一成不变的呢?随着市场的不断变化,他会不会由原来的强相关,慢慢弱化为弱相关呢?如果过度拟合,是不是就会出现刻舟求剑的僵化思维呢?
我们这个重大版本升级,就是为了解决这个问题, 减少过拟合,提高泛化能力核心机制:随机森林通过构建多棵决策树(“森林”),并对结果进行投票或平均,有效降低了单棵决策树因过拟合训练数据而导致的分类偏差。Bagging(自助采样):每棵树基于不同的训练子集(有放回抽样)构建,减少了模型对训练数据噪声的敏感性,从而提升稳定性。随机特征选择:每棵树在节点分裂时仅使用随机子集的特征,增加了树之间的多样性,避免所有树对某些噪声特征过度敏感。
以上是本次升级的说明,这个升级需要花费15天左右的时间,工作量巨大。
来源:初云大数据量化