原始再来
原始再来介绍
这里的FlinkSessionWindow其实就是前文提到的构造完毕的基准簇,它包含了所有被关联进来的原始数据,以及按照一定规则处理好的二级字段。至于它怎么在关联的时候进行字段抽取呢,后续再来讨论这个规则,此处就先认为,在窗口完成的时候就把簇计算出来了,并完成了所需字段计算和抽取。
以上吹那么多,接下来仅仅是描述一个简单的算法而已,原因就是我在做数据清洗的过程中,一般只需要拿原始数据即可,从原始数据再来构建业务数据。典型的就是K线数据的周期转换,服务器拿到每天日线的原始历史数据,继而可以延伸出复权数据,周期数据、指标数据等。复权和指标算法后面会写,这里先讲一个简单的周期转换算法,即日线转周线、月线、年线,分钟周期5分钟、15分钟、30分钟、60分钟转换等。
上面的2D和3D版的对比,两台元祖简直一毛一样了。再来**它和原始素组模型的效果对比,原件是不是感觉如同小学时候的地摊玩具。
但也有水友对此并不买单,并直言无论是Doinb,乌兹还是各大复盘UP主最终的目的都只是想要流量而已,因此对于Doinb和乌兹而言只要足够夸张就可以吸引眼球,就像此前乌兹还公开表示过京东天下第一,看好京东全胜。而UP主更需要标新立异,故意跟水友们的认知反着来,以此营造一种“高等教学”或“独家分析”的感觉。与其看他们在这里吹水,不如趁此时间多玩会饰演狂飙徐江的贾冰代言的原始传奇,等他们发布下一个视频再来笑话。
最后我们再来看看经济对比赛结果的影响,因为原始数据集已经给出来两队经济之差这个特征,所以我们直接进行画图比较即可。
这里的FlinkSessionWindow其实就是前文提到的构造完毕的基准簇,它包含了所有被关联进来的原始数据,以及按照一定规则处理好的二级字段。至于它怎么在关联的时候进行字段抽取呢,后续再来讨论这个规则,此处就先认为,在窗口完成的时候就把簇计算出来了,并完成了所需字段计算和抽取。