有了彩票历史数据后,我发愁了——空有真经却不会用

360影视 2024-12-07 02:17 3

摘要:前面说到已经爬到了彩票历史数据了(以爬取福彩3D的历史数据为例),但是,随之而来的是,我该拿这些数据怎么办?都说分析,也确定了用AI来分析,但怎么分析?从哪里着手?AI是能分析,但不是随便你扔个数据给它,它就能给出你想要的,毕竟AI“还只是个孩子”。我发愁了,

小白终于朝着小目标迈出了第一步——python、彩票、数据采集

前面说到已经爬到了彩票历史数据了(以爬取福彩3D的历史数据为例),但是,随之而来的是,我该拿这些数据怎么办?都说分析,也确定了用AI来分析,但怎么分析?从哪里着手?AI是能分析,但不是随便你扔个数据给它,它就能给出你想要的,毕竟AI“还只是个孩子”。我发愁了,第1根头发掉了。这就好比抱着九阴真经,但却不知道怎么练?练什么?

书到用时方恨少,知识你不用的时候,它一文不值,但当你需要用它时,它是无价之宝。作为小白,想要有什么创新性的科学新发现,显然不现实。既然自己不能创造发明,那么只能把已经还给老师的东西再要回来了(数学老师们,我对不起你们[流泪][流泪][流泪])。

回想老师们苦口婆心教过的知识,估摸着有这些知识会用到:统计基础,概率论,数理统计等等这些方向。虽然很多人证明了数学不能用来买彩票,毕竟彩票是随机的,但是,曾经有先贤说过“不是宇宙万物间的规律不存在,而是后学们的智慧不足以发现其中的规律罢了”,至于是哪个先贤,有没有这么说,不在我的考证范围内,只要我相信有这么一种说法就值得我去尝试。

那么,先从统计的基础出发吧。APP推送的信息里有提到pandas非常适合在python中用来进行数据处理和分析,那就先用pandas试试看输出统计参数吧。爬取的福彩3D数据如下(部分):

将数据导入pandas,形成Dataframe格式数据

import pandas as pd# 假设彩票数据文件是名为'data.csv'的文件df = pd.read_csv('data.csv')

然后打印出重点关注的“开奖号码”列的基础统计参数。

# 按列输出统计参数print(df['开奖号码'].describe)

上述代码会返回以下基础参数的具体值:

count:非空值的数量。mean:平均值。std:标准差。min:最小值。25%:第一四分位数(25%的数据项小于或等于这个值)。50%:中位数(50%的数据项小于或等于这个值)。75%:第三四分位数(75%的数据项小于或等于这个值)。max:最大值。

好了,最基础的统计参数有了,那么,到这里,我对爬取的彩票数据有了最基础的统计学感知了,瞬间成就感满满……

但是,看了这个分析该买哪3个号(福彩3D当然是3个号)?

完全没有头绪。

好吧,这个分析就是“然并卵”,暂时没有发现有什么作用。

只能另想办法了,下次继续搜索相关教程吧……

来源:木木的流光

相关推荐