Python爬虫获取基金净值信息详情
作者: 斜月
1 前言
前面的文章中我们已经获取到了基金的阶段变动信息和ETF信息的获取,那么在本章中,我们将继续前面的内容,获取基金的价格信息,并且把之前的抓取到的数据存入到数据库中,方便我们进行后续的分析操作。
2 获取基金净值
获取基金的净值信息,也就是基金的最近一个交易日的价格,如下图所示,展示了单位净值更新的日期,价格以及涨跌幅度信息。顺便我们也获取一下基金的规模信息,后续选择到同类基金不知道怎么去选择的时候,可以选择按照基金规模进行倒排序,选取规模比较大的进行投资,大概率能够保证投资收益的稳定性和可靠性。
过分分析,我们可以知道,基金的价格信息需要先获取 class="dataItem0"
的 dl
标签,基金规模信息的获取方式也如上图,可以知道规模信息在 <div class="infoOfFund">
标签中的table
中的第二个td
中 :
单位净值日期获取方式:
dt>p 标签内容
基金净值和变动信息获取方式:
- dd.dataNums>span[0] 标签为单位净值
- dd.dataNums>span[1] 标签为变动百分比
基金规模信息的获取方式:
div>table>td[2]
基于以上的分析,我们最终实现的代码如下图所示,通过以上方式我们就获取到了基金的价格信息数据:
打印的结果如下图所示:
code 159779 price 1.0007 percent 0.07 fund_size 3.55 update_date 2021-11-19
3 数据库结构设计
在获取到数据之后,需要将数据进行结构化存储
4 如何进行数据存储
需要进行存储,就需要使用数据库。在java
中存储数据有各种各样的orm框架进行操作,但是Python中没有这么重的操作,需要自己书写sql进行操作。首先我们需要安装操作数据库的类库。
# 安装 pymysql pip install pymysql
接下来我们需要配置数据库的连接信息,通过连接信息,编写两个方法,一个是查询数据库的信息,另外一个是修改数据库的信息(增/删/改)。修改数据的时候一定要记得commit()
数据库信息,否则不会保存成功。
5 总结
本文介绍了如何获取基金的价格信息,同时也进行了数据库结构的设计以及数据存储的操作方法,由于代码和表结构会占用大量的文案,文章就贴图展示
到此这篇关于Python爬虫获取基金净值信息详情的文章就介绍到这了,更多相关Python获取信息内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!