python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > python基本语法

python网络爬虫基本语法详解

作者:Token_w

掌握Python网络爬虫基本语法,就是打开数据世界的钥匙,在这份指南中,我们将带你深入浅出,从零开始一步步变成抓取信息的高手,准备好探索无限可能的网络数据世界了吗?让我们一起开启这段精彩旅程吧!

逻辑语句

熟悉C/C++语言的人们可能很希望Python提供switch语句,但Python中并没有这个关键词,也没有这个语句结构。但是可以通过if-elif-elif-…这样的结构代替,或者使用字典实现。比如:


在这里插入图片描述

这段代码实现的功能是,输入一个运算符,再输入两个数字,返回其计算的结果。比如输入“+12”,输出“3”。这里需要说明的是,input()是读取屏幕输入的方法(在python2中常用的raw_input()不是一个好选择),lambda关键字代表了Python中的匿名函数。

if,else,elif

与很多其他语言一样,Python也有自己的条件语句和循环语句。不过Python中的这些表示程序结构的语句并不需要用括(比如“{}”)括起来,而是以一个冒号作为结尾,以缩进作为语句块。if,else,elif关键词是条件选择语句的关键:


在这里插入图片描述|

在这里插入图片描述

Python中的循环语句主要是两种,一种的标志是关键词for,一种的标志是关键词while。Python中的for接受可迭代对象(例如list或迭代器)作为其参数,每次迭代其中一个元素:

for

在这里插入图片描述

【提示】如果想要输出列表中的索引和对应的元素,除了上面这样的方法之外,还有更符合Python风格的用法,如enumerate方法等

while

while循环的形式如下:


在这里插入图片描述

语句while_suit_codes会被连续不断地循环执行,直到表达式的值为False,接着Python会执行下一句代码。在for循环和while循环中,我们也会使用到break和continue关键字,分别代表终止循环和跳过当下循环开始下一次循环:


在这里插入图片描述

说到循环,就不能不提列表解析(或者翻译为“列表推导”),在形式上,是将循环和条件判断放在了列表的“[]”初始化中。举个例子,构造一个包含10以内所有奇数的列表,使用for循环添加元素:


在这里插入图片描述

使用列表解析:


在这里插入图片描述

这种“推导”(解析)也适用于字典和集合。这里我们没有说“元组”,是因为元组的括号(圆括号)表示推导时会被Python识别为生成器,关于生成器的具体概念,可以见本书6.1.2节。一般如果需要快速构建一个元组,可以选择先进行列表推导,再使用“tuple()”将列表“冻结”为元组:


在这里插入图片描述

异常处理

Python中的异常处理也比较简单,核心语句是try…except…结构,可能触发异常产生的代码会放到try语句块里,而处理异常的代码会在except语句块里实现:


在这里插入图片描述


在这里插入图片描述

异常处理语句也可以写得非常灵活,比如同时处理多个异常:


在这里插入图片描述


在这里插入图片描述

有时候,在异常处理中我们会使用finally语句,而在finally语句下的代码块不论异常是否触发都将会被执行:


在这里插入图片描述

函数与类

def

在Python中,声明和定义函数使用def(代表“define”)语句,在缩进块中编写函数体,函数的返回值用return语句返回:


在这里插入图片描述

如果没有显式的return语句,函数会自动return None。另外,我们也可以使函数一次返回多个值,实质上是一个元组:


在这里插入图片描述

pass

对于我们暂时不想实现的函数,可以使用“pass”作为占位符,否则Python会对缩进的代码块报错:


在这里插入图片描述

pass也可用于其他地方,比如if 和 for循环:


在这里插入图片描述

在函数中可以设置默认参数:


在这里插入图片描述

当有说个默认参数时会自动按照顺序逐个传入,我们也可以在调用时指定参数名:


在这里插入图片描述

class

在Python中类使用“class”关键字定义:


在这里插入图片描述

定义好类后,就可以根据类创建出一个实例。在类中的函数一般称为方法,简单地说,方法就是与实例绑定的函数,和普通函数不同,方法可以直接访问或操作实例中的数据。【提示】Python中的方法有实例方法、类方法、静态方法之分,这部分是Python面向对象编程中的一个重点概念。但是这里为了简化说明,统一称之为“方法”或者“函数”。
类是Python编程的核心概念之一,这主要是因为“Python中的一切都是对象”,一个类可以写的非常复杂,下面的代码就是requests模块中Request类及其__init__()方法(部分代码):


在这里插入图片描述


在这里插入图片描述

到此这篇关于python网络爬虫基本语法详解的文章就介绍到这了,更多相关python基本语法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文