Python利用request库实现翻译接口
作者:didiplus
通过阅读之前python基础篇的文章,基本上对python这门语言有了初步的了解。基础篇的文章都是介绍python的一些语法和函数的使用方法。实战篇是通过一个完整的案例讲解python在实际开发中运用方法。今天通过做一个翻译的接口来介绍一下request
库的基本用法。
request库的基本使用
安装
要使用Python中的requests库,首先需要使用pip安装它。您可以在终端中运行以下命令来完成此操作:
pip install requests
使用
安装库后,您可以使用它来进行HTTP请求。以下是如何进行GET请求的示例:
import requests response = requests.get('https://www.baidu.com') print(response.text)
在此示例中,我们导入requests库,然后使用get方法进行GET请求到https://www.baidu.com。服务器的响应存储在response变量中,我们将响应文本打印到控制台。
还可以将参数传递给get方法,以在请求中包含查询参数:
import requests params = {'key1': 'value1', 'key2': 'value2'} response = requests.get('https://www.example.com', params=params) print(response.url)
在此示例中,我们将查询参数的字典传递给get方法的params参数。生成的URL将包括查询参数,我们将URL打印到控制台。
还可以使用post方法进行POST请求:
import requests data = {'key1': 'value1', 'key2': 'value2'} response = requests.post('https://www.example.com', data=data) print(response.text)
在此示例中,我们将数据的字典传递给post方法的data参数。数据将在请求的正文中发送,我们将响应文本打印到控制台。
开发自己的翻译接口
分析百度翻译
打开百度翻译地址,然后按F12
打开开发者模式,输入翻译的内容,点击翻译,通过下图,可以清楚看到请求的地址和请求的参数
百度翻译通过向https://fanyi.baidu.com/v2transapi发送post请求,发送的数据中只有sign是不断变化的,搜索v2transapi发现sign字段是通过js通过你要发送的数据字符串进行加密得到的。
通过百度翻译的js
分析得出加密的关键代码如下:
现在已经搞清楚了整个调用的流程,所有的参数都可以自己构造。这样就可以写代码了。
写接口代码
1、为了防止请求失败,需要模仿浏览器请求,在请求时加上请求头,我们采用fake_useragent
这个第三方库,随机生成不同的User-Agent
。关键代码如下:
from fake_useragent import UserAgent headers = {'User-Agent': UserAgent().random}
2、生成sign
参数,由于加密的js
代码我们看不明白,直接调用python
的第三方库执行js
代码,使用前需要安装execjs
库,执行如下的代码:
pip3 install PyExecJS
这个库使用方法也很简单,例如,上面我们已经把百度的加密js
代码已经提取出来了,并新建一个js
文件,把内容复制进去。关键代码如下:
def generate_sign(self,query): try: if os.path.isfile("./baidu.js"): with open("./baidu.js", 'r', encoding="utf-8") as f: baidu_js = f.read() ctx = execjs.compile(baidu_js) return ctx.call('b', query) except Exception as e: print(e)
先把js文件读到缓存中,再通过execjs
调用该对象。最后通过调用call
方法执行js
文件的里面的方法,其中b
是对应js
的方法,query
是js
中b
方法的参数。
调用成功后,返回如下:
3、获取token
值,通过观察百度翻译页面的源码,发现token
是存放在页面中的,这样我们就可以通过请求页面获取到token
.
res = request.get("https://fanyi.baidu.com").content.decode() token = re.findall(r"token: '(.*)',", res, re.M)[0]
4、到目前为止所有的请求参数已经有了,这样我们就可以开始构造请求。核心代码如下:
url = 'https://fanyi.baidu.com/v2transapi' sign = generate_sign("你好") data = { "from": "zh", "to": 'en', "query": "你好", "transtype": "translang", "simple_means_flag": "3", "sign": sign, "token": self.token, "domain": "common" } res = requests.post( url=url, params={"from": "zh", "to": 'en'}, data=data, headers = { 'User-Agent': UserAgent().random, } ) res.json().get("trans_result").get("data")[0].get("dst")
请求成功后,会返回如下图:
通过实际的调用中发现不是每次请求成功的,所以需要多次进行请求,通过一个循环操作,当清楚成功就跳出循环,关键代码如下:
tryTimes = 0 try: while tryTimes < 100: res = self.session.post( url=url, params={"from": fromLan, "to": toLan}, data=data, ) if "trans_result" in res.text: break tryTimes += 1 return res.json().get("trans_result").get("data")[0].get("dst")
这样我们就已经完成利用百度翻译接口,做成自己的翻译接口调用了。可以根据自己的需求采用Flask
或Fastapi
开发API接口了。下面是全部的代
import requests import execjs import os import re import json from loguru import logger from fake_useragent import UserAgent class Baidu_translate: def __init__(self): self.session=request.Session() self.session.headers={ 'User-Agent': UserAgent( ).random, "Host":"fanyi.baidu.com", "X-Requested-With":"XMLHttpRequest", "sec-ch-ua":'"Not?A_Brand";="8","Chromium";v="108","Microsoft Edge";V="108", "sec-ch-ua-mobile":"?0", "Sec-Fetch-Dest":"document", "Sec-Fetch-Mode":"navigate", "Sec-Fetch-Site": "same-origin", "Sec-Fetch-User":"?1", "Connection":"keep-alive", } self.session.get("https://fanyi.baidu.com" ) res = self.session.get("https://fanyi.baidu.com").content.decode( ) self.token = re.findall(r"token: '(.*)',",res,re.M)[0] def generate_sign(self,query): try: if os.path.isfile("./baidu.js"): with open("./baidu.js",'r',encoding="utf-8") as f: baidu_js = f.read( ) ctx = execjs.compile(baidu_js) return ctx.call('b',query) except Exception as e: print(e) def lang_detect(self,src: str) -> str: url = "https://fanyi.baidu.com/langdetect" fromLan = self.session.post(url, data={"query": src}).json()["lan"] return fromLan def translate(self,query: str, tolan: str = "", fromLan: str = "") -> str: if fromLan == "": fromLan = self.lang_detect(query) if toLan == "": toLan = "zh" if fromLan != "zh" else "en" url = 'https://fanyi.baidu.com/v2transapi' sign = self.generate_sign(query) data = { "from" : fromLan, "to": toLan, "query": query, "transtype":"translang", "simple_means_flag":"3", "sign" : sign, "token": self.token, "domain":"common" } tryTimes = 0 try: while tryTimes < 100: res = self.session.post( url=url, params={"from": fromLan,"to": toLan}, data=data, ) if "trans_result" in res.text: break tryTimes +=1 return res.json().get("trans_result").get("data")[0].get("dst") except Exception as e: print(e) def test(): url ='https://fanyi.baidu.com/v2transapi' sign = generate_sign("你好") data = { "from":"zh", "to":' en', "query":"你好", "transtype":"translang", "simple_means_flag":"3", "sign": sign, "token": self.token, "domain": "common" } res = requests.post( url=url, params={"from": "zh","to":'en'}, data=data, headers = { 'User-Agent': UserAgent( ).random, } ) res .json() if _name__ == "__main__": baidu_tran = Baidu_Translate() sign = baidu_tran.generate_sign("你好")
到此这篇关于Python利用request库实现翻译接口的文章就介绍到这了,更多相关Python request翻译接口内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!