使用mysql记录从url返回的http GET请求数据操作

业务场景需求及实现逻辑分析

在业务中,我们经常会碰到需要用http get请求数据的情况,比如http请求返回的结果如下所示:

那么,如果我们想将这些数据用mysql存储下来,那该怎么实现呢?

其实,调用python的httplib和mysqldb包将会非常容易实现,httplib负责获取url的返回,mysqldb负责对mysql数据库进行操作。下面整理了关系逻辑图:

那么,我们开始代码开发:

python依赖包准备

python需要用到的包至少有如下几个,其中mysqldb依赖包的安装可以参考python安装mysql的依赖包mysql-python

# 此为python文本编辑器界面
#!/usr/bin/python
# coding=utf-8
import httplib
import json
import time
import mysqldb

用httplib获取url请求返回

httplib包支持如下的一些方法和函数:

url = "http://www.testtesttest.com/mobile/kit?token=yyyyyyyyy&key=tttttt&size=1" #具体的url链接
conn = httplib.httpconnection("www.testtesttest.com")
conn.request(method="get", url=url) #指定get方法,以及url对象
response = conn.getresponse() #创建response对象
res = response.read() #读取url返回的内容
# 使用json.loads方法将json解码为python对象
json_repose = json.loads(res)
data = json_repose['data']

此时,http请求返回的所有信息都存在了对象res中,因为请求返回的是json字符串,上面我们采用了json.loads方法来解析。

可以留意到,最终我们将请求返回的json内容,都存到了python的对象中里,而一旦将数据转为数组或者元组等形式储存,我们就可以用python自带的函数对其进行解析或者其他操作了。

用python解析url请求返回的json

# 这里我们定义了一个函数用于解析json
def data_list_analyze(i):
 data_dict = data[i]
 status = data_dict['status']
 devi_id = data_dict['devi_id']
 update_time = time.strftime("%y-%m-%d %h:%m:%s", time.localtime(data_dict['update_time']))
 actived_time = time.strftime("%y-%m-%d %h:%m:%s", time.localtime(data_dict['actived_time']))
 return devi_id, imei, device_type, actived_time

python连接数据库并写入数据

接下来是数据库的连接示例:

# 打开数据库连接,指定数据库ip、用户名、密码、连接的库名
db = mysqldb.connect("192.168.xxx.xxx", "db_user", "db_password", "db_database", charset='utf8')
# 使用cursor()方法获取操作游标
cursor = db.cursor()
# 建表sql语句
sql = """create table if not exists `gergsmart_list`(
`devi_id` varchar(255) not null comment 'imei, //硬件设备 imei',
`imei` varchar(255) comment 'iccid,//硬件设备 sim卡',
`device_type` varchar(255) comment '设备类型',
`actived_time` datetime comment '⾸次激活时间',
primary key(`devi_id`)
)engine=innodb default charset=utf8;
"""
# 使用execute方法执行sql语句,建表
cursor.execute(sql)
# 插入数据sql语句
insert_sql = "insert into `gergsmart_list` \
(devi_id,imei,device_type,actived_time) \
values (%s, %s, %s, %s,)"

从上面可以留意到,我们可以将python解析得到的对象devi_id、imei、device_type、actived_time,放入了mysql的插入语句中去,这样我们就实现了“从url获取数据,存到python对象中,再将python对象插入到mysql的记录中”这样的操作了。

总结,其实我们可以将python看作为一个中转器,接收url请求返回,并写入mysql。而其中httplib负责了接收操作,mysqldb负责了写入操作。

补充:mysql请求超时!延伸拓展至get post请求的区别是什么,超详细!一篇足矣解决所有!!

将数据库的连接地址从127.0.0.1改为localhost即可!亲测有效!!

查阅了很多的资料,归纳总结了get请求和post请求的区别

做了以下总结:

众所周知的是get请求的参数是直接暴露在url上面,安全性较低。post请求的参数是存放在body里面夹带过去,安全性较高一点。接下来我们看看稍微全面一点的解释

我们先看一下前辈们的解释

一、get和post请求的区别是什么:

get是从服务器上获取数据,post是向服务器传送数据。

get是把参数数据队列加到提交表单的action属性所指的url中,值和表单内各个字段一一对应,在url中可以看到。post是通过httppost机制,将表单内各个字段与其内容放置在html header内一起传送到action属性所指的url地址。用户看不到这个过程。

对于get方式,服务器端用request.querystring获取变量的值,对于post方式,服务器端用request.form获取提交的数据。

get传送的数据量较小,不能大于2kb。post传送的数据量较大,一般被默认为不受限制。但理论上,iis4中最大量为80kb,iis5中为100kb。

get安全性非常低,post安全性较高。

get 请求可被缓存 post 请求不会被缓存

get 请求保留在浏览器历史记录中 post 请求不会保留在浏览器历史记录中

get 请求可被收藏为书签 post 不能被收藏为书签

get请求只能进行url编码(application/x-www-form-urlencoded)post支持多种编码方式(application/x-www-form-urlencoded 或 multipart/form-data。为二进制数据使用多重编码。)

最直观的区别就是get把参数包含在url中,post通过request body传递参数。

接下来参考一下官方的说法是什么:

二、在w3schools中也对二者进行了区分给出了官方的答案

get在浏览器回退时是无害的,而post会再次提交请求。

get产生的url地址可以被bookmark,而post不可以。

get请求会被浏览器主动cache,而post不会,除非手动设置。

get请求只能进行url编码,而post支持多种编码方式。

get请求参数会被完整保留在浏览器历史记录里,而post中的参数不会被保留。

get请求在url中传送的参数是有长度限制的,而post么有。

对参数的数据类型,get只接受ascii字符,而post没有限制。

get比post更不安全,因为参数直接暴露在url上,所以不能用来传递敏感信息。

get参数通过url传递,post放在request body中。

get产生一个tcp数据包;post产生两个tcp数据包。

基于上述以及查阅的资料做一个总结

http是基于tcp/ip的关于数据如何在万维网中如何通信的协议。 http的底层是tcp/ip。所以get和post的底层也是tcp/ip,也就是说,get/post都是tcp链接。get和post能做的事情是一样一样的。你要给get加上request body,给post带上url参数,技术上是完全行的通的。

post请求和get请求都是http的请求方式,本质上来说并无区别,底层实现都是基于tcp/ip协议。但是请求有各种各样的方式,于是http对请求方式进行了划分和规定,于是产生了get、post处理请求的分工和区别。

此外还有搜索到另外一个区别:get产生一个tcp数据包;post产生两个tcp数据包。对于get方式的请求,浏览器会把http header和data一并发送出去,服务器响应200(返回数据);而对于post,浏览器先发送header,服务器响应100 continue,浏览器再发送data,服务器响应200 ok(返回数据)。

get与post都有自己的语义,不能随便混用。

据研究,在网络环境好的情况下,发一次包的时间和发两次包的时间差别基本可以无视。而在网络环境差的情况下,两次包的tcp在验证数据包完整性上,有非常大的优点。

并不是所有浏览器都会在post中发送两次包,firefox就只发送一次。

综述:

“get方式提交的数据最多只能是1024字节”,因为get是通过url提交数据,那么get可提交的数据量就跟url的长度有直接关系了。而实际上,url不存在参数上限的问题,http协议规范没有对url长度进行限制。这个限制是特定的浏览器及服务器对它的限制。ie对url长度的限制是2083字节(2k+35)。对于其他浏览器,如netscape、firefox等,理论上没有长度限制,其限制取决于操作系统的支持。注意这是限制是整个url长度,而不仅仅是你的参数值数据长度。

理论上讲,post是没有大小限制的,http协议规范也没有进行大小限制,说“post数据量存在80k/100k的大小限制”是不准确的,post数据是没有限制的,起限制作用的是服务器的处理程序的处理能力。对于asp程序,request对象处理每个表单域时存在100k的数据长度限制。但如果使用request.binaryread则没有这个限制。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持www.887551.com。如有错误或未考虑完全的地方,望不吝赐教。

(0)
上一篇 2022年3月21日
下一篇 2022年3月21日

相关推荐