▍抓取一些更直接的链接
*Thor 还可以抓取一些直接一点的链接。
*示例为我们平时所看的电视直播,点开界面,选择电视观看,难免看到广告,是否可以直接打开收看呢?我们用Thor试试看看否抓取直接观看的地址?
*新建一个过滤,关键词“m3u8”,开启Thor,在Safari打开直播观看,可以观看,返回Thor,停止抓包。
*点击查看抓包记录,可以响应一栏——消息体查看包的格式,在概况内,打开抓取到的链接,就可以直接观看该直播频道了。
*同理,可以想办法抓取一些API接口,VIP视频解析接口,一些下载的直链等等。大家自行测试吧
▍HTTP常见问题
*在Thor 设置自己的过滤器配置的时候,在匹配HTTP方法一栏,常见的HTTP方法都可以看到,具体是什么意思呢?下面做下简单的介绍。
*常用的HTTP方法
*GET: 用于请求访问已经被URI(统一资源标识符)识别的资源,可以通过URL传参给服务器。
*POST:用于传输信息给服务器,主要功能与GET方法类似。
*PUT: 传输文件,报文主体中包含文件内容,保存到对应URI位置。
*HEAD: 获得报文首部,与GET方法类似,只是不返回报文主体,一般用于验证URI是否有效。
*DELETE:删除文件,与PUT方法相反,删除对应URI位置的文件。
*OPTIONS:查询相应URI支持的HTTP方法。
*PATCH:是对PUT方法的补充,用来对已知资源进行局部更新
*GET方法与POST方法的区别
*get重点在从服务器上获取资源,post重点在向服务器发送数据;
*get传输数据是通过URL请求,以field(字段)= value的形式,置于URL后,并用"?"连接,多个请求数据间用"&"连接,这个过程用户是可见的;post传输数据通过Http的post机制,将字段与对应值封存在请求实体中发送给服务器,这个过程对用户是不可见的;
*Get传输的数据量小,因为受URL长度限制,但效率较高;Post可以传输大量数据,所以上传文件时只能用Post方式;
*get是不安全的,因为URL是可见的,可能会泄露私密信息,如密码等;post较get安全性较高;
*get方式只能支持ASCII字符,向服务器传的中文字符可能会乱码。post支持标准字符集,可以正确传递中文字符。
*常见的HTTP相应状态码
200:请求被正常处理。可以正常播放的音视频,常见于网页直接播放或者下载。
204:请求被受理但没有资源可以返回
206:客户端只是请求资源的一部分,服务器只对请求的部分资源执行GET方法,相应报文中通过Content-Range指定范围的资源。完整的音视频被拆成了很多段,每一个206都是其中一段,且不能直接播放(首段除外),常见于播放器播放产生。
301:永久性重定向
302:临时重定向。301和302表示请求的音视频url地址变更为其他URL,新的URL在响应——请求头——Location中可以找到。
303:与302状态码有相似功能,只是它希望客户端在请求一个URI的时候,能通过GET方法重定向到另一个URI上
304:发送附带条件的请求时,条件不满足时返回,与重定向无关。向服务器询问url 指向资源是否更新,无更新则服务器返回304。所以不会有资源被抓到,但是请求的url 可以单独去下载。
307:临时重定向,与302类似,只是强制要求使用POST方法
400:请求报文语法有误,服务器无法识别
401:请求需要认证
403:请求的对应资源禁止被访问
404:服务器无法找到对应资源
500:服务器内部错误
503:服务器正忙
*HTTP的缺点与HTTPS
a、通信使用明文不加密,内容可能被窃听
b、不验证通信方身份,可能遭到伪装
c、无法验证报文完整性,可能被篡改
HTTPS就是HTTP加上加密处理(一般是SSL安全通信线路)+认证+完整性保护。所以我们解析HTTPS,需要安装和信任证书。