0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

学习下如何去抓APP的数据

电子工程师 来源:lq 2019-01-23 09:44 次阅读

【导语】2019亚洲杯决赛正如火如荼进行中,国足的晋级之路可谓用“惊现”二字评论。继1月16日,国足对战韩国队败北后,一名Python学习者为了一窥网友们的评论,特意爬了懂球帝App的数据。

最新喜讯是在20日国足对战泰国的比赛中,成功逆转战胜泰国晋级八强,无不惊喜。让我们来学习下本文相关技术要点。

正文:

如果你是个足球迷的话,估计或多或少都会看一下昨晚中国踢韩国的比赛,因为不管他们踢得怎样,我们还是深爱着他们,那句话说得好,“国足虐我千百遍,我待国足如初恋”。更何况他们两场都踢赢了,所以面对第三场实力有点强的韩国队也是希望能赢的,毕竟我们也在十二强赛上赢过他们!

如果你不是个足球迷,但你也可以看看,可以学习下如何去抓APP的数据。好了,废话不多说,开始抓取!

1. 抓包分析请求

手机抓包我们可以用 Fiddler 软件来抓取,如果不懂怎样抓的话,可以看看这篇文章《抓包软件 Fiddler 了解一下?》(文章链接:https://mp.weixin.qq.com/s/G7xjvoh77pwcsP1KNotxjw)

配置好之后,开始抓包。

首先找到需要爬取的文章

懂球帝app截图

文章链接为:https://m.dongqiudi.com/article_share/896482.html

在配置好抓包之后,点击下方的评论,可以看到

评论截图

抓包截图

很容易就找到文章评论的请求,就是下面这个

可以看到请求的链接为:https://api.dongqiudi.com/v2/article/896482/comment?sort=down&version=177,

请求方法为GET,接下来就好办了,我们再看看滑下去查看更多的评论的请求。

可以看到,向下翻页多了两个参数,不过容易知道,next参数就是一个时间戳,而pn参数就是页数吧,从0开始的。

但是怎样判断所有评论已经爬完了呢?我们可以看看数据的详情,下面将 json 数据格式化,在下图可以看到在 data 里面有下一页的数据,那这就容易了,哈哈

分析了,接下来就是代码部分了。

2. 代码部分

这是主体部分,先从第一个评论链接中爬取评论以及找出下一页的评论地址进而继续爬取。这里是把数据库存进 mongodb 中。

主要的爬取逻辑,可以看出来是比较简单的,因为没有涉及到什么加密参数之类的,但是有一个问题,每一次进行请求的时候,有时候是会返回带有相同的评论的,所以我们也需要在数据库简单地进行去重。

下面是入库和去重的代码部分

剩下的就没有了。

3. 查看所得的数据

由于数据分析还不熟悉,所以暂时只制作词云图。

需要先将数据写到文本上

词云图是:

可以看出,昨晚国足输一场,也被很多人喷了,但是还是有很多人是一直支持的,永远都为国足加油,里面也说到了,中国和韩国是有一定差距的,而且还有点大,输了也正常不过了,没必要喷,再说我觉得昨晚的比赛已经比第一场的比赛好很多(第二次没看),还是有进步的,我对国足未来淘汰赛也是充满期望的,我相信能走得更远!

下一场踢泰国,20号,有人看吗?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • APP
    APP
    +关注

    关注

    33

    文章

    1574

    浏览量

    72548
  • 代码
    +关注

    关注

    30

    文章

    4793

    浏览量

    68700
  • python
    +关注

    关注

    56

    文章

    4797

    浏览量

    84775

原文标题:为了一窥国足输韩国之后人们的评论,我爬了懂球帝App

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    CC2530 packet sniffer 为什么不到,?

    我用packet sniffer 软件包,芯片用的是CC2530,想协调器给终端设备发送的信道和pandid值,但是抓取不到,不知道为什么?只有MAXC层有数据,NWK层和应用层都没有数据
    发表于 03-14 10:53

    Packet Sniffer包遇到的问题

            我用的是CCDebuger +CC2531 USB Dongle,按照TI官方文档的顺序进行包,每次出来的数据基本上全都是错的,按用户指南说的是数据包解析错误,但是具体要怎么
    发表于 06-01 02:30

    加密后包分析的问题?

    请问一,我的zigbee设备全部都开启了加密, 使用包软件包的时候,数据都是加密的,我应该怎么解密分析这些数据呢,谢谢了
    发表于 06-01 14:22

    无线学习型红外遥控器(APP蓝牙控制,有APP安装文件)

    ,键值保存到手机 c、保存的键值用于发射控制实现功能1、红外遥控器解码功能2、红外遥控器发射功能3、解码保存功能(APP实现)制作实物 学习状态,按遥控器按键,就行解码,解码数据传给
    发表于 03-09 11:27

    wireshark数据分析问题

    用网络调试助手作为Tcp Server给STM32F429发送数据,每次传输完21845bytes后,就出现问题。用WireShark包的数据有些不太理解。上图为用串口调试助手调试后的信息,每次传输到21846bytes就接收
    发表于 04-08 04:35

    如何使用Wireshark包工具呢

    Wireshark是什么?怎样安装一种Wireshark包工具?如何使用Wireshark包工具呢?
    发表于 09-17 06:31

    App是如何实现重启的呢

    App是如何实现重启的呢?如何实现App静默安装APK呢?
    发表于 02-10 07:52

    AVR入门: 如何使用App Note实现USART通讯?

    AVR入门: 使用App Note实行基于IRQ的USART通讯 (#18)
    的头像 发表于 07-09 00:05 2310次阅读

    用纸板制作娃娃机

    每次娃娃,总是差那么一丁点,要是能在家练习就好了。本次就给大家介绍怎么做不插电的娃娃机,快来学习吧。
    的头像 发表于 01-22 17:49 7w次阅读

    Wireshark数据包网络协议的分析

    Wireshark 是目前最受欢迎的包工具。它可以运行在 Windows、Linux 及 MAC OS X 操作系统中,并提供了友好的图形界面。同时,Wireshark 提供功能强大的数据包功能
    发表于 10-12 08:00 1次下载
    Wireshark<b class='flag-5'>数据</b><b class='flag-5'>抓</b>包网络协议的分析

    推荐六款可提高学习效率的APP

    工欲善其事,必先利其器。好的学习App改变你的人生,开学了,来看看学霸们的App配置吧,抄下这份该抄的作业。
    的头像 发表于 03-03 11:55 3549次阅读

    USB数据包软件程序下载

    USB数据包软件程序下载
    发表于 09-09 16:01 9次下载

    浅析一KUKA机器人

    SPSMAKRO342 = M1-零件检测没有时打开夹,是用来进行复位保证件前所有夹是打开的
    的头像 发表于 11-07 10:36 890次阅读
    浅析一<b class='flag-5'>下</b>KUKA机器人<b class='flag-5'>抓</b>件

    APP不到包?

    其实如果不进行客户端安装证书,也是可以包的,但是没有信任的证书相当于就是在路由上走一次,并没有加解密过程,实际上还是客户端与服务器端进行加解密通信
    的头像 发表于 08-03 16:45 1275次阅读
    <b class='flag-5'>APP</b><b class='flag-5'>抓</b>不到包?

    如何抓取app数据包 网络包原理及实现

    要实现对App的网络数据包,需要监控App与服务器交互之间的网络节点,监控其中任意一个网络节点(网卡),获取所有经过网卡中的数据,对这些
    发表于 08-11 09:30 3287次阅读
    如何抓取<b class='flag-5'>app</b><b class='flag-5'>数据</b>包 网络<b class='flag-5'>抓</b>包原理及实现