0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是js代码混淆

python爬虫知识分享 来源:python爬虫知识分享 作者:python爬虫知识分享 2022-03-31 16:05 次阅读

为什么要引出Python执行js这个问题?

都说术业有专攻,每个语言也都有自己的长处和短处。在爬虫方向,Python绝对是扛把子,近几年随着AI的火爆,需要各种各样的数据,所以,爬虫需求也跟着水涨船高起来。

做爬虫的当然是爬的爽,但是估计人家后台在骂街,毕竟谁都不希望自己的数据被弄走,所以后台反爬技术也在快速提升,一攻一防就这么在拉锯着。

现在为了防止反爬,前端使用的反爬技术比较多的是js代码混淆。

什么是js代码混淆?

正常代码

我们现在看一段js代码,代码逻辑很简单,就是拼接时间返回。

function formatDate(now) {
    var now = new Date(1230999938);
    var year=now.getFullYear();
    var month=now.getMonth()+1;
    var date=now.getDate();
    var hour=now.getHours();
    var minute=now.getMinutes();
    var second=now.getSeconds();
    return year+"-"+month+"-"+date+" "+hour+":"+minute+":"+second;
}

混淆代码

function formatDate(mz1){var KkkGDiH2=new window["\x44\x61\x74\x65"](1230999938);var tsk3=KkkGDiH2['\x67\x65\x74\x46\x75\x6c\x6c\x59\x65\x61\x72']();var YMreyP4=KkkGDiH2['\x67\x65\x74\x4d\x6f\x6e\x74\x68']()+1;var Ozo5=KkkGDiH2['\x67\x65\x74\x44\x61\x74\x65']();var QMYEc$eD6=KkkGDiH2['\x67\x65\x74\x48\x6f\x75\x72\x73']();var JfXVV_Akq7=KkkGDiH2['\x67\x65\x74\x4d\x69\x6e\x75\x74\x65\x73']();var $mP8=KkkGDiH2['\x67\x65\x74\x53\x65\x63\x6f\x6e\x64\x73']();return tsk3+"\x2d"+YMreyP4+"\x2d"+Ozo5+" "+QMYEc$eD6+"\x3a"+JfXVV_Akq7+"\x3a"+$mP8

可能我们会有个疑问,js代码都成这玩意了,还能执行吗? 答案是肯定的。即使js代码非常乱,但还是可以执行的,结果跟上面的是一样的。

这就造成了一个问题,我们在做爬虫时,如果需要,多多少少可能都要研究一下js代码,然后进行js解密一下,但是,但是,要是代码都混淆成了这了,还怎么解?

一点逻辑都看不通了,基本上不可用Python按照js逻辑重写出来了...

后来我就想,要是Python能执行js代码就好了,不用管函数里面的逻辑了,只拿函数返回值就好了。

Python第三方包Execjs

安装

在安装之前,需要有node环境,这里就不举栗子了,下一步下一步就好了。

pip3 install PyExecJS

Execjs用法超级简单的,几行代码。

执行js

注:由于上述js代码会生成window对象,并不能直接执行成功,需要额外的其他辅助,这里简单的举一下其他例子。

正常js代码


function add(x, y) {
   return x + y;
}

Python执行js代码


import execjs

ctx = execjs.compile("""
function add(x, y) {
  return x + y;
}
""")
print(ctx.call("add", 1, 2))

混淆js代码

function add(bi1,Pl$2){return bi1+Pl$2}

Python执行混淆js代码

import execjs

ctx = execjs.compile("""
function add(bi1,Pl$2){return bi1+Pl$2}
""")
print(ctx.call("add", 1, 2))

即使再混淆,只要执行的是js代码,都是没啥问题的。

上述拼接时间返回的js混淆代码也是可以执行的,但是它多了一个window对象,需要node安装jsdom才行,或者使用selenium打开游览器执行再返回也行,当然,速度更慢。
审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • JS
    JS
    +关注

    关注

    0

    文章

    78

    浏览量

    18079
  • 代码
    +关注

    关注

    30

    文章

    4758

    浏览量

    68383
  • python
    +关注

    关注

    56

    文章

    4784

    浏览量

    84492
收藏 人收藏

    评论

    相关推荐

    Node.js小科普和Node.js安装常见管理工具

    Node.js是一个JavaScript的运行环境,用来执行JavaScript代码。 为什么会出现这么一个运行环境呢,从JavaScript研发初衷可以看出它是为了运行在浏览器中的,让网页交互更加
    的头像 发表于 11-23 15:37 83次阅读
    Node.<b class='flag-5'>js</b>小科普和Node.<b class='flag-5'>js</b>安装常见管理工具

    JS实现简单的屏幕录像机

    作者:京东保险 张洁 本文将介绍如何用JS实现简单的屏幕录像机。 一、录制准备 创建一个按钮   Start recording   书写JavaScript   var
    的头像 发表于 10-09 15:27 122次阅读

    鸿蒙跨端实践-JS虚拟机架构实现

    在Roma跨端方案中,JS虚拟机是框架的核心,负责执行动态化的JS代码。在Android平台采用了基于V8的J2V8,iOS平台则使用了系统自带的JSCore,而在HarmonyOS中,由于业界无
    的头像 发表于 09-30 14:42 2344次阅读
    鸿蒙跨端实践-<b class='flag-5'>JS</b>虚拟机架构实现

    推荐一个支持js的嵌入式设备开发平台

    可以通过vscode开发js,实时推送js代码到设备里运行,无需编译,支持屏幕,感兴趣的可以看看 https://github.com/duoxianwulian/dxdop 提供很多js
    发表于 09-04 14:04

    java反编译的代码可以修改么

    Java反编译是一种将编译后的Java字节码(.class文件)转换回源代码的过程。反编译后的代码可以进行修改,但是需要注意,反编译代码的质量和可读性可能会受到原始编译代码
    的头像 发表于 09-02 11:00 535次阅读

    工程师必备!Node.js和常见管理工具介绍(附操作演示)

    语言及其相关生态中的一些基础而关键的概念,以及它们是如何在互联网历史浪潮中产生的。一JavaScript与Node.js1JavaScriptJavaScript,即JS
    的头像 发表于 08-30 12:34 272次阅读
    工程师必备!Node.<b class='flag-5'>js</b>和常见管理工具介绍(附操作演示)

    分享IP地址混淆知识

    由于IPv4 地址资源的枯竭促使 IPv6 技术的广泛应用,从而形成了 IPv4 和 IPv6 并存的局面。这就逐渐出现了 IP 地址混淆导致的网络问题。
    的头像 发表于 07-31 16:54 269次阅读

    DX1008JS 晶体谐振器——轻薄与高性能的完美结合

    DX1008JS 晶体谐振器——轻薄与高性能的完美结合
    的头像 发表于 07-24 14:15 290次阅读

    K8S学习教程三:在PetaExpress KubeSphere 容器部署 Wiki 系统 wiki.js 并启用中文全文检索

    K8S学习教程(三):在PetaExpress KubeSphere 容器部署 Wiki 系统 wiki.js 并启用中文全文检索  。
    的头像 发表于 07-08 17:03 613次阅读
    K8S学习教程三:在PetaExpress KubeSphere 容器部署 Wiki 系统 wiki.<b class='flag-5'>js</b> 并启用中文全文检索

    鸿蒙开发学习:【OpenHarmony HAR】

    OpenHarmony js/ts三方库使用的是OpenHarmony静态共享包,即HAR(Harmony Archive),可以包含js/ts代码、c++库、资源和配置文件。通过HAR,可以实现
    的头像 发表于 03-18 16:27 710次阅读

    【鸿蒙】NAPI 框架生成工具实现流程

    NAPI 框架生成工具 可以根据用户指定路径下的 ts(typescript)接口文件一键生成 NAPI 框架代码、业务代码框架、GN 文件等。在开发 JS 应用与 NAPI 间接口时,底层框架
    的头像 发表于 02-28 17:00 653次阅读
    【鸿蒙】NAPI 框架生成工具实现流程

    【鸿蒙】OpenHarmony 4.0蓝牙代码结构简析

    OpenHarmony蓝牙模块 代码仓和目录结构 当前蓝牙完整的代码涉及多个代码代码路径 说明 应用接口https://gitee.com/openharmony/interfac
    的头像 发表于 02-26 16:08 1509次阅读
    【鸿蒙】OpenHarmony 4.0蓝牙<b class='flag-5'>代码</b>结构简析

    数据中心机房建设的痛点:概念上的混淆与建设的重要性

    的问题,并强调机房工程的重要性。 机房建设概念的混淆 1.机房建设与装修的混淆 一些人将机房建设简单地归结为装修工程,认为机房建设就是对机房进行装修。这种观点的存在可能导致对机房工程的综合性和复杂性的低估,忽视了机房工
    的头像 发表于 02-23 16:25 645次阅读
    数据中心机房建设的痛点:概念上的<b class='flag-5'>混淆</b>与建设的重要性

    N-API的JS堆对象生命周期管理

    N-API是Node API的简写,同时也是nodejs的JS VM(链)接入原生模块.node文件的应用程序二进制接口(i.e. ABI)。借助N-API引入的抽象隔离,升级nodejs运行时(虚拟机)
    的头像 发表于 12-29 09:41 503次阅读
    N-API的<b class='flag-5'>JS</b>堆对象生命周期管理

    JavaScript压缩、混淆和加密技术原理解析

    前端代码都是公开的,为了提高代码的破解成本、保证JS代码里的一些重要逻辑不被居心叵测的人利用,需要使用一些加密和混淆的防护手段。
    的头像 发表于 12-26 09:41 2957次阅读
    JavaScript压缩、<b class='flag-5'>混淆</b>和加密技术原理解析