[前端] V8引擎编译原理

文章目录

      • 1.什么是V8
        • 1.1 扫描器Scanner
        • 1.2 解析器parser
        • 1.3 预解析PreParser
        • 1.4 解释器Ignition
        • 1.5 编译器TurboFan

1.什么是V8

V8是谷歌的开源高性能JavaScript和WebAssembly引擎,用C++编写。它被用于Chrome和Node.js等。它实现ECMAScript和WebAssembly,并在Windows 7或更高版本、macOS 10.12+以及使用x64、IA-32、ARM或MIPS处理器的Linux系统上运行。V8可以独立运行,也可以嵌入到任何C++应用程序中。

在这里插入图片描述

  • 扫描器Scanner

  • 解析器Parser

  • 预解析PreParser

  • 解释器Ignition

  • 编译器TurboFan

在这里插入图片描述

1.1 扫描器Scanner

Blink(谷歌浏览器的渲染引擎,基于webkit分支开发)主要负责HTML DOM CSS 渲染,嵌入V8引擎,执行js,计算样式和布局,嵌入合成器,绘制图形。

Blink 拿到html代码分析,找到script代码交给V8引擎解析,注意Blink是通过流的形式传给V8的。

通过以流的形式传输数据,Blink可以逐步接收和处理来自网络的字节流,并在需要时将相应的数据传递给V8引擎执行。这种流式处理方式使得浏览器可以在数据到达的同时并行处理不同的任务,提高了页面的加载速度和用户体验

Scanner(扫描器)首先会进行词法分析:

V8_INLINE Token::Value Scanner::ScanSingleToken() {Token::Value token;do {next().location.beg_pos = source_pos();if (V8_LIKELY(static_cast<unsigned>(c0_) <= kMaxAscii)) {token = one_char_tokens[c0_];switch (token) {case Token::LPAREN:case Token::RPAREN:case Token::LBRACE:case Token::RBRACE:case Token::LBRACK:case Token::RBRACK:case Token::COLON:case Token::SEMICOLON:case Token::COMMA:case Token::BIT_NOT:case Token::ILLEGAL:// One character tokens.return Select(token);case Token::CONDITIONAL:// ? ?. ?? ??=Advance();if (c0_ == '.') {Advance();if (!IsDecimalDigit(c0_)) return Token::QUESTION_PERIOD;PushBack('.');} else if (c0_ == '?') {return Select('=', Token::ASSIGN_NULLISH, Token::NULLISH);}return Token::CONDITIONAL;case Token::STRING:return ScanString();case Token::LT:// < <= << <<= <!--Advance();if (c0_ == '=') return Select(Token::LTE);if (c0_ == '<') return Select('=', Token::ASSIGN_SHL, Token::SHL);if (c0_ == '!') {token = ScanHtmlComment();continue;}return Token::LT;case Token::GT:// > >= >> >>= >>> >>>=Advance();if (c0_ == '=') return Select(Token::GTE);if (c0_ == '>') {// >> >>= >>> >>>=Advance();if (c0_ == '=') return Select(Token::ASSIGN_SAR);if (c0_ == '>') return Select('=', Token::ASSIGN_SHR, Token::SHR);return Token::SAR;}return Token::GT;case Token::ASSIGN:// = == === =>Advance();if (c0_ == '=') return Select('=', Token::EQ_STRICT, Token::EQ);if (c0_ == '>') return Select(Token::ARROW);return Token::ASSIGN;case Token::NOT:// ! != !==Advance();if (c0_ == '=') return Select('=', Token::NE_STRICT, Token::NE);return Token::NOT;case Token::ADD:// + ++ +=Advance();if (c0_ == '+') return Select(Token::INC);if (c0_ == '=') return Select(Token::ASSIGN_ADD);return Token::ADD;case Token::SUB:// - -- --> -=Advance();if (c0_ == '-') {Advance();if (c0_ == '>' && next().after_line_terminator) {// For compatibility with SpiderMonkey, we skip lines that// start with an HTML comment end '-->'.token = SkipSingleHTMLComment();continue;}return Token::DEC;}if (c0_ == '=') return Select(Token::ASSIGN_SUB);return Token::SUB;case Token::MUL:// * *=Advance();if (c0_ == '*') return Select('=', Token::ASSIGN_EXP, Token::EXP);if (c0_ == '=') return Select(Token::ASSIGN_MUL);return Token::MUL;case Token::MOD:// % %=return Select('=', Token::ASSIGN_MOD, Token::MOD);case Token::DIV:// /  // /* /=Advance();if (c0_ == '/') {uc32 c = Peek();if (c == '#' || c == '@') {Advance();Advance();token = SkipSourceURLComment();continue;}token = SkipSingleLineComment();continue;}if (c0_ == '*') {token = SkipMultiLineComment();continue;}if (c0_ == '=') return Select(Token::ASSIGN_DIV);return Token::DIV;case Token::BIT_AND:// & && &= &&=Advance();if (c0_ == '&') return Select('=', Token::ASSIGN_AND, Token::AND);if (c0_ == '=') return Select(Token::ASSIGN_BIT_AND);return Token::BIT_AND;case Token::BIT_OR:// | || |= ||=Advance();if (c0_ == '|') return Select('=', Token::ASSIGN_OR, Token::OR);if (c0_ == '=') return Select(Token::ASSIGN_BIT_OR);return Token::BIT_OR;case Token::BIT_XOR:// ^ ^=return Select('=', Token::ASSIGN_BIT_XOR, Token::BIT_XOR);case Token::PERIOD:// . NumberAdvance();if (IsDecimalDigit(c0_)) return ScanNumber(true);if (c0_ == '.') {if (Peek() == '.') {Advance();Advance();return Token::ELLIPSIS;}}return Token::PERIOD;case Token::TEMPLATE_SPAN:Advance();return ScanTemplateSpan();case Token::PRIVATE_NAME:if (source_pos() == 0 && Peek() == '!') {token = SkipSingleLineComment();continue;}return ScanPrivateName();case Token::WHITESPACE:token = SkipWhiteSpace();continue;case Token::NUMBER:return ScanNumber(false);case Token::IDENTIFIER:return ScanIdentifierOrKeyword();default:UNREACHABLE();}}if (IsIdentifierStart(c0_) ||(CombineSurrogatePair() && IsIdentifierStart(c0_))) {return ScanIdentifierOrKeyword();}if (c0_ == kEndOfInput) {return source_->has_parser_error() ? Token::ILLEGAL : Token::EOS;}token = SkipWhiteSpace();// Continue scanning for tokens as long as we're just skipping whitespace.} while (token == Token::WHITESPACE);return token;
}
  1. 首先获取当前字符c0_的值,并设置token为初始值。
  2. 判断c0_是否是ASCII字符,如果是,则根据c0_的值来确定token的类型,并返回相应的Token。
  3. 对于一些特殊情况,如条件运算符、字符串、小于号、大于号、等号、逻辑非、加号、减号、乘号、取模、除号、按位与、按位或等,根据当前字符和后续字符的组合来确定token的类型,并返回相应的Token。
  4. 如果c0_不是ASCII字符,或者不满足以上条件,则判断c0_是否是标识符的起始字符,如果是,则调用ScanIdentifierOrKeyword()函数来获取标识符或关键字的Token。
  5. 如果c0_是HTML注释的结束符’-',则调用SkipSingleHTMLComment()函数来跳过整个HTML注释。
  6. 如果扫描到文件末尾,则返回Token::EOS。
  7. 否则,如果遇到空白字符,则调用SkipWhiteSpace()函数来跳过连续的空白字符,并继续扫描下一个Token。
  8. 返回扫描到的Token。

js代码就会变成tokens 接下来进行语法分析。

1.2 解析器parser

parser 的作用就是将 tokens 转化为 AST 抽象语法树。

Program 
└── VariableDeclaration 
├── Identifier (name: "2") 
└── StringLiteral (value: "'1'")
1.3 预解析PreParser

作用是在 JavaScript 代码执行之前对代码进行可选的预处理。预解析器的存在是为了提高代码的执行效率。

V8 引擎采用了延迟解析(Lazy Parsing)的策略,它的原理是只解析当前需要的内容,而把其他内容推迟到函数被调用时再进行解析。这样可以减少不必要的解析工作,提高网页的运行效率。

例如,在一个函数 outer 内部定义了另一个函数 inner,那么 inner 函数就会进行预解析。这意味着在函数 outer 被调用之前,只会对 outer 函数的内容进行解析,而对于 inner 函数的解析会在 outer 函数调用到 inner 函数时才进行。

通过延迟解析的方式,V8 引擎可以避免解析和编译未被执行的函数,节省了不必要的时间和资源开销,提高了 JavaScript 代码的执行效率。这种优化策略在大型复杂的 JavaScript 应用程序中尤为重要,可以帮助提升整体性能和用户体验。

1.4 解释器Ignition

作用主要就是将AST 抽象语法树 转化成 字节码(bytecode)

  1. 跨平台执行:不同的硬件架构和操作系统有不同的机器码格式。通过将代码转换为字节码,可以使得同一份字节码在不同的平台上都能执行,实现跨平台的能力。
  2. 快速启动和解析:将代码转换为字节码可以比直接生成机器码更快速地进行启动和解析。字节码通常具有更简单的格式和结构,可以更快地被引擎加载和解释执行。
  3. 动态优化:现代的JavaScript引擎通常具有即时编译(JIT)功能,可以将热点代码编译成高效的机器码。通过首先将代码转换为字节码,引擎可以更好地进行动态优化和编译,根据实际执行情况生成最优的机器码。这种方式可以在运行时根据代码的实际执行情况进行优化,而不需要提前生成固定的机器码。
  4. 代码安全性:字节码作为中间表示形式,可以提供一定的代码安全性。字节码相对于源代码或机器码来说更难以理解和修改,可以提供一定程度的代码保护。
Program 
└── VariableDeclaration 
├── Identifier (name: "2") 
└── StringLiteral (value: "'1'")
0001: PushString "'1'" 
0002: StoreVar "2"

将字符串字面量 “‘1’” 推入堆栈(栈帧)。在这个例子中,它将字符串 “‘1’” 推入堆栈。

将栈顶的值存储到变量 “2” 中。在这个例子中,它将栈顶的字符串值存储到变量 “2”。

1.5 编译器TurboFan

编译器就是将字节码也可以叫中间代码 最后 转换成 机器码 能让我们的CPU识别。

CPU有不同的架构 ARM X86。

X86机器码

MOV EAX, '1' ; 将字符串 '1' 存储到寄存器 
EAX MOV [2], EAX ; 将寄存器 EAX 的值存储到变量 2 对应的内存地址中

ARM机器码。

LDR R0, ='1' ; 将字符串 '1' 的地址加载到寄存器
R0 STR R0, [2] ; 将寄存器 R0 中的值存储到变量 2 对应的内存地址中

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/211072.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

前端处理返回数据为数组对象且对象嵌套数组并重名的数据,合并名称并叠加数据

前端处理返回数据为数组对象且对象嵌套数组并重名的数据&#xff0c;合并名称并叠加数据 var newList[]; var table{}; var dataObj{}; var finalList[]; var tableData[{brName:营业部,dateStr:2023-11-23,tacheArr:[{dealCnt:20,tacheName:奔驰}]},{brName:营业部,dateStr:2…

Spring Boot 整合MyBatis-Plus 详解

MyBatis-Plus (opens new window)&#xff08;简称 MP&#xff09;是一个 MyBatis (opens new window)的增强工具&#xff0c;在 MyBatis 的基础上只做增强不做改变&#xff0c;为简化开发、提高效率而生。 全新的 MyBatis-Plus 3.0 版本基于 JDK8&#xff0c;提供了 lambda 形…

从零开始的C++(十九)

红黑树&#xff1a; 一种接近平衡的二叉树&#xff0c;平衡程度低于搜索二叉树。 特点&#xff1a; 1.根节点为黑 2.黑色结点的子结点可以是红色结点或黑色结点。 3.红色结点的子结点只能是黑色结点。 4.每个结点到其所有叶子结点的路径的黑色结点个数相同。 5.指向空的…

Windows Python3安装salt模块失败处理

复现CVE-2020-11651时候运行CVE-2020-11651的poc时候需要salt模块 在下载时出现了错误 尝试在网上寻找解决方法&#xff1a; 1.更新 setuptools 和 wheel pip install --upgrade setuptools wheel 2. 安装Microsoft Visual C 14.0 因为salt模块包包使用了 C/C 扩展&#x…

98年阿里P6测试猿晒出工资单,看完扎心了。。。

最近一哥们跟我聊天装逼&#xff0c;说他最近从阿里跳槽了&#xff0c;我问他跳出来拿了多少&#xff1f;哥们表示很得意&#xff0c;说跳槽到新公司一个月后发了工资&#xff0c;月入5万多&#xff0c;表示很满足&#xff01;这样的高薪资着实让人羡慕&#xff0c;我猜这是税后…

Docker 中OpenResty下载与使用

1Panel安装OpenResty 查看到就说明安装成功 部署项目 在http中添加&#xff1a; server { listen 8001; //端口号 server_name localhost; location / { root /admin; //项目路径 index index.html index.htm; …

羊大师教你如何科学控制体重,轻松瘦下来

羊大师教你如何科学控制体重&#xff0c;轻松瘦下来 我们都知道&#xff0c;控制体重对于保持健康和美丽至关重要。然而&#xff0c;许多人在减肥的道路上走得波折重重&#xff0c;常常陷入挫败和不知所措的境地。那么&#xff0c;如何科学控制体重&#xff0c;轻松瘦下来呢&a…

uview 页面跳转

uni.$u.route({url: pages/components/empty/index,params: {name: lisa}})参考&#xff1a; http://www.uviewui.com/js/route.html https://blog.csdn.net/SHUIYI_24/article/details/109201145

Android系统预装带so的apk

文章目录 前言配置新建Android.mk核心命令首次编译Apk已生成 但是无arm文件system.img 也已经更新 第一次刷入打开APP后闪退加入so文件如下为修改后的mk 第二次刷入mm报错查看手机系统abi路径下分别生成两个环境的so官方LOCAL_MULTILIB描述so打包错误验证so位数注释v7部分 第三…

【二叉树进阶题目】236. 二叉树的最近公共祖先,JZ36 二叉搜索树与双向链表

二叉树进阶题目 236. 二叉树的最近公共祖先解题思路及实现思路一思路二 JZ36 二叉搜索树与双向链表描述解题思路及实现 236. 二叉树的最近公共祖先 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为&#xff1a;“对于有根树 T 的两个…

Android和iOS应用程序加固方法详解:混淆、加壳、数据加密、动态加载和数字签名实现

目录 Android和iOS应用程序加固方法详解&#xff1a;混淆、加壳、数据加密、动态加载和数字签名实现 APP 加固方式 iOS APP加固代码实现 打开要处理的IPA文件 设置签名使用的证书和描述文件 开始ios ipa重签名 APP 加固方式 iOSAPP 加固是优化 iOS安全性的一种方法&…

AMEYA360:瑞萨面向高端工业传感器系统推出高精度模拟前端的32位RX MCU

全球半导体解决方案供应商瑞萨电子&#xff08;TSE&#xff1a;6723&#xff09;宣布面向高端工业传感器系统推出一款全新RX产品——RX23E-B&#xff0c;扩展32位微控制器&#xff08;MCU&#xff09;产品线。新产品作为广受欢迎的RX产品家族的一员&#xff0c;具有高精度模拟前…