C语言中的编译和链接

系列文章目录


文章目录

​编辑

系列文章目录

文章目录

前言

一、 翻译环境和运行环境

二、 翻译环境

2.1 编译

2.1.1 预处理

2.1.2 编译

2.1.2.1 词法分析 :

2.1.2.2 语法分析

2.1.2.3 语义分析

2.1.3 汇编

2.2 链接

三、运行环境


前言

        在我们平常的写代码时,我们很少关注代码编译和链接的过程,因为通常的开发环境都是集成开发环境IDE),像vs一样编译和链接都是一步完成。在c语言中,我们在.c的文件中写代码,代码是怎么经过vs的处理使得代码可以运行呢?(怎么变成.exe运行程序呢?),下面我们来仔细探究一下代码是如何被编译和链接的,如何生成可以运行的程序的


一、 翻译环境和运行环境

        在ANSI C(美国国家标准学会的任何⼀种实现中,存在两个不同的环境。

第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令


第2种是执行环境,它用于实际执行代码

        如下图,在一个项目中我们有三个c语言文件,运行时我们首先在翻译环境将三个不同的文件进行编译,然后将三个文件进行链接,最后在运行环境生成可执行的程序

   

二、 翻译环境

        在翻译环境中,文件是如何进行的呢?是怎么将源代码转换为可执行的机器指令的呢?这里我们就得展开开讲解一下翻译环境所做的事情。

        其实翻译环境是由编译和链接两个大的过程组成的,而编译又可以分解成:预处理(有些书也叫预编译)、编译汇编三个过程。

        

        ⼀个C语言的项目中可能有多个 .c 文件⼀起构建,那多个 .c 文件如何生成可执行程序呢?
        

• 多个.文件单独经过编译出编译处理⽣产对应的目标文件。
• 注:在Windows环境下的目标文件的后缀是 .obj ,Linux环境下目标文件的后缀是 .o
• 多个目标文件和链接库⼀起经过链接器处理生成最终的可执行程序
• 链接库是指运行时库(它是⽀持程序运⾏的基本函数集合)或者第三⽅库。
 

        如果再把编译器展开成3个过程,那就变成了下面的过程:

        如下图,下面是我们写的代码,肉眼就看得出来这是一些字符组成的信息,这种是我们在.c文件下写的代码,这种叫做源文件,它是无法直接运行的。因为计算机能够识别的是二进制信息,那么像这样的文本是不能被识别的,因此要有翻译环境,通过翻译环境使得我们所写的代码变成二进制的运行程序。

        

当我们点击生成解决方案之后,打开test.c上一路径的目录中会发现有.exe的运行程序。

这个程序中就是计算机所能看懂的二进制文件,我们使用记事本打开会发现,里面全是乱码,是我们所不能看懂的信息。

        因此我们需要进行翻译,使得计算机能够实现程序,那么该如何实现翻译阶段呢?

我们就需要通过编译与链接。

2.1 编译

        编译可以分为三个阶段,预处理(有些书也叫预编译)、编译、汇编三个过程。

编译之后就会生成目标文件(vs中是 .obj , gcc 中是 .o).

当然它也是二进制文件,用记事本打开时乱码。如果有多个 .c 文件就很生成多个 .obj  (或.o)文件。最后通过链接库来将这些目标文件生成可执行程序

2.1.1 预处理

        在预处理阶段,源文件和头文件会被处理成为  .i  为后缀的文件。由于vs中没有可以查看预编译的指令,我们使用gcc环境下来查看。当然目前我们并不需要知道这些指令是怎么来的,我们只需要知道通过这些指令我们可以查看编译的三个阶段。

        在gcc环境下,对test.c文件进行预处理后的i文件,命令如下:

    gcc -E test.c -o test.i

        预处理阶段主要处理那些源文件中#开始的预编译指令。比如:#include,#define,处理的规则如下:
        • 将所有的 #define 删除,并展开所有的宏定义
        • 处理所有的条件编译指令,如: #if、#ifdef、#elif、#else、#endif
        • 处理#include预编译指令,将包含的头文件的内容插⼊到该预编译指令的位置。这个过程              是递归进行的,也就是说被包含的头文件也可能包含其他文件。
        • 删除所有的注释
        • 添加行号和文件名标识方便后续编译器生成调试信息等。
        • 或保留所有的#pragma的编译器指令,编译器后续会使用。

        经过预处理后的 .i 文件中不再包含宏定义,因为宏已经被展开。并且包含的头文件都被插⼊到 .i 文件中。所以当我们无法知道宏定义或者头文件是否包含正确的时候,可以查看预处理后的.i文件来确认

        如下图在gcc环境中的代码,使用如下指令。

就会生成test.i文件,而通过指令我们会发现预编译阶段的代码行数到了700多行。

        哪来的这么多行代码呢?仔细的观察会发现,#include <stdio.h>消失了,我们知道头文件中有很多库函数等等相关的代码,include 表示包含的意思,实际上头文件在预处理阶段被全部包含出来了,就如上面所讲的规则一致。

2.1.2 编译

         编译过程就是将预处理后的文件进行一系列的:词法分析、语法分析、语义分析及优化,生成相应的汇编代码文件
        编译过程的命令如下:

         gcc -S test.i -o test.s

假设我们预处理阶段已经生成了text.i文件,那我们使用命令对下面的代码进行编译,会怎么做呢?

array[index] = (index+4)*(2+6);

2.1.2.1 词法分析 :

        将源代码程序被输入扫描器,扫描器的任务就是简单的进行词法分析,把代码中的字符分割成一系列的记号(关键字、标识符、字面量、特殊字符等)。
上面程序进行词法分析后得到了16个记号:

2.1.2.2 语法分析

        接下来语法分析器,将对扫描产生的记号进行语法分析,从而产生语法树。这些语法树是以表达式为节点的树。

2.1.2.3 语义分析

         由语义分析器来完成语义分析,即对表达式的语法层面分析。编译器所能做的分析是语义的静态分析。静态语义分析通常包括声明和类型的匹配类型的转换等。这个阶段会报告错误的语法信息。

2.1.3 汇编

        汇编器是将汇编代码转变成机器可执行的指令,每一个汇编语句几乎都对应一条机器指令。就是根据汇编指令和机器指令的对照表一一的进行翻译,也不做指令优化。
汇编的命令如下:

        gcc -c test.s -o test.o

2.2 链接

        链接是⼀个复杂的过程,链接的时候需要把⼀堆文件链接在⼀起才⽣成可执行程序。
链接过程主要包括:地址和空间分配,符号决议和重定位等这些步骤。
链接解决的是⼀个项目中多文件、多模块之间互相调用的问题。

        比如:

在⼀个C的项⽬中有2个.c文件( test.c 和 add.c ),代码如下
我们已经知道,每个源文件都是单独经过编译器处理⽣成对应的目标文件。
test.c 经过编译器处理⽣成 test.o 
add.c 经过编译器处理⽣成 add.o 
我们在 test.c 的文件中使⽤了 add.c 文件中的 Add 函数和 g_val 变量。
我们在 test.c 文件中每⼀次使⽤ Add 函数和 g_val 的时候必须确切的知道 Add 和 g_val 的地
址,但是由于每个⽂件是单独编译的,在编译器编译 test.c 的时候并不知道 Add 函数和 g_val
变量的地址,所以暂时把调⽤ Add 的指令的⽬标地址和 g_val 的地址搁置。等待最后链接的时候由链接器根据引⽤的符号 Add 在其他模块中查找 Add 函数的地址,然后将 test.c 中所有引⽤到
Add 的指令重新修正,让他们的⽬标地址为真正的 Add 函数的地址,对于全局变量 g_val 也是类
似的⽅法来修正地址。这个地址修正的过程也被叫做:重定位

前⾯我们⾮常简洁的讲解了⼀个C的程序是如何编译和链接,到最终⽣成可执⾏程序的过程,其实很多内部的细节⽆法展开讲解。⽐如:⽬标文件的格式elf,链接底层实现中的空间与地址分配,符号解析和重定位等,如果你有兴趣,可以看《程序的⾃我修养》。

三、运行环境

        1. 程序必须载⼊内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载⼊必须由手工安排,也可能是通过可执行代码置⼊只读内存来完成。
2. 程序的执⾏便开始。接着便调用main函数。
3. 开始执行程序代码。这个时候程序将使用⼀个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使⽤静态(static)内存,存储于静态内存中的变量在程序的整个执行过程⼀直保留他们的值。
4. 终止程序。正常终止main函数;也有可能是意外终止。


如果有所收获可以留下点赞和关注,谢谢你的观看!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/614996.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VRRP(虚拟路由冗余协议)详解

VRRP-------虚拟路由冗余协议 在一个网络中&#xff0c;要做为一个合格的网络首先就要具备几种冗余&#xff0c;增加网络的可靠性。 这几种冗余分别为&#xff1a;线路冗余&#xff0c;设备冗余&#xff0c;网关冗余&#xff0c;UPS冗余 VRRP该协议就是解决网关冗余的。在二层…

Rust跨平台编译

❝ 如果你感觉自己被困住了&#xff0c;焦虑并充满消极情绪&#xff0c;生命出现了停滞&#xff0c;那么治疗方法很简单&#xff1a;「做点什么」。 ❞ 大家好&#xff0c;我是「柒八九」。一个「专注于前端开发技术/Rust及AI应用知识分享」的Coder 前言 之前我们不是写了一篇R…

【数据结构】04串

串 1. 定义2. 串的比较3. 串的存储结构4. 具体实现5. 模式匹配5.1 常规思路实现5.2 KMP模式匹配算法5.2.1 next数组计算5.2.1 代码计算next数组5.2.2 KMP算法实现 1. 定义 串(string)是由零个或多个字符组成的有限序列&#xff0c;又叫字符串。 一般记为s a 1 , a 2 , . . . ,…

构建智能连接的未来:物联网平台系统架构解析

随着科技的不断进步和互联网的普及&#xff0c;物联网&#xff08;Internet of Things, IoT&#xff09;已成为连接世界的新方式。物联网平台作为实现物联网应用的核心基础设施&#xff0c;其系统架构的设计和实施至关重要。本文将深入探讨物联网平台系统架构的关键要素和最佳实…

WebStorm

设置 打开的文件快速定位到左侧指定目录的结构位置 调出终端控制台 Alt F1 ESlint格式化代码 插件

MATLAB Simulink仿真搭建及代码生成技术—01自定义新建模型模板

MATLAB Simulink仿真搭建及代码生成技术 目录 01-自定义新建模型模板点击运行&#xff1a;显示效果&#xff1a;查看模型设置&#xff1a; 01-自定义新建模型模板 新建模型代码如下&#xff1a; function new_model(modelname) %建立一个名为SmartAss的新的模型并打开 open_…

sysbench MySQL性能测试

目录 1. QPS&&TPS 1.1 数据库启动到现在的运行时间(秒) 1.2 查询量 1.3 status命令直接显示出QPS 1.4 每秒输出数据库状态(累加) 2. sysbench 测试工具 3. OLTP MySQL测试 3.1 普通参数 3.2 支持的lua脚本 3.3 脚本参数 3.4 测试数据准备 3.5 进行测试 3.…

AndroidAutomotive模块介绍(三)CarService服务

前言 上一篇文档总结 Android Automotive 框架的 APP 和 API 部分内容&#xff0c;本篇文档将会继续根据 Android Automotive 框架结构&#xff0c;总结 Framework 层 CarService 服务的内容。 本文档对 Android Automotive Framework 层服务将会按照如下顺序展开描述&#x…

组合导航的结果分段跳变问题

1 现象 用上海代数律动公司的AlgoT1-3组合导航设备采集数据进行组合导航算法调试&#xff0c;AlgoT1-3机器输出的结果很好很平滑&#xff0c;AlgoT1-3是带GNSS/INS的组合导航设备&#xff0c;另外还有一款更贵一点的带视觉的组合导航AlgoT1&#xff0c;效果会更好一些&#xf…

【报错】TypeError: Cannot read property ‘meta‘ of undefined

&#x1f608;解决思路 首先这里很明显我们能看到是缺少该参数&#xff1a;meta。 但是经过查找后发现和该参数无关。 &#x1f608;解决方法 后来我上网搜了下&#xff0c;网上的回答大部分偏向于是package.json这个文件中的tabBar.list数组对象只有一条的问题。 网上的大…

你会写SAP技术规格说明书(Specification)吗

有些小伙伴可能还在发愁技术规则说明书应该写什么&#xff0c;做了张思维导图&#xff0c;包含了所有RICEFW。 R - Report - 报表 I - Interface - 接口 C - Conversion - 数据转换 E - Enhancement - 增强 F - Form - 表单 W - Workflow - 工作流

数组算法——查询位置

需求 思路 使用二分查找找到第一个值&#xff0c;以第一个值作为界限&#xff0c;分为左右两个区间在左右两个区间分别使用二分查找找左边的7,&#xff1a;找到中间位置的7之后&#xff0c;将中间位置的7作为结束位置&#xff0c;依次循环查找&#xff0c;知道start>end,返回…