深入理解C语言的helloworld

嵌入式ARM 2023-03-13 10:00

一、引

在学习C语言或者其他编程语言的时候,我们编写的一个程序代码,基本都是在屏幕上打印出 hello world ,开始步入编程世(深)界(坑)的。C 语言版本的 hello world 代码:

#include 

int main()
{
    printf("hello world\n");
    return 0;
}

不用多说,这段程序在运行时,会在显示终端上打印出 hello world

那么,这段程序背后关联的内容,你是否真正梳理明白了呢?

  • 源程序代码是如何编译成可执行程序的?

  • #include

    的作用是什么?
  • hello world 程序是怎样运行起来的?

  • printf 是怎样将字符串 "hello world" 输出到终端的?

  • hello world 程序在运行时,它在内存中是什么样子的?

  • 程序的执行入口为什么是 main 函数?

  • 可执行文件的内部结构是怎么样的?

闲话少说,让我们进入正题,扒一扒 hello world 背后的内幕。

注:本文是在 Ubuntu 环境下对程序的编译和运行进行实验,相关内容以 Linux 系统为主。

二、程序编译

在 Linux 系统或者其他环境下,将源码编程成可执行程序,很简单。点击编译按钮或者输入编译指令即可完成。例如,在 Linux 下,用 gcc 编译此程序代码,然后运行:

$ gcc hello.c -o hello
$ ./hello

hello world

但是,你知道编译器干了哪些工作吗?编译器将源代码文件编程成可执行程序,经历了四步:编译预处理、编译、汇编、链接。

1、编译预处理

编译预处理过程主要是处理源代码文件中,以 “#” 开头的预编译指令。例如,“#inlude”、“#define”等。

预处理器根据以字符 “#” 开头的指令,修改原始的 C 程序文件,生成一个以 .i 为扩展名的程序文件。

本例中,#include 命令告诉预处理器,读取系统头文件 stdio.h 的内容,并把它插入到源程序文本中。

在 Linux 环境下,可以通过如下指令得到预处理完成后的 .i 文件

$ gcc -E hello.c -o hello.i

这个文件内容比较长,如果有兴趣的话可以自己进行实验,查看一下。

2、编译

编译的过程就是把预处理完的文件,进行一系列的词法分析、语法分析、语义分析以及优化后,生成相应的汇编代码文件。这个过程往往是整个程序构建的核心部分。

将 hello.i 文件翻译成文本文件 hello.s,其内部是一个汇编语言的程序。

通过如下指令可以得到汇编文件

$ gcc -S hello.i -o hello.s

3、汇编

汇编器将上一步生成的汇编代码翻译成机器可以执行的指令,把这些指令打包成可重定位目标程序,保存在目标文件 hello.o 中。

可以通过下边的指令生成:

$ gcc -c hello.s -o hello.o

文件 hello.o 是一个二进制文件。

4、链接

hello 程序调用了 printf 函数,这是 标准 C 库中的一个函数。printf 函数存储在一个预编译好的目标文件 printf.o 中,链接器负责将这个文件以某种方式合并到 hello.o 程序中。

合并处理后,得到一个可执行目标文件 hello,这个可执行文件可以由系统加载运行。

三、程序运行

hello.c 程序已经被编译可执行的目标文件 hello,且存在磁盘上。那这个程序是如何运行起来的呢?

当然,你可以说,通过如下指令可以运行程序:

$ ./hello

hello world

但是,从计算机角度来说,运行这个程序需要做哪些工作呢?

当输入 “./hello” 后,shell 开始处理这条指令。

首先,shell 加载可执行文件 hello,复制目标文件 hello 中的代码和数据到内存中。

数据和指令加载完成后,处理器开始执行 hello 程序中 main 函数的机器指令。这些指令将 “hello world” 字符串中的字节复制到寄存器文件,再从寄存器文件中复制显示设备上,最终在屏幕上显示出来。

其实,操作系统在加载程序后,还做了一些工作,用于准备 main 函数执行需要的环境,然后调用 main 函数。

四、可执行程序文件

在 Linux 下,可执行文件的存储格式为 ELF(Executable Linkable Format)。那么其内部结构是什么样的呢?

典型的 ELF 可执行文件的布局情况如下:

ELF 头部描述了整个文件的属性,包括,文件是否可执行、目标硬件、目标操作系统、入口点等信息。

.init 定义了一个小函数,叫做 _init,程序的初始化代码会调用它。

.text 为已编译程序的机器代码。.rodata 为只读数据,比如 printf 语句中格式串。.data 为已初始化的全局和静态 C 变量。

.bss 存放未初始化的全局变量和局部静态变量,以及所有被初始化为 0 的全局或静态变量。不占用实际的空间,只是一个占位符。

.symtab 是一个符号表,存放在程序中定义和引用的函数和全局变量的信息。

.debug 一个调试符号表,内部是程序定义的局部变量和类型定义,程序定义和引用的全局变量,以及原始的 C 源文件。

.line 源程序中的行号和 .text 节中机器指令之间的映射。

.strtab 一个字符串表,内容包括 .symtab  和 .debug 节中的符号表,以及节头部中的节名字。

总体来说,将程序源码编译之后生成的目标文件,主要分成两种段:程序指令和程序数据。代码段属于程序指令,数据段和 .bss 段属于程序数据。

五、加载可执行程序

可执行程序被加载器加载到内存,即从磁盘内复制可执行文件中的代码和数据到内存中,然后跳转到程序的入口点来运行该程序。将程序复制到内存并运行的过程就叫做加载

在 Linux 系统中,每个程序都有一个运行时的内存映像。

代码段后边是数段,运行时,堆在数据段之后,通过调用 malloc 库向上增长。

用户栈总是从最大的合法用户地址开始,向较小内存地址增长。

用户栈以上的区域,是为内核中的代码和数据保留的。

程序加载运行时,会创建类似上图所示的内存映像,在程序头部的引导下,加载器将可执行文件复制到代码段和数据段,然后加载器跳转到程序的入口点。

入口点的函数调用启动函数,初始化执行环境,然后调用用户层的 main 函数,处理 main 函数的返回值,并在需要的时候把控制权返回给内核。

main 函数为作为用户可执行程序的入口,是由系统启动函数内部定义的。在环境准备好后,调用 main 函数,开始执行用户程序。

六、总结

没想到,这么简单的程序背后,涉及到这么多知识内容。

  • 源码文件编译成可执行文件具体过程。

  • 可执行目标程序加载和执行的详细过程。

  • 可执行目标文件内部结构布局。

  • 目标文件加载到内存后的布局情况。


END

来源:一起学嵌入式

版权归原作者所有,如有侵权,请联系删除。

推荐阅读
世界上最完美的两个软件,太厉害了!
让嵌入式工程师欲罢不能的10个小网站
STM32很难学吗?这些工具可以帮大忙!

→点关注,不迷路←

嵌入式ARM 关注这个时代最火的嵌入式ARM,你想知道的都在这里。
评论
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 556浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 204浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 166浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 108浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 173浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 85浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 71浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 188浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 81浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 211浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 126浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 181浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦