环境
- Time 2022-11-12
- WSL-Ubuntu 22.04
- QEMU 6.2.0
- NASM 2.15.05
前言
说明
参考:https://os.phil-opp.com/entering-longmode
目标
如果要进入长模式,则必须要进行分页。在 64 位系统中,采用 4 级分页。
关于分页的信息,需要找其它的资料另外了解,这里不做详细介绍。
介绍
一共四级分页,原文中将其称为 P4,P3,P2,P1,这里也直接使用这种方式。
最初出发点为 CR3 寄存器,然后到 P4,直到 P1,最后是页偏移。
一个页表包含 512 项,每一项 8 个字节,一共 4K。
地址中的 48-63 必须满足和第 47 位一致,才是合法的地址。
具体的对应如下图:
低地址位的状态
因为至少是 4K 分页,所以低 12 位默认都是 0,可以用它们来表示一些额外的信息。
Bit(s) | Name | Meaning |
---|---|---|
0 | present | the page is currently in memory |
1 | writable | it’s allowed to write to this page |
2 | user accessible | if not set, only kernel mode code can access this page |
3 | write through caching | writes go directly to memory |
4 | disable cache | no cache is used for this page |
5 | accessed | the CPU sets this bit when this page is used |
6 | dirty | the CPU sets this bit when a write to this page occurs |
7 | huge page/null | must be 0 in P1 and P4, creates a 1GiB page in P3, creates a 2MiB page in P2 |
8 | global | page isn’t flushed from caches on address space switch (PGE bit of CR4 register must be set) |
9-11 | available | can be used freely by the OS |
52-62 | available | can be used freely by the OS |
63 | no execute | forbid executing code on this page (the NXE bit in the EFER register must be set) |
巨型页
除了可以使用 4K 分页,也可以使用 1G 或者 2M 分页。
为了保证从保护模式的虚拟地址到分页的正确映射,下面使用了 2M 分页。
section .bss
align 4096
p4_table:resb 4096
p3_table:resb 4096
p2_table:resb 4096
分页首先需要 4K 对其,然后建立了 P4,P3,P2 三个页表。
关联多级分页
; 将 P4 的第一个地址设置成 P3 的起始地址
mov eax, p3_table
or eax, 0b11 ; 二进制数,表示当前页存在,并且可写
mov [p4_table], eax; 将 P3 的第一个地址设置成 P2 的起始地址
mov eax, p2_table
or eax, 0b11 ; 二进制数,表示当前页存在,并且可写
mov [p3_table], eax
初始化巨型页
mov ecx, 0 ; 循环的计数器
.map_p2_table:; 使用 EAX 初始化 P2 的每一项,并且映射到物理地址最低的 1G 空间mov eax, 0x200000 ; 2MiBmul ecx ; 每一项对应的物理地址 EAX * counteror eax, 0b10000011 ; 存在,可写,巨型页mov [p2_table + ecx * 8], eax ; 将地址记录到 P2 的每一项inc ecx ; 计数器加 1cmp ecx, 512 ; 是否存满,最大 512 项jne .map_p2_table ; 不相等继续下次循环ret
开启分页
如果要开启分页,需要完成以下几步:
- 将 P4 的起始地址存放到 CR3,因为分页从 CR3 开始找。
- 启用物理地址扩展(PAE)。
- 扩展特性启用寄存器(Extended Feature Enable Register)需要设置长模式。
- 启用分页,由 CR0 的最高位控制。
enable_paging:; 将 CR3 寄存器指向 P4 的起始地址mov eax, p4_tablemov cr3, eax; 在 CR4 中启用物理地址扩展(Physical Address Extension),第五位mov eax, cr4or eax, 1 << 5mov cr4, eax; 将 EFER MSR(model specific register)寄存器中的第八位设置成长模式mov ecx, 0xC0000080rdmsror eax, 1 << 8wrmsr; 将 CR0 的最高位分页开启位设置成 1mov eax, cr0or eax, 1 << 31mov cr0, eaxret
总结
在保护模式下,开启了四级分页。
附录
源码
section .multiboot_header
header_start:dd 0x1BADB002 ; 魔法数字,固定值dd 0dd -0x1BADB002 ; 定义的这三个数字相加需要等于0
header_end:global start
section .text
bits 32
start:; 栈是否高地址往低地址增长mov esp, stack_topcall check_cpuidcall check_long_modecall set_up_page_tablescall enable_paging; print `OK` to screenmov dword [0xb8000], 0x2f4b2f4fhltcheck_cpuid:; 检查 CPUID 是否支持可以通过翻转 ID 位,即第 21 位。; 如果在 FLAGS 标志寄存器中,我们能够翻转它,CPUID 就是可用的。; 通过栈拷贝 FLAGS 寄存器的值到 EAX 寄存器pushfdpop eax; 将 EAX 的值拷贝到 ECX,后面要用mov ecx, eax; 翻转第 21 位xor eax, 1 << 21; 把 EAX 的值拷贝回 FLAGS 寄存器push eaxpopfd; 拷贝 FLAGS 寄存器的值回 EAX 寄存器,检查是否翻转成功,成功翻转则支持 CPUIDpushfdpop eax; 通过 ECX 还原 EFLAGS 中的值push ecxpopfd; 比较,如果两个一样,则翻转不成功,不支持CPUID;如果翻转成功,则支持CPUIDcmp eax, ecxje .no_cpuidret
.no_cpuid:mov al, "1"jmp errorcheck_long_mode:; 检查是否有扩展的处理器信息可用mov eax, 0x80000000 ; CPUID 的隐式参数cpuid ; 获取最高支持的参数cmp eax, 0x80000001 ; 如果支持长模式,至少是 0x80000001jb .no_long_mode ; 如果小于,则不支持长模式; 使用扩展信息验证是否支持长模式mov eax, 0x80000001 ; 扩展处理器参数信息cpuid ; 将各种特征标记位返回到 ECX 和 EDXtest edx, 1 << 29 ; 第 29 位是 long mode 长模式标记位,检查是否支持jz .no_long_mode ; 如果为 0,表示不支持长模式ret
.no_long_mode:mov al, "2"jmp errorset_up_page_tables:; 将 P4 的第一个地址设置成 P3 的起始地址mov eax, p3_tableor eax, 0b11 ; 二进制数,表示当前页存在,并且可写mov [p4_table], eax; 将 P3 的第一个地址设置成 P2 的起始地址mov eax, p2_tableor eax, 0b11 ; 二进制数,表示当前页存在,并且可写mov [p3_table], eax; 将 P2 设置成 2M 的巨型页mov ecx, 0 ; 循环的计数器
.map_p2_table:; 使用 EAX 初始化 P2 的每一项,并且映射到物理地址最低的 1G 空间mov eax, 0x200000 ; 2MiBmul ecx ; 每一项对应的物理地址 EAX * counteror eax, 0b10000011 ; 存在,可写,巨型页mov [p2_table + ecx * 8], eax ; 将地址记录到 P2 的每一项inc ecx ; 计数器加 1cmp ecx, 512 ; 是否存满,最大 512 项jne .map_p2_table ; 不相等继续下次循环retenable_paging:; 将 CR3 寄存器指向 P4 的起始地址mov eax, p4_tablemov cr3, eax; 在 CR4 中启用物理地址扩展(Physical Address Extension),第五位mov eax, cr4or eax, 1 << 5mov cr4, eax; 将 EFER MSR(model specific register)寄存器中的第八位设置成长模式mov ecx, 0xC0000080rdmsror eax, 1 << 8wrmsr; 将 CR0 的最高位分页开启位设置成 1mov eax, cr0or eax, 1 << 31mov cr0, eaxret; 打印 `ERR: ` 和一个错误代码并停住。
; 错误代码在 al 寄存器中
error:mov dword [0xb8000], 0x4f524f45mov dword [0xb8004], 0x4f3a4f52mov dword [0xb8008], 0x4f204f20mov byte [0xb800a], alhltsection .bss
align 4096
p4_table:resb 4096
p3_table:resb 4096
p2_table:resb 4096
stack_bottom:resb 64
stack_top: