Rust

2025年07月29日更新 7 人订阅
原价: ¥ 6 限时优惠
专栏简介 Rust编程语言之错误处理 Rust 语言之 flod Rust编程语言之Cargo、Crates.io详解 Rust编程语言之枚举与模式匹配 Rust语言 - 接口设计的建议之受约束(Constrained) Rust编程语言之无畏并发 Rust语言 - 接口设计的建议之灵活(flexible) Rust语言 - 接口设计的建议之显而易见(Obvious) Rust语言 - 接口设计的建议之不意外(unsurprising) Rust 实战:构建实用的 CLI 工具 HTTPie Rust编程语言学习之高级特性 Rust内存管理揭秘:深度剖析指针与智能指针 解决Rust中数组和切片的编译时大小问题 《Rust编程之道》学习笔记一 Rust Async 异步编程 简易教程 使用 Async Rust 构建简单的 P2P 节点 Rust编程语言入门之模式匹配 Rust async 编程 Rust编程语言之编写自动化测试 Rust编程语言之函数式语言特性:迭代器和闭包 《Rust编程之道》学习笔记二 Rust Tips 比较数值 使用 Rust 开发一个微型游戏 Rust编程初探:深入理解Struct结构体 深入理解Rust中的内存管理:栈、堆与静态内存详解 深入理解 Rust 结构体:经典结构体、元组结构体和单元结构体的实现 深入掌握 Rust 结构体:从模板到实例化的完整指南 深入理解Rust中的结构体:逻辑与数据结合的实战示例 深入理解 Rust 枚举:从基础到实践 掌握Rust字符串的精髓:String与&str的最佳实践 全面解析 Rust 模块系统:实战案例与应用技巧 Rust 中的 HashMap 实战指南:理解与优化技巧 掌握Rust模式匹配:从基础语法到实际应用 Rust 中的面向对象编程:特性与实现指南 深入理解 Rust 的 Pin 和 Unpin:理论与实践解析 Rust Trait 与 Go Interface:从设计到实战的深度对比 从零开始:用 Rust 和 Axum 打造高效 Web 应用 Rust 错误处理详解:掌握 anyhow、thiserror 和 snafu Rust 如何优雅实现冒泡排序 链表倒数 K 节点怎么删?Python/Go/Rust 实战 用 Rust 玩转数据存储:JSON 文件持久化实战 Rust实战:打造高效字符串分割函数 如何高效学习一门技术:从知到行的飞轮效应 Rust 编程入门:Struct 让代码更优雅 Rust 编程:零基础入门高性能开发 用 Rust 写个猜数游戏,编程小白也能上手! Rust 入门教程:变量到数据类型,轻松掌握! 深入浅出 Rust:函数、控制流与所有权核心特性解析 从零开始:用 Rust 和 Axum 打造高效 Web 服务 Rust 集合类型解析:Vector、String、HashMap 深入浅出Rust:泛型、Trait与生命周期的硬核指南 Rust实战:博物馆门票限流系统设计与实现 用 Rust 打造高性能图片处理服务器:从零开始实现类似 Thumbor 的功能 Rust 编程入门实战:从零开始抓取网页并转换为 Markdown 深入浅出 Rust:高效处理二进制数据的 Bytes 与 BytesMut 实战 Rust智能指针:解锁内存管理的进阶之道 用 Rust 打造命令行利器:从零到一实现 mini-grep 解锁Rust代码组织:轻松掌握Package、Crate与Module Rust 所有权:从内存管理到生产力释放 深入解析 Rust 的面向对象编程:特性、实现与设计模式 Rust + Protobuf:从零打造高效键值存储项目 bacon 点燃 Rust:比 cargo-watch 更爽的开发体验 用 Rust 打造微型游戏:从零开始的 Flappy Dragon 开发之旅 函数式编程的Rust之旅:闭包与迭代器的深入解析与实践 探索Rust编程之道:从设计哲学到内存安全的学习笔记 精读《Rust编程之道》:吃透语言精要,彻底搞懂所有权与借用 Rust 避坑指南:搞定数值比较,别再让 0.1 + 0.2 != 0.3 困扰你! 告别 Vec!掌握 Rust bytes 库,解锁零拷贝的真正威力 告别竞态条件:基于 Axum 和 Serde 的 Rust 并发状态管理最佳实践 Rust 异步编程实践:从 Tokio 基础到阻塞任务处理模式 Rust 网络编程实战:用 Tokio 手写一个迷你 TCP 反向代理 (minginx) 保姆级教程:Zsh + Oh My Zsh 终极配置,让你的 Ubuntu 终端效率倍增 不止于后端:Rust 在 Web 开发中的崛起之路 (2024数据解读) Rust核心利器:枚举(Enum)与模式匹配(Match),告别空指针,写出优雅健壮的代码 Rust 错误处理终极指南:从 panic! 到 Result 的优雅之道 想用 Rust 开发游戏?这份超详细的入门教程请收好! 用 Rust 实现 HTTPie:一个现代 CLI 工具的构建过程 Rust 异步实战:从0到1,用 Tokio 打造一个高性能并发聊天室 深入 Rust 核心:彻底搞懂指针、引用与智能指针 Rust 生产级后端实战:用 Axum + sqlx 打造高性能短链接服务 深入 Rust 内存模型:栈、堆、所有权与底层原理 Rust 核心概念解析:引用、借用与内部可变性 掌握 Rust 核心:生命周期与借用检查全解析 Rust 内存布局深度解析:从对齐、填充到 repr 属性 Rust Trait 分派机制:静态与动态的抉择与权衡

Rust 内存布局深度解析:从对齐、填充到 repr 属性

Rust内存布局深度解析:从对齐、填充到repr属性Rust以其内存安全和高性能而著称,但要真正发挥其潜力、编写出极致高效且能与其他语言无缝交互的代码,理解其底层的内存模型至关重要。一个值在内存中如何表示?为什么struct的内存占用可能比其所有字段大小之和还大?我们又该如何精确控制类型的

Rust 内存布局深度解析:从对齐、填充到 repr 属性

Rust 以其内存安全和高性能而著称,但要真正发挥其潜力、编写出极致高效且能与其他语言无缝交互的代码,理解其底层的内存模型至关重要。一个值在内存中如何表示?为什么struct的内存占用可能比其所有字段大小之和还大?我们又该如何精确控制类型的内存布局以实现特定目标?

本文旨在深度剖析Rust中的类型内存表示机制。我们将从最基本的内存对齐(Alignment)和填充(Padding)规则出发,详细探讨Rust如何通过repr属性——如repr(C)、repr(Rust)、repr(packed)等——为开发者提供控制内存布局的强大能力,并最终揭示动态大小类型(DST)和宽指针背后的内存秘密。

内存中的类型

内存中的类型

  • 每个 Rust 值都有类型:
    • 一个基本职责:告诉你如何解释内存中的 bits
    • 例如:0b10111101 这串 bit 本身不代表什么
    • 按 u8 类型解释:数字 189
    • 按 i8 类型解释:数字 -67
  • 当自定义类型时:编译器决定该类型的各部分在内存表示中的位置

对齐(Alignment)

  • 对齐(Alignment):决定了类型的字节可以被存在哪
  • 实际上,计算机硬件对给定的类型可以存放的位置是有约束的
    • 例如:指针指向字节(bytes)而不是位(bits)
    • 如果将某类型T 的值放在计算机内存中的索引为 4 的位(bit)上,那就无法引用它的地址。你只能创建一个指针指向 byte 0 或者 byte 1
  • 所有的值(无论什么类型),都必须开始于 byte 的边界
    • 必须至少是字节对齐(byte-aligned)
    • 存放的地址必须是 8 bits 的倍数

更严格的对齐规则

  • 一些类型的对齐规则比字节对齐还严格:
    • 在 CPU 和内存系统里,内存经常按大于单个 byte 的块进行访问
    • 例如:在64位CPU上,大部分的值是按 8 bytes 的块进行访问的,每个操作都开始于 “8 bytes 对齐” 的地址上。(这也叫做 CPU 的字长,word size)
    • CPU 有办法处理更小值的读写,以及跨域边界的值
  • 应该尽可能的保证硬件可以操作于它的“原生(native)”对齐
    • 例如:想读取的 i64 的值开始于 8 bytes 块的中间...

没对齐的操作

  • 对数据进行没对齐操作叫做 “misaligned access":
    • 可导致 性能低 和 并发问题
  • 很多 CPU 操作多要求或强烈建议:它们的参数是自然对齐的(naturally aligned)
  • 自然对齐的值:对齐匹配值的大小
    • 例如:加载 8 bytes,那么提供的地址就需要 8 bytes 对齐

编译器会尽可能利用对齐

  • 基于类型包含的内容,编译器通过计算,为类型分配一个对齐(安排它如何对齐)
  • 内置值,通常对齐到他们的大小
    • u8 - byte 对齐;u16 - 2 bytes 对齐;u32 - 4 bytes 对齐; u64 - 8 bytes 对齐
  • 复杂类型(包含其它类型的类似),通常被赋予所含类型的最大对齐:
    • 例:某类型含有 u8、u16、u32,那么该类型就应该是 4 bytes 对齐

布局(Layout)

  • 类型的布局(Layout):(编译器如何决定)类型的内存中表示
  • Rust 编译器对于类型如何布局,并没有给出多少保证
  • Rust 提供了 repr 属性(attribute):
    • 可以添加到你类型的定义上,来请求特定内存表示

repr(C)

  • 最常见的一个是 repr(C):布局方式与 C、C++ 编译器对同类型的布局兼容
    • 对于使用 FFI 与其它语言交互的 Rust 代码很有用
    • Rust 会生成一个匹配其他语言编译器期望的布局
  • 因为 C 布局可预测、不易改变
    • 在 unsafe 上下文中有用:
    • 使用指向该类型的原始指针
    • 在两个具有相同字段的类型间进行转换

repr(transparent)

  • repr(transparent):仅能用于只含有单个字段的类型,它保证了外层类型的布局与内层类型一样
    • 这与 ”newtype“ 模式结合很好用
    • 例如:你想操作于 struct A 和 struct New(A) 内存表示,就如同他们是一样的
    • newtype 模式:在 tuple struct 里创建一个新的类型,只有一个字段,针对某型的薄封装

例子

代码 字段类型的大小 默认内存表示 填充 最终对齐
#[repr(C)]
struct Foo {
tiny: bool, 1 bit 1 byte 对齐 3 bytes 4bytes
normal: u32, 4 bytes 4 bytes 对齐 4 bytes 与上共 8 bytes
small: u8, 1 byte 1 byte 对齐 7 bytes 8 bytes
long: u64, 8 bytes 8 bytes 对齐 8 bytes
short: u16, 2 bytes 2 bytes 对齐 6 bytes 8 bytes
} 一共 32 bytes

repr(Rust)

  • C 表示的限制:需要将所有字段按原 struct 定义的顺序放置
  • repr(Rust) 去掉了该限制以及其它几个较小的限制:
    • 对恰好具有相同字段的类型的确定性字段排序
    • 两个不同类型的字段相同,字段类型也相同,定义顺序也一样
    • 在 Rust里,如果使用 repr(Rust),就不能保证这两种类型的布局是一样的
  • repr(Rust) 允许重新对字段排序:
    • 可按大小递减的顺序排列(对于 Foo 例子来说就不需要填充了)
  • 对布局的保证少了,编译器有余地进行重新安排,产生高效代码

例子

代码 字段类型的大小 默认内存表示 填充 最终对齐
#[repr(C)]
struct Foo {
long: u64, 8 bytes 8 bytes 对齐 8 bytes
normal: u32, 4 bytes 4 bytes 对齐
short: u16, 2 bytes 2 bytes 对齐
small: u8, 1 byte 1 byte 对齐
tiny: bool, 1 bit 1 byte 对齐 以上3个字段一共 8 bytes
} 一共 16 bytes

无填充布局

  • 可以告诉编译器字段之间无需任何填充:
    • 承担不对齐访问的性能损失
    • 使用场景举例:
    • 内存有限,类型实例较多
    • 通常低带宽网络连接发送内存表示
  • 启用该功能:在你类型上添加 #[repr(packed)] 注解
  • 注意:
    • 可能会导致代码运行速度慢;
    • 极端情况下,如果 CPU 仅支持对齐操作,可导致程序崩溃

给特定字段或类型更大的对齐

  • 使用 #[repr(align(n))]
    • 例如:保证在内存中连续(相邻)存储(就像数组)的不同值最终位于 CPU 上不同的缓存行上,就可以避免伪共享(false sharing)
    • 缓存是由缓存行组成的,缓存都是以缓存行作为一个单位来处理的;缓存行(cache line)是可以映射到缓存中的最小数据部分
    • 伪共享(false sharing):两个不同的 CPU 访问共享同一个缓存行的不同变量时,就发生了伪共享。理论上它们可以并行操作,但最终它们都争相更新缓存中的同一个条目。它可导致并发类程序中的巨大性能降级。

复杂类型的内存表示

  • 元组(Tuple):就像 struct,其字段类型与元组元素类型按顺序相同
  • 数组:所包含类型的连续序列,元素间没有填充
  • Union:对于每个变体来说,其布局的选择是独立的;对齐就是所有变体里最大的那个。
  • 枚举:和 Union 一样,额外有一个隐藏的共享字段,用于存储枚举变体的鉴别符
    • 代码用鉴别符的值来判定给定值所含的是哪个变体
    • 鉴别符的大小取决于变体的数量

动态大小的类型和宽指针

  • Rust中大多数类型自动实现了 Sized:
    • 它的大小在编译时就已知了
  • 两个常见的类型除外:Trait 对象、切片(slice)
    • 例如:dyn Iterator、[u8]等(DST:dynamically sized types)的大小在运行时才能确定
  • 问题:通常编译器需要知道东西的大小来产生合理的代码:
    • 例如为 tuple 分配多大空间,或者访问第四个元素时需要多少偏移量
    • 如果类型不是 Sized,上述信息就无法获得

编译器需要 Sized 类型

  • 几乎在所有地方,编译器都需要 Sized 类型:
    • struct 字段、函数参数、返回值、变量、数组类型都必须 Sized
    • 自定义的 Type Bound 自动包含 T: Sized,除非你写明 T:?Sized
  • 但例如当函数需要接收 DST(例如:trait 对象、切片 等)作为参数时怎么办?
    • 可以使用宽指针(wide pointer 或叫 fat pointer)

宽指针(Wide Pointer)

  • 通过将非 Sized 类型放在宽指针后边,就可弥补 Sized 和非 Sized 类型 间的差距
  • 宽指针:
    • 就是普通指针
    • 附加了一个”字大小(word-sized)“的字段
    • 它可以提供给编译器所需要的关于指针的额外信息:生产使用该指针的合理代码
  • 当引用 DST 时,编译器自动为你组建一个宽指针
  • 例如:
    • 切片 slice,它的附加信息就是切片的长度
    • Trait 对象,以后再说
  • 宽指针是 Sized:是usize 的两倍大小
    • usize 就是所在目标平台上一个字(word)的大小
    • 一个 usize 持有指针
    • 另外的 usize 持有附件信息,用于“完善”该类型
  • 备注:Box 和 Arc 都支持存储宽指针,所以它们都支持 T:?Sized

总结

通过本文的探讨,我们深入了解了Rust如何将抽象的类型映射到具体的内存位(bits)上。我们明白了内存对齐不仅是编译器的要求,更是CPU高效工作的物理基础;而填充则是为了满足对齐要求所做的必要补充。

核心要点在于,Rust通过repr属性系列,赋予了开发者在“让编译器优化”和“由我精确掌控”之间做选择的权力:

  • 默认的repr(Rust)给予编译器最大的优化自由,以获得最佳性能。
  • repr(C)则提供了与C语言兼容的、可预测的稳定布局,是FFI(外部函数接口)的基石。
  • repr(packed)和repr(align(n))则是在空间与性能之间进行极致权衡的高级工具。

最后,对动态大小类型(DST)和宽指针的理解,揭示了Rust如何在编译时大小未知的情况下,依然能安全、高效地处理切片和Trait对象。掌握这些内存布局的知识,是每一位希望编写高性能、高可靠性系统,或从事底层与unsafe代码开发的Rust工程师的必经之路。

参考

点赞 0
收藏 0
分享
本文参与登链社区写作激励计划 ,好文好收益,欢迎正在阅读的你也加入。

0 条评论

请先 登录 后评论