深入解析Rust中的智能指针

2025-10-27 09:32:47 作者：alwaysrun

本文介绍了Rust中的智能指针,Box、Rc、Arc、RefCell、Mutex、RwLock对应的功能、场景与常用方法,并提供了组合使用方式,以及Cow、Pin的使用方式,感兴趣的朋友跟随小编一起看看吧

Rust 中，智能指针是管理堆内存的核心工具，它们通过封装指针并添加额外功能（如所有权管理、引用计数等）来提供更安全的内存管理。

智能指针

智能指针本质是 “拥有数据所有权的结构体”，通过实现以下两个关键 trait 模拟指针行为：

Deref trait：允许智能指针像普通引用一样被解引用（如*ptr），简化使用。
Drop trait：定义智能指针离开作用域时的 “清理逻辑”（如释放堆内存、减少引用计数），实现自动内存管理。

常见的智能指针：

智能指针	特点	所有权规则
`Box<T>`	将数据分配在堆上	独占所有权（不可复制）
`Rc<T>`	引用计数共享	多个所有者共享数据，只读，单线程共享
`Arc<T>`	原子引用计数	多线程共享、线程安全
`RefCell<T>`	内部可变性	运行时借用检查，单线程中可变共享
`Mutex<T>`	互斥锁封装	多线程中安全的可变共享
`RwLock<T>`	读写锁封装	多读单写共享

Box

Box<T>（“盒子”）是最基础的智能指针，用于将数据存储在堆上，而Box自身（指针）存储在栈上:

独占所有权：一个Box拥有堆数据的唯一所有权，转移Box会转移所有权。
自动释放：当Box离开作用域时，会调用Drop释放堆上的数据。

使用场景：

编译时大小不确定的类型（如递归类型）
转移大量数据时避免栈复制（直接转移Box指针，而非堆数据）
实现 trait 对象（dyn Trait），如集合中存储多种类型数据时

#[derive(Debug)]
enum MyList {
    Cons(i32, Box<MyList>), // 必须为Box，此处为递归，大小不确定
    Nil,
}
use MyList::{Cons, Nil};
let list = Cons(1, Box::new(Cons(2, Box::new(Nil))));
println!("Recursive list: {:?}", list);

常用方法

方法	说明
`Box::new(value)`	创建一个堆上分配的对象
`*box`	解引用，访问内部值
`Box::leak(box)`	将 Box 转为 `'static` 引用（泄露内存）
`Box::into_raw(box)`	转为裸指针（不再自动释放）
`Box::from_raw(ptr)`	从裸指针恢复（恢复自动释放）

作为trait对象：

// 定义trait
trait Shape {
    fn area(&self) -> f64;
}
// 实现trait的结构体
struct Circle { radius: f64 }
impl Shape for Circle {
    fn area(&self) -> f64 { std::f64::consts::PI * self.radius.powf(2.0) }
}
struct Square { side: f64 }
impl Shape for Square {
    fn area(&self) -> f64 { self.side.powf(2.0) }
}
fn main() {
    // 用Box<dyn Shape>存储不同类型的Shape实现
    let shapes: Vec<Box<dyn Shape>> = vec![
        Box::new(Circle { radius: 1.0 }),
        Box::new(Square { side: 2.0 }),
    ];
    // 动态调用area方法（运行时确定具体类型）
    for shape in shapes {
        println!("面积：{:.2}", shape.area()); 
        // 输出：3.14（圆）、4.00（正方形）
    }
}

Rc

Rc<T>（Reference Counted，引用计数）用于单线程中多个所有者共享同一份堆数据。它会在堆上维护一个 “引用计数”，当计数归零时自动释放数据。

共享所有权：通过Rc::clone(&rc)创建新引用，引用计数 +1；每个引用离开作用域时计数 -1。
单线程限制：Rc<T>的引用计数操作不是原子的，线程不安全，不能用于多线程。
只读访问：Rc<T>只能提供不可变引用（避免数据竞争）。

常用方法：

方法	说明
`Rc::new(value)`	创建一个引用计数智能指针
`Rc::clone(&rc)`	增加引用计数（轻量）
`Rc::strong_count(&rc)`	获取当前强引用计数
`Rc::weak_count(&rc)`	获取当前弱引用计数
`Rc::downgrade(&rc)`	获取弱引用（不增加强计数）

查看引用计数：

use std::rc::Rc;
fn main() {
    let a = Rc::new(String::from("hello"));
    let b = Rc::clone(&a);
    let c = Rc::clone(&a);
    println!("count = {}", Rc::strong_count(&a)); // 输出 3
    println!("{}", b);
} // 所有 Rc 离开作用域后才释放堆内存

Arc

Arc<T>（Atomic Rc）是Rc<T>的线程安全版本，其引用计数操作通过原子指令实现，可用于多线程环境。

跨线程共享：允许在多个线程中共享数据（需配合Send/Sync trait）。
原子操作：计数增减是原子的，避免多线程竞争问题（但性能略低于Rc<T>）。

常用方法：

方法	说明
`Arc::new(value)`	创建智能指针
`Arc::clone(&arc)`	增加引用计数（原子操作）
`Arc::strong_count(&arc)`	当前强引用计数
`Arc::downgrade(&arc)`	获取弱引用

多线程引用计数：

use std::sync::Arc;
use std::thread;
pub fn arc_test() {
    let data = Arc::new(100); // 堆上的数据，原子引用计数=1
    let mut handles = vec![];
    // 创建3个线程共享data
    for i in 0..3 {
        let d = Arc::clone(&data); // 计数+1（原子操作）
        handles.push(thread::spawn(move || {
            println!("i: {}", d);
        }));
    }
    println!("before ref-count: {:?}", Arc::strong_count(&data));
    for h in handles {
        h.join().unwrap();
    }
    println!("after ref-count: {:?}", Arc::strong_count(&data)); // 原子引用计数=1
}

RefCell

RefCell<T>用于编译期不满足借用规则，但运行时可安全修改数据的场景。它实现了 “内部可变性”（Interior Mutability）：允许通过不可变引用修改数据，借用规则的检查推迟到运行时（违反时触发panic）。

运行时检查：通过borrow()（不可变借用）和borrow_mut()（可变借用）获取内部数据的引用，运行时确保 “同一时间最多一个可变引用，或多个不可变引用”。
单线程限制：RefCell<T>非线程安全，不能跨线程使用。

常用方法：

方法	说明
`RefCell::new(value)`	创建一个内部可变容器
`borrow()`	不可变借用（运行时检查）
`borrow_mut()`	可变借用（运行时检查）
`.try_borrow()` / `.try_borrow_mut()`	尝试借用，返回 `Result` 避免 panic

在Rc中嵌套使用

use std::rc::Rc;
use std::cell::RefCell;
pub fn refcell_test() {
    let shared_data = Rc::new(RefCell::new(0)); // 堆上的0，可共享且修改
    let a = Rc::clone(&shared_data);
    let b = Rc::clone(&shared_data);
    *a.borrow_mut() += 10; // a修改数据
    *b.borrow_mut() += 5; // b修改数据
    println!("{}", shared_data.borrow()); // 输出15
}

Mutex

多线程并发编程的核心同步原语之一，用于在多个线程之间安全地共享和修改数据；Mutex<T> 本身不提供共享所有权，一般需要将其包裹在 Arc<T>中，在在多个线程间共享：

多线程可变共享；
确保同一时间只有一个线程访问。

常用方法：

方法	说明
`Mutex::new(value)`	创建互斥锁
`lock()`	获取锁（阻塞）
`try_lock()`	尝试获取锁（立即返回 `Result`）
`into_inner()`	取出内部值（消耗锁）

与Arc一起在多线程中使用：

use std::sync::{Arc, Mutex};
use std::thread;
fn main() {
    let counter = Arc::new(Mutex::new(0));
    let mut handles = vec![];
    for _ in 0..5 {
        let c = Arc::clone(&counter);
        handles.push(thread::spawn(move || {
            let mut num = c.lock().unwrap();
            *num += 1;
        }));
    }
    for h in handles {
        h.join().unwrap();
    }
    println!("Result: {}", *counter.lock().unwrap());
}

RwLock

允许多个线程同时读取共享数据，但写入时必须独占访问，从而在保证线程安全的同时提升并发性能。

高并发读场景；
多线程下支持多个读取者或一个写入者。
- 多个读锁可同时存在；
- 写锁独占；
- 若写锁被持有，读锁将阻塞。

常用方法：

方法	说明
`RwLock::new(value)`	创建读写锁
`read()`	获取只读锁（可同时多个）
`write()`	获取写锁（独占）
`try_read()` / `try_write()`	尝试非阻塞获取

多读少写场景：

use std::sync::RwLock;
use std::thread;
let data = RwLock::new(0);
// 启动一个写线程
let w_handle = thread::spawn(move || {
    let mut w = data.write().unwrap();
    thread::sleep(std::time::Duration::from_millis(100));
    *w = 42;
});
// 启动多个读线程
let mut r_handles = vec![];
for _ in 0..3 {
    let r_data = data.clone();
    let handle = thread::spawn(move || {
        let r = r_data.read().unwrap(); // 会被写线程阻塞，直到写完成
        println!("Read: {}", *r);
    });
    r_handles.push(handle);
}
w_handle.join().unwrap();
for h in r_handles { h.join().unwrap(); }

Weak

Weak<T>是Rc<T>/Arc<T>的弱引用，不增加强引用计数，用于打破循环引用，避免内存泄漏。

常用方法：

方法	说明
`Weak::new()`	创建空的弱引用
`Rc::downgrade(&rc)`	从`Rc<T>`创建`Weak<T>`（弱引用）
`weak.upgrade()`	将`Weak<T>`转为`Option<Rc<T>>`（强引用），若数据已释放则返回`None`
`Weak::strong_count(&weak)`	获取关联`Rc<T>`的强引用计数
`Weak::weak_count(&weak)`	获取弱引用计数

Cow写时Copy

Clone-on-Write（写时克隆）是一个枚举类型，用于在“可能需要修改借用数据”时，避免不必要的复制。

如果只读，就直接借用（零拷贝）。
如果要改，就克隆一份（拥有所有权后修改）。

定义：Cow要么借用&T，要么拥有T（T 必须实现 ToOwned）。

enum Cow<'a, B: ?Sized + 'a> where B: ToOwned {
    Borrowed(&'a B),
    Owned(<B as ToOwned>::Owned),
}

常用方法：

方法	说明
`Cow::Borrowed(&T)`	从借用创建
`Cow::Owned(T)`	从拥有值创建
`.to_mut()`	若为借用则克隆，返回可变引用
`.into_owned()`	获取拥有所有权的值（可能克隆）
`.is_borrowed()` / `.is_owned()`	判断当前状态
`.as_ref()`	获取不可变引用

写时复制示例：

use std::borrow::Cow;
fn main() {
    let s = "immutable data".to_string();
    let mut cow = Cow::Borrowed(s.as_str()); // 借用 &str
    println!("Before: {:?}", cow); // Borrowed("immutable data")
    // 调用 to_mut() 会检测当前是否为借用
    let data = cow.to_mut(); // 克隆一份（从 Borrowed -> Owned）
    data.push_str(" modified");
    println!("After: {:?}", cow);  // Owned("immutable data modified")
}

Rust 的所有权系统保证了内存安全，但默认允许将值从一个内存位置移动到另一个位置（例如赋值或函数返回时）。 Pin用于防止内存中对象被移动（pinned in place）；即可以“钉住”一个值，使它在被销毁前一直位于同一内存地址。

方法 / 操作	说明
`Pin::new(pointer)`	安全创建`Pin<P>`，要求`P`指向的类型`T`实现`Unpin`（可安全移动）。
`Pin::new_unchecked(pointer)`	不安全创建`Pin<P>`，不要求`T: Unpin`，但需开发者保证数据不会被移动（否则会导致未定义行为）。
`pin.as_ref()`	获取`Pin<&T>`（不可变引用的 Pin）。
`pin.as_mut()`	获取`Pin<&mut T>`（可变引用的 Pin）。
`Pin::into_inner(pin)`	消费`Pin<P>`，返回内部的指针`P`（仅当`T: Unpin`时安全，否则可能导致移动）。
`pin.get_mut()`	获取内部指针的`&mut P`（仅当`T: Unpin`时允许，否则编译错误）。
`pin.get_ref()`	获取 `&T`
`unsafe fn get_unchecked_mut()`	获取 `&mut T`，不检查移动安全

Pin与Unpin

Pin<T>的出现就是为了强制数据在内存中 “固定”，确保其地址不会改变

Pin<P>：一个包装器类型，其中P是一个指针类型（如Box<T>、&mut T、Arc<T>等）。Pin<P>保证：被P指向的数据不会被移动（除非数据实现了Unpin）。
Unpin trait：标记 trait，表明 “该类型的数据可以安全移动，即使被Pin包装”。大多数类型（如i32、String、Vec<T>等）默认自动实现Unpin，无需手动处理；而需要固定的类型（如自引用类型）则不实现Unpin，必须通过Pin确保不被移动。
- 对于 T: !Unpin（不实现Unpin）：Pin<P>会严格限制操作，不允许通过Pin获取能导致数据移动的接口（如&mut T），确保数据地址不变。

Rust 中大多数类型默认都实现了 Unpin，这意味着它们可以被安全地移动（move）。而PhantomPinned 是标准库 std::marker 模块提供的一个标记类型（marker type；本身是一个零大小的结构体（ZST），没有字段，也不占用内存），其主要作用是阻止包含它的类型自动实现 Unpin trait。

自引用类型与Pin

自引用类型（如包含自身引用的结构体）是Pin的典型应用场景。没有Pin时，移动会导致悬垂引用；用Pin固定后，地址不变，引用安全。

use std::pin::Pin;
struct SelfRef {
    data: String,
    ptr: *const String,
}
impl SelfRef {
    fn new(txt: &str) -> Pin<Box<SelfRef>> {
        let mut boxed = Box::pin(SelfRef {
            data: String::from(txt),
            ptr: std::ptr::null(),
        });
        let ptr = &boxed.data as *const String;
        unsafe {
            let mut_ref = Pin::as_mut(&mut boxed);
            Pin::get_unchecked_mut(mut_ref).ptr = ptr;
        }
        boxed
    }
    fn show(&self) {
        unsafe {
            println!("data = {}, ptr = {}", self.data, &*self.ptr);
        }
    }
}
fn main() {
    let pinned = SelfRef::new("hello");
    pinned.show();
}

到此这篇关于Rust中的智能指针的文章就介绍到这了,更多相关Rust智能指针内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

深入解析Rust中的智能指针

智能指针

Box

Rc

Arc

RefCell

Mutex

RwLock

Weak

Cow写时Copy

Pin

Pin与Unpin

自引用类型与Pin

您可能感兴趣的文章: