从高级程序员的角度来看，Rust 基础知识

2022 年 4 月 18 日 CSDN

作者 | Daniel Bulant

译者 | 弯月

出品 | CSDN（ID：CSDNnews）

刚开始从事编程工作的时候，我使用的是PHP。个人感觉，PHP的语法有点笨拙且不自然，有时甚至很讨厌（为什么我必须在每个变量前加上 $ 前缀？常量前面没有$，它不是照样能理解吗？）在学习了其他语言之后，我就不喜欢PHP了，但PHP的有些地方还是还招人喜欢的，比如数组循环很容易，而且还有多种编程范式：函数式、面向对象以及trait等。

后来，我又学习了JS，它很像C语言，而且随处可见。期间，我也做过一些Java和C#的项目，但后来还是回到了JS。

我也尝试过学习C（和 C++），虽然获得了Sololearn的证书，但是我从未真正使用过这两种语言，它们看上去似乎很复杂：快速访问内存的功能很酷，但为什么我必须使用free？为什么它不知道超出作用域时，应该自动释放内存呢？

所以，我还是比较喜欢使用JS编程，因为我无需考虑内存的问题。而且，如今与IO相关的操作也不会限制V8的速度。

后来，我听说了Rust，这门语言由Mozilla开发，多年来一直雄踞StackOverflow最受喜欢编程语言的榜首，甚至超过了我十分喜爱的Typescript（我之所以喜欢Typescript，主要是因为类型安全）。所以，我就想着应该找机会试一试。

学习资源

我遇到的一大难题是，寻找方便理解且简短的好资源。我不喜欢 youtube 视频，我更喜欢快速浏览一些文档，或者在通勤路上阅读一些学习资源，而且无需耗费大量流量。

以下是我找到的资源列表：

● 《The Rust Programming Language》（https://doc.rust-lang.org/book/）：这是一本在线书籍，其中介绍了可以利用Rust实现的最常见的功能。

● 《A Gentle Introduction To Rust》（https://stevedonovan.github.io/rust-gentle-intro/）：一本简短的书，可以在一两个小时内读完，然后再拿出一两天的时间尝试一下示例。文中涉及的内容比较深入，但很容易掌握。

● https://www.reddit.com/r/rust/：这是一个reddit 社区（如果你遇到比较复杂的问题，则可以发布在此处，等待其他人解答。）

● discord社区：你可以通过这个社区向其他开发人员请教有关Rust的问题。

● Rust By Example（https://doc.rust-lang.org/rust-by-example/index.html）：其中介绍了一些示例，可以作为入门首选书。

入门

参照Rust网站（https://www.rust-lang.org/）上的说明，使用rustup即可。

如果想创建一个新项目，请运行 cargo init <dir>（如果位于一个空目录内，则不需要指定 <dir>）。

然后即可从src/main.rs开始编写。

与 C 类似，主程序都包装在 main 中。不同之处在于，它不接受任何参数，也不应该返回一个整数，这些功能应该使用命名空间std::env。

另外，我推荐使用CLion并安装Rust扩展。VSCode 也有 Rust 扩展，但相比之下它的效果很差。当然你可以使用其他的JetBrains编辑器，但 CLion 具有其他编辑器没有的一些原生功能（比如调试）。拥有 GitHub 教育包的学生可以免费使用该插件。

有趣的注意事项

一切都有作用域

不仅是变量，就连函数和trait内部也可以使用嵌套函数和use。这些无法从外部访问，而且如果不使用就不会出现在代码中。至少我是这样认为的。

必须遵守的命名方案

变量和函数/方法只能使用小写字母、数字和下划线，比如snake_case，但数字不能放在开头。

结构（和其他类型）、枚举（包括枚举值）和trait（但不包括它们的函数/方法）需要以大写字母开头，并且不能包含任何下划线。

没有增量运算符

实际上有，你可以使用i += 1。与赋值相同，该表达式将返回赋值后的值（即，将 i 设置为 i + 1，然后返回 i）。

没有 i++（或者 ++i、i-- 和 --i），因为这些运算符有点混乱。

你确定如下操作的结果吗（尤其是在没有指定语言的情况下）？

a[i++ + ++i] = i++ + ++i + a[++i]

问题在于，直到最近上述运算的实际行为还是未定义的，这意味着不同的编译器（甚至可能是同一个编译器的不同版本）可能会产生不同的行为。为了解决这个问题并提高代码的可读性（Rust非常重视可读性和冗长，甚至不惜多敲几次键盘），Rust仅支持 i += 1，几乎所有人都知道该表达式的意思是变量i加1，并返回最终结果。所以，你不必知道 i++ 实际上返回的是原始值（不是新值），而且还会加1。

此外，运算符重载会使用trait，但本文不打算详细讨论。

几乎所有的东西都是表达式

除了函数调用之外，还有 if、while、match 和 for 都是表达式。

你可以直接使用 if 来代替其他语言中常见的三元运算符：

let var = if something { 1 } else { 2 };

循环会根据break的调用返回结果。你可以利用它，反复重试某个操作，直到成功。

变量

变量通过 let 声明，并且有作用域。类型是可选的，Rust 非常擅长推断类型（比 Typescript 更出色）。

let var: usize = 1;

上述变量定义了一个类型为usize的变量var（usize是一个32或64位的数字，具体取决于计算机架构）。

你可以重复声明变量。当重复声明某个变量时，之前声明的变量就会被删除（除非该变量被引用，在这种情况下只有引用会保留，而原始变量会被删除），而且变量的类型也会改变。

let var = 1;let var = "something";

在默认情况下，变量是不可变的。如果你想修改它们，则需要在 let 之后加上关键字 mut。

let var = 1;var = 2; // 错误！不可以修改不可变的变量

let mut var = 1;var = 2;

函数

fn main(arg: u8) -> u8 {    // something    arg}

函数的行为几乎与JS一模一样，只不过它们并不是数据类型，而且语法上略有不同。

参数的指定与 Typescript 类似，即key: type。返回类型通过 -> 指定。

有趣的是，虽然 Rust 需要分号，但如果最后一个表达式后面的分号忘写了，它会被作为返回值（即使没有 return 关键字）。

If语句

if something {} else {} else if something_else {}

if 语句的使用非常基本，不在此赘述。

有一点需要注意，如非必要，使用括号实际上是错误的。你可以利用括号指定执行顺序：

if (something || something_else) && something_other {}

如前所述，if 也可以返回一个值，而该值可用于赋值、参数、返回或其他地方。

let var = if something { 1 } else { 2 };

这里的花括号是必需的。

类型

Rust的类型有两种：基本数据类型（数字、str），结构（String）。

二者之间唯一的区别是，基本类型的初始化可以直接赋值，而复杂类型则需要某种构造函数。

堆与栈

我之前几乎不需要考虑堆与栈的问题。（据我所知，JS中的对象都存储在堆中，只有基本类型在栈中。）

堆：

● 速度慢

● 比较大

栈

● 非常快

● 比较小

基本类型和基本的结构都存储在栈中。要在堆中存贮值，需要使用Box<T>。另外，Vec<T> 也可以将值保存到堆中。

如果你使用的内存较多，或者需要在结构中使用带有值的enum，则可能需要使用堆。

如果发生栈溢出，则说明你使用了过多的栈内存。对于一些较大的值，应该使用Box。

常见的基本类型

数字：

● i8、i16、i32、i64、i128：有符号整数，包括负数。数字表示值的比特数。

● u8、u16、u32、u64、u128：无符号整数，从零开始。它们的最大容量翻了一倍，因为有一个额外的比特可用（在有符号整数中用于表示符号）。数字表示值的比特数。

● f32 和 f64：浮点数。javascript 世界中常见的数字。

字符串：

● str：简单的UTF-8 字符串（所有 Rust 字符串都是 UTF-8。不能使用无效的 UTF-8 字符串，会引发异常或造成panic）。通常用作指针（即 &str）。

● String：一种更复杂的类型（严格来说不是基本类型），存储在堆中。

数组：

● T[] ：具有固定长度的数组（如果使用 Option<T> 类型，则数组内包含的元素数量可以小于实际长度）。

元组

元组可用于存储不同类型的多个值（从本质上来说就是可以容纳不同类型且大小固定的数组）。

与数组不同，元组可通过点（.）直接访问，例如 tuple.0 表示获取第一项，而 tuples 没有.len() 之类的方法。

let var = (1, "str");

有一个很有意思的小技巧，你可以通过()（空元组）返回“void”。既没有 return 语句，也不会返回值的函数会返回()。

常见结构

Option<T>

● 这是一个枚举，值为Some(T) 或 None。（我们稍后再讨论enum，Rust中的枚举与其他语言略有不同。）

● 如果想获取该值，你可以使用 match，就像使用其他枚举一样，或者使用 .unwrap() （如果值为None，则会导致panic）。

Result<T, E>

● 这个结构与 Option 类似，但常用于处理错误（通常由 IO 方法返回）。

● 它的值是 Ok(T) 或 Err(E)。

● 如果想获取该值，你可以使用match 块或 unwrap()。

● 为了方便使用，当函数返回 Result<T, E> 时，可以在返回值为 Result<T, E>（其中E必须为兼容的类型）的方法调用之后使用 ? 来返回错误E（类似于使用.unwrap()，但当函数出错时不会造成panic）。

fn example() -> Result<(), Error> { // 一种错误类型。为了简便起见，你可以使用String，或自定义enum。    something_that_returns_result()?;    Ok(()) // returns empty Tuple}

Vec<T>

● 向量是可增长的数组，存储在堆上。

● 向量支持 .push()、.pop() 等常用操作。详情参见Rust文档。

Box<T>

● 在堆上存储T。可用于在结构中使用enum，或者用于释放栈空间。

定义结构

结构类似于对象，但它们的大小是静态的。

结构可以通过如下几种方式定义。

● 使用Tuple作为声明（类似于元组的别名）

struct Something(u8, u16); // a struct with 2 numbers, one unsigned 8 bit, the other one unsigned 16 bit

● 使用对象表示法（类似于声明类或对象）

struct Something {    value: u8,    another_value: u16}

● 使用struct作为别名

struct Something = u8; // a single value

这种方法的适用情况为：你试图创建一个enum，而其值可能是正在定义的结构，而该结构中又要（直接或间接）引用该enum。

struct MaybeRecursive {    possibly_self: Option<MaybeRecursive> // error!}struct MaybeRecursive {    possibly_self: Option<Box<MaybeRecursive>> // fine}

我在为自己的shell创建抽象语法树时，就遇到了这个问题。

要创建结构的实例，需要使用下述写法（类似于C#中定义数组）：

Something { variable: 1, another_variable: 1234}

定义enum

下面是示例：

enum EnumName {    First,    Second}

可以为enum指定数值（例如序列化或反序列化数值的情况）：

enum EnumName {    First = 1,    Second // auto incremented}

更强大的写法如下：

enum EnumName {    WithValue(u8),    WithMultipleValues(u8, u64, SomeStruct),    CanBeSelf(EnumName),    Empty}

你可以用match提取出值。

Match

match是Rust最强大的功能之一。

Match是更强大的switch语句。使用方法与普通的swtich语句一样，除了一点：它必须覆盖所有可能的情况。

let var = 1;match var {    1 => println!("it's 1"),    2 => println!("it's 2"),    // following required if the list is not exhaustive    _ => println!("it's not 1 or 2")}

也可以match范围：

match var {    1..=2 => println("it's between 1 and 2 (both inclusive)"),    _ => println!("it's something else")}

也可以什么都不做：

match var {    _ => {}}

可以使用match安全地unwrap Result<T, E>和Option<T>，以及从其他enum中获取值：

let option: Option<u8> = Some(1);match option {    Some(i) => println!("It contains {i}"),    None => println!("it's empty :c")    // notice we don't need _ here, as Some and None are the only possible values of option, thus making this list exhaustive}

如果你不使用i（或其他值），Rust会发出警告。你可以使用_来代替。

match option {    Some(_) => println!("yes"),    None => println!("no")}

match也是表达式：

let option: Option<u8> = Some(1);let surely = match option {    Some(i) => i,    None => 0}println!("{surely}");

你可以看看Option的文档（或通过IDE的自动补齐，看看都有哪些可以使用的trait或方法）。

你也许注意到了，你可以使用.unwrap_or(val)来代替上述代码（上述match等价于.unwrap_or(0)）。

Loop

loop循环是最简单的循环。只需要使用loop即可。

loop {    if something { break }}

该代码会一直运行，直到遇到break（或return，return也会同时返回父函数）。

for

for循环是最简单易用的循环。它比传统的for循环更容易使用。

for i in 1..3 {} // for(let i = 1; i < 3; i++) // i++ is not a thing, see things to notefor i in 1..=3 {} // for(let i = 1; i <= 3; i++)for i in 1..=var {} // for(let i = 1; i <= var; i++)for i in array_or_vec {} // for(let i of array_or_vec) in JS// again, as most other things, uses a trait, here named "iterator"// for some types, you need to call `.iter()` or `.into_iter()`.// Rust Compiler will usually tell you this.for i in something.iter() {}

while

很简单的循环。与其他语言不同，Rust没有do...while，只有最基础的while。

while condition {    looped();}

语法与if一样，只不过内容会循环执行。

打印输出

打印输出可以使用 print! 和 println!。

!表示这是一个宏（即可以扩展成其他代码的快捷方式），但你不需要过多考虑。另一个常用的宏是 vec![] ，它能利用数组创建 Vec<T> （使用 [] 内的值）。

这些宏都有一个简单的模板系统。

● 输出一行使用 println!()。

● 输出一个静态字符串使用 print!("something")。println!中ln的意思是行，也就是说它会添加换行符号（\n）。console.log会默认添加换行。

● 要输出一个实现了Display trait的值（绝大多数基本类型都实现了），可以使用 print!("{variable}")。

● 要输出一个实现了Debug trait的值（可以从Display继承），使用 print!("{variable:?}")。

● 要输出更复杂的实现了Display trait的内容，使用 print!("{}", variable)。

● 要输出更复杂的实现了Debug trait的内容，使用 print!("{:?}", variable)。

Trait

Trait是Rust中最难理解的概念之一，也是最强大的概念之一。

Rust没有采用基于继承的系统（面向对象的继承，或JavaScript基于原型的继承），而是采用了鸭子类型（即，如果一个东西像鸭子一样叫，那么它就是鸭子）。

每个类型都有且只有一个“默认”（或匿名）trait，只能在与该类型同一个模块中实现。通常都是该类型独有的方法。

其他的都叫trait。例如：

trait Duck {    fn quack(&self) -> String;    /// returns if the duck can jump    fn can_jump(&self) -> bool { // default trait implementation. Code cannot have any assumptions about the type of self.        false // by default duck cannot jump    }}struct Dog(); // a struct with empty tupleimpl Dog { // a nameless default trait.    fn bark(&self) -> String { String::from("bark!") }}impl Duck for Dog { // implement Duck trait for Dog type (struct)    fn quack(&self) -> String { String::from("quark!") } // dog kind of quacks differently}let dog = Dog {};dog.bark();dog.quack();

首先，我们定义了trait（在面向对象语言中叫做接口，但它只包含方法或函数）。然后为给定的类型（上例中为Dog）实现trait。

一些trait可以自动实现。常见的例子就是Display和Debug trait。这些trait要求，结构中使用的类型必须要相应地实现Display或Debug。

#[derive(Display,Debug)]struct Something {    var: u8}println!("{:?}", Something { var: 1 });

作用域

Trait有作用域，而且与它实现的类型的作用域是独立的。也就是说，你可以使用一个类型，但无法使用一个trait的实现（例如，如果这个实现来自另外一个库，而不是来自该类型本身）。你可以use这个实现。

self

trait中的self指向它实现的类型。&self是指向 self: &Self 的别名，其中Self表示该类型（上例中的 self: &Dog）。self也是self: Self的别名，但两者的区别就是后者会移动变量（即消耗该变量，该变量就无法从外部访问了）。

当函数定义不以self、&self或&mut self开始时（&mut self相当于带有可改变引用的 &self），就是一个静态方法。Trait依然可以像任何方法一样定义并实现静态方法。常见的一个静态方法是new，用于创建类型或结构的实例：

impl Something {    fn new() -> Something {        Something { x: 1 }    }}...let var = Something::new();

指针

指针实际上非常易懂，尽管它来自其他更高级的语言。我经常会用错。

&A指向A，使用时只需要确保A存在，即可保证&A存在，因为我们不应该让指针指向不存在的对象。

Rust会在编译时进行静态检查，确保不会出现上述情况。它会自动释放超出作用域的变量，并且不允许指针的存活超过变量。另一个安全保证是，只能有一个可改变的指针。

也就是说下述代码是错误的：

let a = 1;let b = &a;let c = &mut a;println!("{b}"); // Error! there can only be one mutable pointerc = 1;

我们只需要保证原始变量在指针的作用域中一直存在即可。

在结构中使用指针会有点问题，因为编译器不喜欢这种做法（因为结构的寿命通常比原始变量更长）。我通常会采用所有权转移或克隆（.clone()，Clone trait的一部分，可以被derived）。

有时候，一些函数要求只能用指针，不能用所有权转移。这时，只需在值的前面加上 & （或 &mut）即可。

something(&a);

此外，还有双重、三重等指针，但很少见，而且一般来说只会更难处理。

你也不需要考虑释放变量的问题，Rust会在超出作用域时自动释放。

命名空间

使用全名就无需导入。导入只不过是别名。

std::env::args()

use std::env;env::args()

use std::env::args;args()

选择多个“命名空间”可以使用{}，如：

use std::env::{args, var};

也可以重复使用use：

use std::env;use std::env::args;env::var();args()

还有一点，你也可以在函数内使用use。这样，如果代码没有被执行，库就不会被导入（即，如果函数没有在代码路径中出现，例如，use了一个测试用的库，而use只写在了测试用例中，那么在正常构建时就不会导入该库）。

fn test() {    use std::env;    env::var();}

但我不推荐在正常的代码路径中这样写，应该使用全局的导入。

可见性

讨论完命名空间之后，我们来讨论一下可见性。

本质上，默认情况下任何东西都是私有的，只能被它所在的文件访问。

● trait及其方法

● 结构及其成员

● enum（成员继承enum的可见性，这是合理的，参见Match）

● 函数

● trait的实现依赖于trait和实现该trait的结构，即，只有两者都是公有的，该实现才是公有的。

要设置为公有（即可以从外部访问），需要使用关键字pub：

pub struct Something {    pub letter: char}pub trait CustomTrait { ... }pub fn method() {}

使用多个文件

有时候我会想念 require("./fire")。

要想“导入”一个文件，要使用 mod指令。通过cargo下载的crate会自动导入。

main.rs

mod my;fn main() {    my::function();    // or    use my::function;    function();}

my.rs

pub fn function() {    println!("function");}

你也可以使用pub mob重新导出一个文件。绝大多数已有的Rust代码都会对支持文件夹采用下列操作：

main.rs

mod my;use my::file;fn main() {    file::function();}

my/mod.rs - mod.rs这个名字是特殊的，类似于index.js

pub mod file;

my/file.rs

pub fn function() {    println!("function");}

关于println!，参见“打印输出”。

编写文档

编写文档只需使用三个斜线 ///。一些IDE会采用不同的高亮方式显示。

类似于JSDoc，只不过其类型不会显式标注，因为代码中已经写了类型。

/// a description of varlet var = "something";

原文地址：https://danbulant.eu/posts/rust-basics

END

《新程序员001-004》全面上市，对话世界级大师，报道中国IT行业创新创造

  
  
    
   
   
     
    
    
      
     
     
       
      
      
        
       
       
         — 推荐阅读 —
      
      
        
     
     
       
    
    
      
   
   
     
  
  
    
   
   
     
    
    
      ☞“在 GitHub 用十年攒的 54k+ Star，一个误操全没了”
   
   
     
   
   
     
    
    
      ☞科技公司 CEO 合谋“诈骗”自家公司超 900 万美元，现已被捕
   
   
     
   
   
     
    
    
      ☞主动出击！马斯克欲用 430 亿美元拿下 Twitter