The Option Enum and Its Advantages Over Null Values
这一部分探索学习Option
,另外一个标准库的枚举定义。Option
类型编码了非常常见的场景,其中可以是某个值,也可以都不是。
例如,如果请求一个包含项的列表的第一个值,会得到一个值,如果请求一个空的列表,就什么也不会得到。从类型系统的角度来表达这个概念意思就是编译器需要检查是否处理了所有应该处理的情况,这样就可以避免在其他语言中非常常见的bug.
编程语言的设计通常考虑的是包含哪些特性,但是你排除的特性也很重要。Rust没有许多其他语言所具有的null特性。Null
是一个值,表示什么也没有。在带有null特性的语言中,变量总是可以处于两种状态之一:null 或 not-null.
Null的发明者Tony Hoare在他2009年的报告”Null Reference: The Billon Dollar Mistake”中这样说:
我称之为十亿美元的错误。当时,我在为一个面向对象语言设计第一个综合性的面向引用的类型系统。我的目标是通过编译器的自动检查来保证所引用的使用都应该是绝对安全的。不过我未能抵抗住引入一个空引用的诱惑,仅仅是因为它是这么的容易实现。这引发了无数错误,漏洞和系统崩溃,在之后的四十多年中造成了十亿美元的苦痛和伤害。
空值的问题在于,如果你试图将空值用作非空值,会出现某种形式的错误。因为空和非空的属性到处都是,非常容易出现这类错误。
然而,null试图表达的概念仍然是有用的:null是当前由于某种原因无效或者不存在的值。
问题不在于概念,而在于具体的实现。因此,Rust没有空值,但它有一个枚举,可以编码值存在或者不存在的概念。这个枚举就是Option<T>
,它由标准库定义如下:
1 | enum Option<T> { |
Option<T>
枚举非常有用,以至于它被包含在relude中;你不需要将它显式地引入作用域。另外,它的成员也是如此(被包含在prelude中),可以不需要Option::
前缀来使用Some
和None
。即便如此Option<T>
也仍是常规的枚举,Some<T>
和None
仍是Option<T>
的成员。
<T>
语法是我们还没讲到的Rust特性。它是一个泛型参数,在Chapter 10我们将会详细讲解。目前,你需要知道的就是<T>
意味着Option
枚举的Some
成员可以包含任意类型的数据,同事每一个用于T
位置的具体类型使得Option<T>
整体作为不同的类型。这里是一些包含数字类型和字符串类型Option
值的例子:
1 | fn main() { |
some_number
的类型是Option<i32>
。some_char
的类型是Option<char>
,是不同的类型。因为我们在Some
成员中指定了值,Rust可以推断出其类型。对于absent_number
,Rust需要我们指定Option
整体的类型,因为编译器只通过None
值无法推断出Some
成员保存的值的类型。这里我们告诉Rust我们需要absent_number
的类型是Option<i32>
。
当我们有一个Some
值,我们就知道存在一个值,这个值保存在Some
中。当我们有一个值None
,在某种意义上,它跟空值是有相同的意义:并没有一个有效的值。那么Option<T>
为什么就比Null要好呢?
简单来说,因为Option<T>
和T
(T
可以是任何类型)是不同的类型,编译器不允许像一个肯定有效的值那样使用Option<T>
。例如:这段代码不能编译,因为它尝试将Option<i8>
与i8
相加:
1 | fn main() { |
如果我们运行这段代码,我们会得到一个错误信息如下:
1 | $ cargo run |
铛!铛!铛!事实上,这个错误意味着Rust不知道如何将i8
和Option<i8>
相加,因为它们是不同类型。在Rust中,当我们有一个值像i8
,编译器将会确保我们总是有一个有效的值。我们可以自信地使用而无需做空检查。只有当使用Option<i8>
(或者任何用到的类型)我们需要担心可能没有一个有效值,并且编译器将会确保我们在使用值之前处理了空的情况。
换句话说,你必须将Option<T>
转换成T
之后才能对T
进行运算。通常这能帮助我们捕获到空值最常见的问题之一:假设某值不为空,但实际上是空的情况。
消除错误地假设非空值的风险有助于你对代码更有信心。为了有一个可能为空的值,你必须显式地使用Option<T>
。然后,在使用该值时,需要显式地处理值为空的情况。任何地方,一个值不是Option<T>
类型,你都可以放心地假设他不是null。这是Rust有意为之的设计决定,目的就是限制null的滥用,以增加Rust代码的安全性。
所以,当你有一个类型为Option<T>
的值时,你如何从Some
变量中获得T
的值呢?Option<T>
枚举有大量很有用的方法适用于各种情况;你可以查看它的文档(https://doc.rust-lang.org/std/option/enum.Option.html)。熟悉`Option
通常,为了使用Option<T>
值,你需要有处理每个变量的代码。你希望一些代码只在具有Some<T>
值时运行,并且允许这些代码使用内部的T
。你希望如果有个None
值时运行一些其他的代码,而且这些代码也没有一个T
的有效值。match
表达式就是这么一个处理枚举的控制流结构:它会根据枚举的成员运行不同的代码,这些代码可以使用匹配到的值中的数据。