对于每一个程序,字符串都是需要掌握的重要内容。由于Rust注重系统,所以它的字符串处理系统与其它语言有些许区别。每当你碰到一个可变大小的数据结构时,情况都会变得很微妙,而字符串正是可变大小的数据结构。这也就是说,Rust的字符串与一些像C这样的系统编程语言也不相同。
让我们深入细节。一个_字符串_是一串UTF-8字节编码的Unicode量级值的序列。所有的字符串都确保是有效编码的UTF-8序列。另外,字符串并不以null结尾并且可以包含null字节。
Rust有两种主要的字符串类型:`&str`和`String`。
第一种是`&str`。这叫做_字符串片段_(_string slices_)。下面这个字面意思的string是`&str`类型的:
~~~
let string = "Hello there."; // string: &str
~~~
这个字符串是静态分配的,也就是说它储存在我们编译好的程序中,并且整个程序的运行过程中一直存在。这个`string`绑定了一个静态分配的字符串的引用。字符串片段是固定大小的并且不能改变。
一个`String`,相反,是一个在堆上分配的字符串。这个字符串可以增长,并且也保证是UTF-8编码的。`String`通常通过一个字符串片段调用`to_string`方法转换而来。
~~~
let mut s = "Hello".to_string(); // mut s: String
println!("{}", s);
s.push_str(", world.");
println!("{}", s);
~~~
`String`可以通过一个`&`强转为`&str`:
~~~
fn takes_slice(slice: &str) {
println!("Got: {}", slice);
}
fn main() {
let s = "Hello".to_string();
takes_slice(&s);
}
~~~
把`String`当作`&str`是廉价的,不过从`&str`转换到`String`涉及到分配内存。除非必要,没有理由这样做!
## 索引
因为字符串是有效UTF-8编码的,它不支持索引:
~~~
let s = "hello";
println!("The first letter of s is {}", s[0]); // ERROR!!!
~~~
通常,用`[]`访问一个数组是非常快的。不过,字符串中每个UTF-8编码的字符可以是多个字节,你必须遍历字符串来找到字符串的第N个字符。这是一个更昂贵的操作,而且我们不想被误导。更进一步,Unicode实际上并没有定义什么“字符”。我们可以选择把字符串看作一个串独立的字节,或者代码点(codepoints):
~~~
let hachiko = "忠犬ハチ公";
for b in hachiko.as_bytes() {
print!("{}, ", b);
}
println!("");
for c in hachiko.chars() {
print!("{}, ", c);
}
println!("");
~~~
这会打印:
~~~
229, 191, 160, 231, 138, 172, 227, 131, 143, 227, 131, 129, 229, 133, 172,
忠, 犬, ハ, チ, 公,
~~~
如你所见,这里有比`char`更多的字节。
你可以这样来获取跟索引相似的东西:
~~~
let dog = hachiko.chars().nth(1); // kinda like hachiko[1]
~~~
这强调了我们不得不遍历整个`char`的列表。
## 连接(Concatenation)
如果你有一个`String`,你可以在它后面接上一个`&str`:
~~~
let hello = "Hello ".to_string();
let world = "world!";
let hello_world = hello + world;
~~~
不过如果你有两个`String`,你需要一个`&`:
~~~
let hello = "Hello ".to_string();
let world = "world!".to_string();
let hello_world = hello + &world;
~~~
这是因为`&String`可以自动转换为一个`&str`。这个功能叫做[`Deref`转换](http://doc.rust-lang.org/nightly/book/deref-coercions.html)。
- 前言
- 1.介绍
- 2.准备
- 2.1.安装Rust
- 2.2.Hello, world!
- 2.3.Hello, Cargo!
- 3.学习Rust
- 3.1.猜猜看
- 3.2.哲学家就餐问题
- 3.3.其它语言中的Rust
- 4.高效Rust
- 4.1.栈和堆
- 4.2.测试
- 4.3.条件编译
- 4.4.文档
- 4.5.迭代器
- 4.6.并发
- 4.7.错误处理
- 4.8.外部语言接口
- 4.9.Borrow 和 AsRef
- 4.10.发布途径
- 5.语法和语义
- 5.1.变量绑定
- 5.2.函数
- 5.3.原生类型
- 5.4.注释
- 5.5.If语句
- 5.6.for循环
- 5.7.while循环
- 5.8.所有权
- 5.9.引用和借用
- 5.10.生命周期
- 5.11.可变性
- 5.12.结构体
- 5.13.枚举
- 5.14.匹配
- 5.15.模式
- 5.16.方法语法
- 5.17.Vectors
- 5.18.字符串
- 5.19.泛型
- 5.20.Traits
- 5.21.Drop
- 5.22.if let
- 5.23.trait对象
- 5.24.闭包
- 5.25.通用函数调用语法
- 5.26.包装箱和模块
- 5.27.`const`和`static`
- 5.28.属性
- 5.29.`type`别名
- 5.30.类型转换
- 5.31.关联类型
- 5.32.不定长类型
- 5.33.运算符和重载
- 5.34.`Deref`强制多态
- 5.35.宏
- 5.36.裸指针
- 6.Rust开发版
- 6.1.编译器插件
- 6.2.内联汇编
- 6.3.不使用标准库
- 6.4.固有功能
- 6.5.语言项
- 6.6.链接参数
- 6.7.基准测试
- 6.8.装箱语法和模式
- 6.9.切片模式
- 6.10.关联常量
- 7.词汇表
- 8.学院派研究
- 勘误