企业🤖AI Agent构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
# **第 2 章 便利的对象** 在第 1 章里,我们介绍了 Ruby 的基本数据对象“字符串”以及“数值”。当然,Ruby 能使用的数据对象不可能只有这两种。一般 Ruby 程序里数据对象的结构都比它们复杂得多。 假设现在我们用 Ruby 做一个通讯录,通讯录一般有以下项目: - **名字** - **拼音** - **邮政编码** - **都道府县**1 - **地址** - **电话号码** - **邮箱地址** - **SNS 的 URL** - **登记日期** 1日本的行政区域单位——译者注 在这些项目里,邮政编码用 7 位的数字表示,除此以外的项目都是用字符串表示(一般来说,登记日期这个项目应该用 `Date` 对象来表示。关于 `Date` 对象我们将会在第 20 章介绍)。 这样一来,一组的项目集合起来后就可以表示一个人的基本信息(图 2.1),再把亲朋好友的基本信息都收集后就成为一本通讯录。 ![{%}](https://box.kancloud.cn/2015-10-26_562e01d716988.png) **图 2.1 收集、汇总各项目** 不同数据间的组合无法用字符串或数值这样简单的对象来表示,因此我们需要一个可以用以表示数据集合的数据结构。 本章我们将介绍数组和散列这两 种新的数据结构。另外,我们还会介绍处理字符串时常用的工具——正则表达式。 > **备注** 像数组、散列这样保存对象的对象,我们称为容器(container)。 数组、散列、正则表达式的应用十分广泛,关于它们的详细用法我们会在后面的章节介绍,在这里我们只会简略地说明一下,让大家对它们有个初步印象。 ### **2.1 数组** 数组(array)是一个按顺序保存多个对象的对象,它是基本的容器之一。我们一般称为数组对象或者 Array 对象。 ### **2.1.1 数组的创建** 要创建数组,我们需要把各数组的元素用逗号隔开,然后再用 `[]` 把它们括起来即可。首先,让我们创建一个简单的数组。 ~~~ names = [" 小林 ", " 林 ", " 高野 ", " 森冈 "] ~~~ 在这个例子里,我们创建了一个叫 `names` 的数组对象,分别保存了 4 个数组元素:小林、林、高野、森冈。如图 2.2 所示。 ![{%}](https://box.kancloud.cn/2015-10-26_562e01d7344e4.png) **图 2.2 数组对象** ### **2.1.2 数组对象** 在数组元素对象还未确定的情况下,我们可以用 `[]` 表示一个空数组对象。 ~~~ names = [] ~~~ 除此以外,还有其他方法创建数组,我们将会在第 13 章再详细说明。 ### **2.1.3 从数组中抽取对象** 保存在数组里的每个对象,都各自有一个表示其位置的编号,我们称之为索引(index)。利用索引,我们可以进行把对象保存到数组、从数组中抽取对象等操作。 要从数组中抽取元素(对象),我们可以使用以下方法。 **数组名 [ 索引 ]** 如下所示,有一个名为 `names` 的数组对象。 ~~~ names = [" 小林 ", " 林 ", " 高野 ", " 森冈 "] ~~~ 把 `names` 数组里第一个元素拿出来,我们可以这么做 ~~~ names[0] ~~~ 因此,若执行以下代码, ~~~ print "第一个名字为:", names[0], "。\n" ~~~ 得到的结果为, ~~~ 第一个名字为小林。 ~~~ 同样地,`names[1]` 表示林,`names[2]` 表示高野。 > **执行示例** ~~~ > irb --simple-prompt => names = ["小林", "林", "高野", "森冈"] => ["小林", "林", "高野", "森冈"] >> names[0] => "小林" >> names[1] => "林" >> names[2] => "高野" >> names[3] => "森冈" ~~~ > **备注** 数组的索引值是从 0 开始,并非 1。因此,`a[1]`返回的并不是数组第一个元素,而是第二个元素。刚接触编程时,大家比较容易弄错(即便是熟悉以后也有可能会犯这样的错误)。大家在使用数组时,务必注意索引值这个特点。   > **注** 在 Windows 命令行中,用 Alt + Shift 键切换中英文输入法模式。 ### **2.1.4 将对象保存到数组中** 我们可以将新的对象保存到已经创建的数组中。 将数组里的某个元素置换为其他对象,我们可以这样做: **数组名 [ 索引 ] = 希望保存的对象** 我们试着置换一下刚才的 `names` 数组的内容,将 " 野尻 " 放在数组首位。 ~~~ names [0] = "野尻" ~~~ 执行下面的程序,我们可以知道 " 野尻 " 的确已经被置换为首位的数组元素。 > **执行示例** ~~~ > irb --simple-prompt >> names = ["小林", "林", "高野", "森冈"] => ["小林", "林", "高野", "森冈"] >> names[0] = "野尻" => "野尻" >> names => ["野尻", "林", "高野", "森冈"] ~~~ 在保存对象时,如果指定了数组中不存在的索引值时,则数组的大小会随之而改变。Ruby 数组的大小是按实际情况自动调整的 2。 2即动态数组。——译者注 > **执行示例** ~~~ > irb --simple-prompt >> names = ["小林", "林", "高野", "森冈"] => ["小林", "林", "高野", "森冈"] >> names[4] = "野尻" => "野尻" >> names => ["小林", "林", "高野", "森冈", "野尻"] ~~~ ### **2.1.5 数组的元素** 任何对象都可以作为数组元素保存到数组中。例如,我们除了可以创建字符数组,还可以创建数值数组。 ~~~ num = [3, 1, 4, 1, 5, 9, 2, 6, 5] ~~~ Ruby 数组还支持多种不同对象的混合保存。 ~~~ mixed = [1, " 歌 ", 2, " 风 ", 3] ~~~ 这里,我们不再举其他例子了,像时间、文件等对象也都可以作为数组元素。 ### **2.1.6 数组的大小** 我们可以用 `size` 方法获知数组的大小。例如,若想获知数组 `array` 的大小,程序可以这么写: ~~~ array.size ~~~ 我们现在就用 `size` 方法,查看一下刚才的 `names` 数组的大小。 > **执行示例** ~~~ > irb --simple-prompt >> names = ["小林", "林", "高野", "森冈"] => ["小林", "林", "高野", "森冈"] >> names.size => 4 ~~~ size 方法的返回值就是数组的大小。 ### **2.1.7 数组的循环** 有时,我们希望输出所有数组元素,或者对在数组中符合某条件的元素执行 xx 方法,不符合条件的执行 yy 方法。为实现这些目的,我们需要一种方法遍历所有数组元素。 为此,Ruby 提供了 `each` 方法。我们在第 1 章介绍迭代器时,已经稍微接触了一下 `each` 方法。 `each` 方法的语法如下: **数组 .`each do` | 变量 |  希望循环的处理 `end`** `each` 后面在 `do ~ end` 之间的部分称为块(block)3。因此,`each` 这样的方法也可以称为带块的方法。我们可以把多个需要处理的内容合并后写到块里面。 3也称为代码块。——译者注 块的开始部分为 | 变量 |。`each` 方法会把数组元素逐个拿出来,赋值给指定的 | 变量 |,那么块里面的方法就可以通过访问该变量,实现循环遍历数组的操作。 接下来,我们实际操作一下,按顺序输出数组 `names` 的元素。 > **执行示例** ![{%}](https://box.kancloud.cn/2015-10-26_562e01d748412.png) 每循环一次,就会把当前的数组元素赋值给变量 `|n|`(图 2.3)。 ![{%}](https://box.kancloud.cn/2015-10-26_562e01d76727a.png) **图 2.3 循环时 n 的变化** 除了 `each` 方法外,数组还提供了许多带块的方法,我们在实际的数组操作中会经常使用到,详细的内容会在 13.6 节介绍。 ### **2.2 散列** 散列(hash)也是一个程序里常用到的容器。散列是键值对(key-value pair)的一种数据结构。在 Ruby 中,一般是以字符串或者符号(Symbol)作为键,来保存对应的对象(图 2.4)。 ![%](http://epub.ituring.com.cn/api/storage/getbykey/screenshow?key=1505eacb4fe727d52c17) **图 2.4 散列** ### **2.2.1 什么是符号** 在 Ruby 中,符号(symbol)与字符串对象很相似 4,符号也是对象,一般作为名称标签来使用,用来表示方法等的对象的名称。 4可以将符号简单理解为轻量级的字符串。——译者注 创建符号,只需在标识符的开头加上`:` 就可以了。 ~~~ sym = :foo # 表示符号“:foo” sym2 = :"foo" # 意思同上 ~~~ 符号能实现的功能,大部分字符串也能实现。但像散列键这样只是单纯判断“是否相等”的处理中,使用符号会比字符串比较更加有效率,因此在实际编程中我们也会时常用到符号。 另外,符号与字符串可以互相任意转换。对符号使用 `to_s` 方法,则可以得到对应的字符串。反之,对字符串使用 `to_sym` 方法,则可以得到对应的符号。 > **执行示例** ~~~ > irb --simple-prompt >> sym = :foo => :foo >> sym.to_s # 将符号转换为字符串 => "foo" >> "foo".to_sym # 将字符串转换为符号 => :foo ~~~ ### **2.2.2 散列的创建** 创建散列的方法与创建数组的差不多,不同的是,不使用 `[]`,而是使用 `{}` 把创建的内容括起来。散列用`=>`来定义获取对象时所需的键(key),以及键相对应的对象(value)。 ~~~ address = {:name => "高桥", :pinyin => "gaoqiao", :postal => "1234567"} ~~~ 将符号当作键来使用时,程序还可以像下面这么写: ~~~ address = {name: "高桥", pinyin: "gaoqiao", postal: "1234567"} ~~~ ### **2.2.3 散列的使用** 从散列取出对象、将对象保存到散列的使用方法也都和数组非常相似。我们使用以下方法从散列里取出对象。 **散列名 [ 键 ]** 保存对象时使用以下方法。 **散列名[ 键 ] = 希望保存的对象** > **执行示例** ~~~ > irb --simple-prompt >> address = {name: "高桥", pinyin: "gaoqiao"} => {:name=>"高桥", :pinyin=>"gaoqiao"} >> address[:name] => "高桥" >> address[:pinyin] => "gaoqiao" >> address[:tel] = "000-1234-5678" => "000-1234-5678" >> address => {:name=>"高桥", :pinyin=>"gaoqiao", :tel=>"000-1234-5678"} ~~~ ### **2.2.4 散列的循环** 使用 `each` 方法,我们可以遍历散列里的所有元素,逐个取出其元素的键和对应的值。循环数组时是按索引顺序遍历元素,循环散列时按照键值组合遍历元素。 散列的 `each` 语法如下。 **散列 .`each do` | 键变量 , 值变量 |  希望循环的处理 `end`** 事不宜迟,我们马上来看看怎么用。 > **执行示例** ~~~ > irb --simple-prompt >> address = {name: "高桥", pinyin: "gaoqiao"} => {:name=>"高桥", :pinyin=>"gaoqiao"} >> address.each do |key, value| ?> puts "#{key}: #{value}" >> end name: 高桥 pinyin: gaoqiao => {:name=>"高桥", :pinyin=>"gaoqiao"} ~~~ 显而易见,程序循环执行了输出散列 `address` 的键和值的 `puts` 方法 5。 5原文是 print 方法。——译者注 ### **2.3 正则表达式** 在 Ruby 中处理字符串时,我们常常会用到正则表达式(regular expression)。使用正则表达式,可以非常简单地实现以下功能: - **将字符串与模式(pattern)相匹配** - **使用模式分割字符串** Ruby 的前辈——Perl、Python 等脚本语言至今还在使用正则表达式。Ruby 继承了这一点,把正则表达式的使用嵌入到语法中,大大简化了正则表达式的调用方式。正是在正则表达式的帮助下,字符串处理变成了一个 Ruby 非常擅长的领域。 ### **模式与匹配** 我们有时会有按照特定模式进行字符串处理的需求,比如“找出包含○○字符串的行”或者“抽取○○和 ×× 之间的字符串”。判断字符串是否适用于某模式的过程称为匹配,如果字符串适用于该模式则称为匹配成功(图 2.5)。 ![{%}](https://box.kancloud.cn/2015-10-26_562e01d77980d.png) **图 2.5 匹配的例子** 像这样的字符串模式就是所谓的正则表达式。 乍一看,“正则表达式”这个词可能会给人一种深奥、难理解的印象。的确,正则表达式非常复杂,但如果只是使用单纯的匹配功能,也并不怎么难。所以大家也无需感到如临大敌,我们暂时只需要知道有个工具叫“正则表达式”就足够了。 创建正则表达式对象的语法如下所示。 **/ 模式 /** 例如,我们希望匹配 `Ruby` 字符串的正则表达式为: ~~~ /Ruby/ ~~~ 把希望匹配的内容直接写出来,就这么简单。匹配字母、数字时,模式按字符串原样写就可以了。6 6汉字也可以通过同样的方法做匹配。——译者注 我们用运算符`=~` 来匹配正则表达式和字符串。它与判断是否为同一个对象时用到的 `==` 有点像。 匹配正则表达式与字符串的方法是: **/ 模式 / =~ 希望匹配的字符串** 若匹配成功则返回匹配部分的位置。字符的位置和数组的索引一样,是从 0 开始计数的。也就是说,字符串的首个字符位置为 0。反之,若匹配失败,则返回 `nil`。 > **执行示例** ~~~ > irb --simple-prompt >> /Ruby/ =~ "Ruby" => 0 >> /Ruby/ =~ "Diamond" => nil ~~~ 之前曾提到过,使用单纯的字母、数字、汉字模式时,如果字符串里存在该模式则匹配成功,否则匹配失败。 > **执行示例** ~~~ > irb --simple-prompt >> /Ruby/ =~ "Yet Another Ruby Hacker," => 12 >> /Yet Another Ruby Hacker,/ =~ "Ruby" => nil ~~~ 正则表达式右边的 / 后面加上 i 表示不区分大小写匹配。 > **执行示例** ~~~ > irb --simple-prompt >> /Ruby/ =~ "ruby" => nil >> /Ruby/ =~ "RUBY" => nil >> /Ruby/i =~ "ruby" => 0 >> /Ruby/i =~ "RUBY" => 0 >> /Ruby/i =~ "rUbY" => 0 ~~~ 除此以外,正则表达式还有很多写法和用法,更详细内容将会在第 16 章介绍。 > **专栏** > **nil 是什么** > `nil` 是一个特殊的值,表示对象不存在。像在正则表达式中表示无法匹配成功一样,方法不能返回有意义的值时就会返回 `nil`。另外,从数组或者散列里获取对象时,若指定不存在的索引或者键,则得到的返回值也是 `nil`。 > > **执行示例** ~~~ > irb --simple-prompt >> hash = {"a"=>1, "b"=>2} => {"a"=>1, "b"=>2} >> hash["c"] => nil ~~~ > `if` 语句和 `while` 语句在判断条件时,如果碰到 `false` 和 `nil`,则会认为是“假”,除此以外的都认为是“真”。因此,除了可以使用返回 `true` 或者 `false` 的方法,也可以使用“返回某个值”或者返回“`nil`”的方法作为判断条件表达式。 > **代码清单 print_hayasi.rb** ~~~ names = ["小林", "林", "高野", "森冈"] ["小林", "林", "高野", "森冈"] names.each do |name| if / 林/ =~ name puts name end end ~~~ > > **执行示例** ~~~ > ruby print_hayasi.rb 小林 林 ~~~