### 有效地分发 cron 任务
当你有许多服务器需要执行相同的 cron 作业时,不在同一时间运行它们通常是个好主意。 如果所有作业都要访问一个公共服务器,就会给该服务器带来大量负载, 即使这些服务器不会同时访问公共服务器,所有服务器也会在同一时间处于繁忙状态, 这可能会削减它们提供其他服务的能力。
Puppet 的 inline_template 函数允许我们使用 Ruby 的逻辑根据主机名为 cron 作业设置不同的运行时间。
#### 操作步骤
1. 在一个节点中添加如下代码:
```
define cron_random( $command, $hour )
{
cron { $name:
command => $command,
minute => inline_template("<%= (hostname+name).hash.abs %60 %>"),
hour => $hour,
ensure => "present",
}
}
cron_random { "hello-world":
command => "/bin/echo 'Hello world'",
hour => 2,
}
cron_random { "hello-world-2":
command => "/bin/echo 'Hello world'",
hour => 1,
}
```
2. 运行 Puppet:
```
# puppet agent --test
info: Retrieving plugin
info: Caching catalog for cookbook.bitfieldconsulting.com
info: Applying configuration version '1305713506'
notice: /Stage[main]//Node[cookbook]/Cron_random[hello-world]/
Cron[hello-world]/ensure: created
notice: /Stage[main]//Node[cookbook]/Cron_random[hello-world-2]/
Cron[hello-world-2]/ensure: created
notice: Finished catalog run in 1.07 seconds
```
3. 检查 crontab 查看是否成功地配置了 cron 作业:
```
# crontab -l
# HEADER: This file was autogenerated at Fri Jul 29 10:58:45 +0000
2011 by puppet.
# HEADER: While it can still be managed manually, it is definitely
not recommended.
# HEADER: Note particularly that the comments starting with
'Puppet Name' should
# HEADER: not be deleted, as doing so could cause duplicate cron
jobs.
# Puppet Name: hello-world
25 2 * * * /bin/echo 'Hello world'
# Puppet Name: hello-world-2
49 1 * * * /bin/echo 'Hello world'
```
#### 工作原理
我们想要为每个 cron 作业选择一个 **随机的** 执行分钟数; 而不是真正的随机 (或者说,不是每次运行 Puppet 都会改变 cron 作业的运行时间), 但这也或多或少地保证了每个主机上的每个 cron 作业运行时间的不同。
我们可以使用 Ruby 的 hash 方法实现它,它会对任何对象(本例为一个字符串)计算出一个哈希值。 尽管看上去这个哈希值是随机的,但它每次运行时都相同,所以当再次运行 Puppet 时其值不会改变。
哈希值生成的是一个大整数,而我们想要的是一个 0 到 59 之间的整数,所以我们使用了 Ruby 的 % (模)运算符将其结果限制在这个范围内。因为只有 60 种可能的值,尽管 hash 函数被设计为尽可能产生随机的输出,还是会有些许的碰撞而且这些碰撞对于 minute 应该是均匀分布的。
因为我们希望每个哈希值在不同的主机上是不同的,所以使用主机名做 hash 处理。 然而,我们还希望同一台主机上的不同作业的哈希值也不同,所以联合使用了主机名和作业名 (例如 hello-world)做 hash 处理。
#### 更多用法
在本例中,我们仅对 cron 作业的 minute 进行了随机化,并将 hour 作为 define 定义的一部分。若你同时希望指定要在周几运行,可以在 cron_random 中添加一个附加参数来指定, 可以像下面这样为其指定默认值:
```
define cron_random( $command, $hour, $weekday = "*" ) {
```
若你想要对 cron 作业的 hour 进行随机化(例如:要做的作业可以在一天之内的任何时间执行, 并且必须将它们均匀分布在所有的 24 个小时上),可以对 cron_random 做如下修改:
```
hour => inline_template("<%= (hostname+name).hash.abs % 24 %>"),
```
#### 参见本书
* 第 1 章的 [从 cron 运行 Puppet](#ch01sec05) 一节
- Puppet 2.7 Cookbook 中文版
- 中文翻译版
- 译者序
- 项目缘起
- 翻译方法
- 社区链接
- 社区建议
- 贡献者
- 原书版权页
- 关于作者
- 前言
- 本书内容
- 阅读前提
- 适用读者
- 格式约定
- 读者反馈
- 客户支持
- 下载案例代码
- 勘误表
- Puppet 基础设施
- 使用版本控制
- 使用提交钩子
- 使用 Rake 部署变更
- 配置 Puppet 的文件服务器
- 从 cron 运行 Puppet
- 使用自动签名
- 预签名证书
- 从 Puppet 的 filebucket 检索文件
- 使用 Passenger 扩展 Puppet 的部署规模
- 创建去中心化的分布式 Puppet 架构
- 监控、报告和排错
- 生成报告
- 通过 Email 发送包含特定标签的日志信息
- 创建图形化报告
- 自动生成 HTML 文档
- 绘制依赖关系图
- 测试你的 Puppet 配置清单
- 执行模拟运行
- 检测编译错误
- 理解 Puppet 的错误信息
- 显示命令的输出结果
- 输出调试信息
- 检查配置设置
- 使用标签
- 使用运行阶段
- 使用不同的环境
- Puppet 语言及其写作风格
- 使用 Puppet 社区规范
- 使用模块
- 使用标准的命名规范
- 使用嵌入式 Ruby 代码
- 使用纯 Ruby 代码书写配置清单
- 遍历多个项目
- 书写强大的条件语句
- 在 if 语句中使用正则表达式
- 使用选择器和 case 语句
- 检测字符串中是否包含指定的值
- 使用正则表达式替换
- 书写更优质的配置清单
- 使用资源的数组
- 使用 define 资源
- 指定资源的依赖关系
- 使用节点继承
- 使用类的继承和重载
- 给类传递参数
- 书写可重用的跨平台配置清单
- 获得系统的环境信息
- 导入动态信息
- 从 CSV 文件导入数据
- 给 Shell 命令传递参数
- 使用文件和软件包
- 为配置文件添加配置行
- 使用 Augeas 自动修改配置文件
- 使用配置片段构建配置文件
- 使用 ERB 模板
- 在模板中遍历数组
- 从第三方仓库安装软件包
- 配置 APT 软件仓库
- 配置 GEM 仓库
- 从源码包自动构建软件
- 比较软件包的版本
- 用户和虚拟资源
- 使用虚拟资源
- 使用虚拟资源管理用户
- 管理用户基于密钥的 SSH 访问
- 管理用户的自定义文件
- 有效地分发 cron 任务
- 当文件更新时运行命令
- 使用主机资源
- 为文件资源指定多个源
- 使用文件资源递归地分发整个目录树
- 清理过期的旧文件
- 使用日程表资源
- 资源的审计
- 临时禁用资源
- 管理时区
- 应用程序
- 管理 Apache 服务
- 创建 Apache 虚拟主机
- 创建 Nginx 虚拟主机
- 创建 MySQL 数据库及用户
- 管理 Drupal 站点
- 管理 Rails 应用程序
- 服务器和云基础设施
- 部署 Nagios 监控服务器
- 使用 Heartbeat 构建高可用服务
- 管理 NFS 服务和文件共享
- 使用 HAProxy 为多个 web 服务器实现负载均衡
- 使用 iptables 管理防火墙
- 管理 Amazon 的 EC2 实例
- 使用 Vagrant 管理虚拟机
- 外部工具和 Puppet 生态环境
- 创建 Facter 的自定义 fact
- 在运行 Puppet 之前和之后执行命令
- 从 Shell 会话生成 Puppet 配置清单
- 从运行的系统上生成 Puppet 配置清单
- 使用 Puppet Dashboard
- 使用 Foreman
- 使用 MCollective
- 使用公共模块
- 使用外部节点分类器
- 创建自定义的资源类型
- 创建自定义的提供者