ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
[TOC] # sqoop作业 事先定义好的数据导入导出任务按照指定流程运行 # 语法 以下是创建Sqoop作业的语法。 ~~~ $ sqoop job (generic-args) (job-args) [-- [subtool-name] (subtool-args)] $ sqoop-job (generic-args) (job-args) [-- [subtool-name] (subtool-args)] ~~~ # 创建作业(`--create`) 在这里,我们创建一个名为myjob,这可以从RDBMS表的数据导入到HDFS作业。 ~~~ sqoop job --create myjob -- import --connect jdbc:mysql://localhost:3306/userdb --username root --password root --table emp_conn_from_hdfs --m 1 ~~~ 该命令创建了一个从userdb 库的emp_conn_from_hdfs表导入到HDFS文件的作业。 # 验证作业 (`--list`) ‘--list’ 参数是用来验证保存的作业。下面的命令用来验证保存Sqoop作业的列表。 ~~~ $ sqoop job --list ~~~ 它显示了保存作业列表。 ~~~ Available jobs: myjob ~~~ # 检查作业(`--show`) `‘--show’`参数用于检查或验证特定的工作,及其详细信息。以下命令和样本输出用来验证一个名为myjob的作业。 ~~~ $ sqoop job --show myjob ~~~ 它显示了工具和它们的选择,这是使用在myjob中作业情况。 ~~~ Job: myjob Tool: import Options: ---------------------------- direct.import = true codegen.input.delimiters.record = 0 hdfs.append.dir = false db.table = employee ... incremental.last.value = 1206 ... ~~~ # 执行作业 (`--exec`) `‘--exec’ `选项用于执行保存的作业。下面的命令用于执行保存的作业称为myjob。 ~~~ $ sqoop job --exec myjob ~~~ 它会显示下面的输出。 ~~~ 10/08/19 13:08:45 INFO tool.CodeGenTool: Beginning code generation ... ~~~ # 删除job `--delete`选项用于删除保存的作业。下面的命令用于删除保存的作业称为myjob。 ~~~ $ sqoop job --delete myjob ~~~