ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
[TOC] # 增量导入 增量导入是仅导入新添加的表中的行的技术。 它需要添加`'incremental', 'check-column', `和` 'last-value'`选项来执行增量导入。 下面的语法用于Sqoop导入命令增量选项。 ~~~ --incremental <mode> --check-column <column name> --last value <last check column value> ~~~ 假设新添加的数据转换成emp表如下: `1206,satish p,grp des,20000,GR` 下面的命令用于在emp表执行增量导入。 ~~~ sqoop import \ --connect jdbc:mysql://master:3306/userdb \ --username root \ --password root \ --table emp --m 1 \ --target-dir /emp_append \ --incremental append \ --check-column id \ --last-value 1203 ~~~ 那个id那一列,也就是按照那一列增量导入的,最好是int,可比较性 `--incremental append`表示要增量导入 `--check-column id`表示要按照那一列增量导入 `--last-value 1203`上一列的值是1203,表示这次是从这个往后面 # 根据时间增量导入 ~~~ sqoop import \ --connect jdbc:mysql://master:3306/company \ --username root \ --password root \ --table staff \ --check-column last_modified \ --incremental lastmodified \ --last-value "2017-09-28 22:20:38" \ --m 1 \ --append ~~~ 根据属性last_modified来增量导入,时间是last-value 使用last_modified方式导入数据要指定增量数据是要`--append`(追加)还是要`--merge-key`(合并) `--incremental lastmodified`模式下last-value指定的值是会包含于增量导入的数据中