48 Star 500 Fork 228

GVP袋鼠云 / chunjun

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
odpsreader.md 3.95 KB
一键复制 编辑 原始数据 按行查看 历史
tudou 提交于 2021-02-05 18:05 . 1、新增Oracle LogMiner实时采集插件

ODPS Reader

一、插件名称

名称:odpsreader

二、参数说明

  • table
    • 描述:读取数据表的表名称(大小写不敏感)
    • 必选:是
    • 字段类型:string
    • 默认值:无

  • partition
    • 描述:读取数据所在的分区信息,支持linux shell通配符,包括 * 表示0个或多个字符,?代表任意一个字符。例如现在有分区表 test,其存在 pt=1,ds=hangzhou   pt=1,ds=shanghai   pt=2,ds=hangzhou   pt=2,ds=beijing 四个分区,如果你想读取 pt=1,ds=shanghai 这个分区的数据,那么你应该配置为: "partition":"pt=1,ds=shanghai"; 如果你想读取 pt=1下的所有分区,那么你应该配置为: "partition":"pt=1,ds=* ";如果你想读取整个 test 表的所有分区的数据,那么你应该配置为: "partition":"pt=*,ds=*"
    • 注意:如果表为分区表,则必填。如果表为非分区表,则不能填写
    • 必选:否
    • 字段类型:string
    • 默认值:无

  • column
    • 描述:需要读取的字段。
    • 格式:支持3种格式

1.读取全部字段,如果字段数量很多,可以使用下面的写法:

"column":[*]

2.只指定字段名称:

"column":["id","name"]

3.指定具体信息:

"column": [{
    "name": "col",
    "type": "datetime",
    "format": "yyyy-MM-dd hh:mm:ss",
    "value": "value"
}]
  • 属性说明:
    • name:字段名称
    • type:字段类型,可以和数据库里的字段类型不一样,程序会做一次类型转换
    • format:如果字段是时间字符串,可以指定时间的格式,将字段类型转为日期格式返回
    • value:如果数据库里不存在指定的字段,则会把value的值作为常量列返回,如果指定的字段存在,当指定字段的值为null时,会以此value值作为默认值返回
  • 必选:是
  • 字段类型:数组
  • 默认值:无

  • odpsConfig
    • 描述:ODPS的配置信息
    • 必选:是
    • 字段类型 map
    • 默认值:无
    • 可选配置:
      • odpsServer
      • accessId
        • 描述:ODPS系统登录ID
        • 必选:是
        • 字段类型 string
        • 默认值:无
      • accessKey
        • 描述:ODPS系统登录Key
        • 必选:是
        • 字段类型 string
        • 默认值:无
      • project
        • 描述:读取数据表所在的 ODPS 项目名称(大小写不敏感)
        • 必选:是
        • 字段类型 string
        • 默认值:无
      • packageAuthorizedProject
        • 描述:读取数据表所在的 ODPS 项目名称(大小写不敏感)
        • 注意:当 **packageAuthorizedProject **不为空时,当前project取packageAuthorizedProject对应值 而不是 project 对应的值
        • 必选:否
        • 字段类型 string
        • 默认值:无
      • accountType
        • 描述:account类型
        • 注意:目前只支持 aliyun 类型
        • 必选:否
        • 字段类型 string
        • 默认值:aliyun

三、配置示例

{
  "job" : {
    "content" : [ {
      "reader" : {
        "name": "odpsreader",
        "parameter": {
          "odpsConfig": {
            "accessId": "${odps.accessId}",
            "accessKey": "${odps.accessKey}",
            "project": "${odps.project}"
          },
          "table": "tableTest",
          "partition": "pt='xxooxx'",
          "column": [{
            "name": "col1",
            "type": "string",
            "value":"xx",
            "format":"yyyy-MM-dd HH:mm:ss"

          }]
        }
      },
      "writer" : {
        "parameter" : {
          "print" : true
        },
        "name" : "streamwriter"
      }
    } ],
    "setting" : {
      "restore" : {
        "isRestore" : false
      },
      "speed" : {
        "channel" : 1
      }
    }
  }
}
Java
1
https://gitee.com/dtstack_dev_0/chunjun.git
git@gitee.com:dtstack_dev_0/chunjun.git
dtstack_dev_0
chunjun
chunjun
1.10_release

搜索帮助