代码拉取完成,页面将自动刷新
目前大数据领域,基于HDFS文件系统的主流文件格式有ORC及PARQUET。openGauss主要支持ORC和Parquet文件格式。用户利用HIVE将数据导入HDFS文件系统后存储为ORC或Parquet文件格式,使用openGauss对ORC或Parquet文件内的数据进行查询分析,这样需要在ORC或Parquet文件格式支持的数据类型与openGauss自身支持数据类型间进行匹配,匹配状况如表1所示:
表 1 数据类型匹配关系
须知:
- openGauss HDFS外表支持NULL定义,HIVE数据表支持并采用相对应的NULL定义。
- openGauss HDFS外表的日期和时间类型,不支持时区定义,HIVE不支持时区定义。
- HIVE中date类型只有日期,没有时间,openGauss的date类型包含日期和时间。
- openGauss支持ORC的压缩格式,包括ZLIB,SNAPPY,LZ4及NONE压缩方式。
- openGauss支持Parquet的压缩格式,包括SNAPPY及NONE压缩方式。
- 其中FLOAT4格式本身存在不精准问题,求和等操作在不同环境下可能产生不同的结果,在高精度要求场景下建议使用DECIMAL类型代替。
- 兼容Teradata数据库模式下,HDFS外表不支持DATE类型。
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。