阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

MySQL MaxCompute与AnalyticDB实现数据处理与转换过程

73次阅读
没有评论

共计 2132 个字符,预计需要花费 6 分钟才能阅读完成。

导读 AnalyticDB MySQL(简称 ads)与 MaxCompute(简称 odps)进行数据转换时,个别语法有差别,记录下来,方便备查,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习吧
1、行转列函数

odps 中行转列函数 wm_concat,将列信息转成行显示,可指定分隔符。

语法格式

wm_concat(separator, string),其中 separator 为分隔符,支持字符串去重,即 distinct.

select wm_concat('|',sku_id)
from t_business_order_odps
where
create_time >= '2022-09-30 00:00:00';

ads 中行转列函数 group_concat,即将列信息转成行显示,默认逗号分隔。如在 mysql 中查询表的所有列名。

select group_concat(COLUMN_NAME)
from information_schema.COLUMNS
where
TABLE_NAME = 't_business_order';
2、判空函数

odps 中判空函数 coalesce,如若无运费,则显示为 0。

select coalesce(freight_amount,0)
from t_business_order_odps
where
create_time >= '2022-09-30 00:00:00';

odps 中判断函数 decode,如若无运费,则显示为 0。

语法格式

decode(expression, search, result[, search, result]…[, default])

表示:三元运算符,即实现 IF-THEN-ELSE 分支选择的功能

select decode(order_amount,freight_amount,0)
from t_business_order_odps
where
create_time >= '2022-09-30 00:00:00';

ads 中判空函数 ifnull,如若无运费,则显示为 0。

select ifnull(freight_amount,0)
from t_business_order
where
create_time >= '2022-09-30 00:00:00';
3、时间函数

odps 中 时间字段类型为 datetime,获取当前时间函数为 getdate()。

select coalesce(freight_amount,0),getdate() as etl_time
from t_business_order_odps
where
create_time >= '2022-09-30 00:00:00';

ads 中时间字段类型为 timestamp,获取当前时间函数为 now()。

select ifnull(freight_amount,0),now() as etl_time
from t_business_order
where
create_time >= '2022-09-30 00:00:00';
4、建表语句

odps 中 字符串字段类型为 string,时间字段类型为 datetime。

CREATE TABLE t_business_order_odps (
    prov_name string COMMENT '省名称',
    city_name string COMMENT '地市名',
    cty_name string COMMENT '区县名称',
    order_no string COMMENT '订单号',
    order_amount bigint COMMENT '运费',
    freight bigint COMMENT '运费',
    insert_month bigint COMMENT '插入月份',
    created_time datetime COMMENT '创建时间'
)
COMMENT ' 业务订单主表;

ads 中字符串字段类型为 varchar,时间字段类型为 timestamp。

CREATE TABLE t_business_orde (
    prov_name varchar COMMENT '省名称',
    city_name varchar COMMENT '地市名',
    cty_name varchar COMMENT '区县名称',
    order_no varchar COMMENT '订单号',
    order_amount bigint COMMENT '运费',
    freight bigint COMMENT '运费',
    insert_month bigint COMMENT '插入月份',
    created_time timestamp COMMENT '创建时间'
)
PARTITION BY HASH KEY (order_no) PARTITION NUM 128
TABLEGROUP ads_sc_rpt
OPTIONS (UPDATETYPE='batch')
COMMENT '业务订单主表';

知识梳理

OPTIONS 类型有两种

1)batch 批量表,即数据批量入库,适用于从 odps 同步到 ads;

2)realtime 实时表,即数据单条入库,适用于日志等信息单条入库。

阿里云 2 核 2G 服务器 3M 带宽 61 元 1 年,有高配

腾讯云新客低至 82 元 / 年,老客户 99 元 / 年

代金券:在阿里云专用满减优惠券

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2024-07-24发表,共计2132字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中