中通快递 重构了订单和运单中心的数据架构,每一个节点都支持横向扩展,解决了单点问题,同时降低了 IT 成本。通过 Spark 实时计算接入消息,与 Hive 维表在分布式计算里面做 Merge 和 JOIN,同时和离线的 T+1 以及 HBase 数据做 Merge 计算,把最终计算结果存入 TiDB。依赖 TiSpark 在 TiDB 上做数据的统计分析,轻度汇总和多维汇总基于 TiDB API 接口来提供服务。
业务挑战
整个物流的全链路流程会拆解成多个关键节点,每个关键节点会产生大量数据。中通快递原有架构中,大量的数据统计分析依赖于在 Oracle 上建大量存储过程,随着数据量增大,存储和计算的问题凸显,单纯靠升级 Exadata 硬件无法从根本上解决问题,并且随着硬件的升级,成本变得更加高昂。
应用场景
中通快递 重构了订单和运单中心的数据架构,每一个节点都支持横向扩展,解决了单点问题,同时降低了 IT 成本。通过 Spark 实时计算接入消息,与 Hive 维表在分布式计算里面做 Merge 和 JOIN,同时和离线的 T+1 以及 HBase 数据做 Merge 计算,把最终计算结果存入 TiDB。依赖 TiSpark 在 TiDB 上做数据的统计分析,轻度汇总和多维汇总基于 TiDB API 接口来提供服务。
在二次配送环节,需要针对每一单快件进行全链路的路由和时效预测,对时效性要求很高。中通快递基于 TiDB 建设实时数仓,业务的 OLTP 数据通过 TiDB 实时写入,OLAP 的业务通过 TiSpark 做分钟级的分析。经过业务实测,TiSpark 同步 3 亿条数据到 Hive 大概需要 10 分钟,有效支撑全链路的时效分析与监控,准实时地定位每一票快件在每一个环节的状态。
用户收益
增效:IT 支持效率提升 300%
在 2019 年双十一大促中,TiDB 同时支撑线上 OLTP 和 OLAP 的业务, QPS 峰值在 12 万+,支持百亿级的插入和更新,TiSpark 支持业务在线的分钟级统计分析,完美保障了双十一中通快递 IT 服务的稳定运行。
降本:数据驱动精细化运营,成本同比降低 17.1%
目前 中通快递 有超过 100 个物理节点,200 余个 TiDB 实例投入生产,主要服务账单、结算中心、订单中心、运单中心、消息中心、转运智能相关产品线,数据驱动的精细化管理措施持续发挥效益,2020 年二季度,单票成本同比下降 17.1%。