柏睿实时云数仓之「性能优化篇」· 实战分享

柏睿实时云数仓性能优化篇来也！本文分享实战经验。前情可前往历史文章回顾～

RapidsDB在云端的整体优化，可以概括为计算、存柏睿分布式内存数据库储、网络三个方面，我们在这里分别做一些介绍。

再次强调我们优化的整体思路：虽然云计算号称“按需付费”，但如果不精打细算，使用成本反而会增加很多。因此我们在优化柏睿实时云数仓的主要思路是：在成本可控的情况下，通过优化相关的云资源，提升柏睿分布式内存数据库的性能。

一、计算如何优化？

在第二篇“根据CPU选云主机”中已介绍过如何选择CPU和云主机类型，对于“团队作战”的RapidsDB集群，单纯提升CPU 一点点频率效果不会很明显。

将数据库集群规模扩大，将任务分配到更多的数据库节点，这才是提升性能的最直接而有效的方法。由于是团队作战，所以要求所有数据库节点CPU和内存配置是统一的，以方便统一调度管理。

CPU与内存的配置比率，我们在“选择内存容量”中已介绍过，推荐1：4或1：8。但在数据库中还是需要一些优化设置的。

RapidsDB是一个高度可扩展的分布式系统，运行在Linux 系统中。在每个数据库节点，通过本节点的数据分区技术，实现多任务并行操作。例如在一个8vCPU的数据库云主机节点，数据的分区数据量为8。

最后再对操作系统做一些常规的优化，如打开文件数量等。由于一些云厂商会调整优化Linux内核，因此不建议调整云主机的内核。

下图是不同规模的实时云数仓集群，在TPC-H 500G的测试数据量性能报表，能看到整体计算性能随着节点数量的增加而提升。

二、存储如何优化？

在“选择云硬盘”中已介绍过如何选择硬盘，对于“团队作战”的RapidsDB集群，单纯提升云主机一点点IO能力，性能提升效果不会很明显。

将数据库的存储设置为独立磁盘，避免与其他程序同时读写同一磁盘，这将会大幅度提升数据库的存储能力。

如果在云中运行的RapidsDB所在的业务有很频繁的磁盘性能要求，可以通过在云主机中增加多块云硬盘，组成RAID 0，实现更高的读写性能。对于为什么不做RAID 5，可以参考柏睿实时云数仓的安全文章。

下图是不同规模的实时云数仓集群，从华为云存储加载数据的时间，能看到随着节点数量的增加，文件加载性能也有提升。

三、网络如何优化？

在“选择网络能力”中已介绍过如何选择网络，很多人认为云主机在内网通讯的速度会很快，但在实际测试过程中，我们还发现一个隐含的小问题：

云厂商在不同物理位置有区域，在每个区域中又有不同的可用区。比如华为云在北京四区有4个可用区。

虽然在北京四这个区域中，每个可用区之间的网络通信都是内网，但跨可用区网络通信时，网络延时会增加。下面是通过ping不同可用区之间的延时比较：

PING本可用区云主机延时

PING其他可用区云主机延时

从上面PING的测试数据能看到，跨可用区的网络访问对于柏睿云数仓这种分布式数据库来说，还是有网络影响的。如果需要高性能，还是将所有数据库节点部署在同一可用区，如果出于数据安全考虑，可以参考原柏睿实时云数仓的安全文章，使用数据多副本并将数据库节点部署在不同可用区。

最后，虽然在云计算环境中不建议调整网络帧大小，但可以对一些常规网络参数调整，如调整重试次数、FIN完成时间等。

下图是不同规模的实时云数仓集群，网络流量性能报表，能看到随着节点数量的增加，网络性能也有提升。

四、成本如何优化？

由于是团队作战，所以要求所有数据库节点配置是统一的，以方便统一调度管理。

随着集群规模的扩大，使用成本也会扩大。基于RapidsDB的实时云数仓，使用云原生微服务架构，支持在线弹性增加、删除数据库节点，用户在处理大型任务时弹性增加数据库集群规模，在不需要高性能计算时可以减少数据库集群规模，以实现云成本的优化。

守正出奇

最后，引用冯仑的自著《野蛮生长》中对“守正出奇”的修改：

“守正出奇”，“正”正路、正道，“奇”出人意料，“守正出奇”正道而行。突破思维、出奇制胜。就是用百分之七十的时间去想“正确”的优化方向，用百分之三十的时间研究运行环境与业务需求的变通。既不墨守成规，又有创新。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

标签：

猜你喜欢

柏睿实时云数仓之「性能优化篇」· 实战分享

都邦保险积极参与植树活动共同建设美好家园

美云智数水晶球场景化数据分析帮企业迅速锚定风险源头

都邦保险积极主动对接落实金融纾困政策

祝贺福建乐谷食品有限公司与跳水世界冠军刘甜成功续约

加持县域经济发展冷链物流如何服务国家战略？

疫情当前，货拉拉企业用行动彰显大爱的力量

汇景物业|汇景产业•智汇谷被认定为市重点招商园区丨东莞汇景

汇景物业|汇景•湾区5G智造港赋能区域新经济丨东莞汇景

平安银行贷款服务为小微企业排忧解难

值此国货美妆黄金时代朵拉朵尚正是扬帆起航时

致同国际：当前企业ESG信息披露与投资者预期存在差距

趣链科技搭建数字乡村区块链平台为实现乡村振兴战略增添力量

青年企业家曾佳文带领双亿实业出口贸易远销国外

蒙牛顺应健康需求趋势，瞄准国民体质健康营养新高地

融仕界祝贺优软集团荣获创业之家1530万种子轮领投

齐鲁晚报省版·头条报道【5.10中国品牌日】大圣驾到登榜“山东好品牌”

美洁高互联网口腔医院发展历程

产地鉴别保障服务来了！对庄翡翠承诺终身支持产地复验

95分App助力闲置交易行业发展，获权威媒体高度认可

佳士科技以数字化焊接打通新赛道，“焊”卫创新

突破数字营销边界钱小乐为金融机构实现与场景融合

后疫情时代，万单哥如何助力企业搭建自身流量池

老板金曲活动正式启动，打造不一样的K歌模式

盈康生命获增持实控人及一致行动人持股比例达40.66%

乐橙TA3延续了乐橙的高品质，多种功能安心又便利

热点图片

要闻

iPhone充电器平替好选择倍思氮化镓30W充电器充电快不伤电池
苹果为了响应环保的号召，现在iPhone系列都不再附带充电器，所以购买了iPhone的用户要
新华社客户端乡村振兴频道《匠心品牌对话》专题栏目上线
近日，新华社客户端乡村振兴频道上线全新对话访谈类视频专题栏目——《匠心品牌对话》
什么丰胸产品有效果？欧美挺助力百万女性美丽人生！
对于当代女性来说，追求美丽与健康，不仅是为悦人，更是为悦己。美丽不分年龄，优雅挺
欧美挺火爆招商进行中！
我是个身材高挑的女生，对自己的身材还是很有自信的。直到上了大学，我才发现由于太瘦
分享亲身丰胸经历，欧美挺值得信赖！
如果你想要丰胸，我可以肯定的告诉你，盲目丰胸用再多的方法都会以失败告终!请不要天
唯尔诺珠宝，让爱不再等待
随着人们生活水平的不断提高，珠宝配饰成为了人们生活中不可缺少的一部分，一件好的珠
多功能智能化居家生活带动家居产品“大换新”
升级智能扫地机器人、新型睡眠仪带动助眠黑科技、抽真空保鲜盒让食材保鲜期更长……居
贺冬冬携新品梦泉紫茉莉暗夜骑士系列产品全网首发
梦泉紫茉莉暗夜骑士系列，为夜间肌肤焕彩而来！5月20日，重磅首发，敬请关注！夜间护
梦泉新品巨献，贺冬冬这次竟然搞了这个大动作？
甜到发鼾的五月，还有什么能够比到处弥漫的花香和浓郁的情意更让人憧憬不已的呢？当然
盛世飘香——著名画家张德刚作品欣赏
【个人简介】张德刚，1957年4月生于山东省德州，号大缸道人。1983年毕业于山东艺术学

柏睿实时云数仓之「性能优化篇」· 实战分享

相关阅读

猜你喜欢

热点图片

要闻