阿里云基础设施高可用最佳实践沙龙深圳站圆满举办!

摘要:2024 年 11 月 28 日,阿里云基础设施高可用最佳实践沙龙 NO.1 :《构建云上高可用数据中心:从原子能力到场景架构的实战之旅》在深圳东海朗廷酒店顺利举行。活动现场,来自阿里云计算、存储、网络、云原生的专家们分享了高可用的基础知识与分级,阿里云产品的

云布道师

构建云上高可用数据中心:从原子能力到场景架构的实战之旅

2024 年 11 月 28 日,阿里云基础设施高可用最佳实践沙龙 NO.1 :《构建云上高可用数据中心:从原子能力到场景架构的实战之旅》深圳东海朗廷酒店顺利举行。活动现场,来自阿里云计算、存储、网络、云原生的专家们分享了高可用的基础知识与分级,阿里云产品的原子能力以及面向不同场景的云端高可用架构最佳实践等丰富的内容。吸引了来自华南地区的数十家企业 CTO 、架构师、技术从业者到场,现场近距离与阿里云专家探讨交流业务问题和技术发展。

在沙龙上,阿里云华南大区企业解决方案总监邱经忠发表了开场致辞,热情欢迎大家的到场,同时分享了对当前行业发展趋势的见解和阿里云在推动企业构建云上高可用数据中心方面的积极探索与成果,鼓励与会者积极交流,共同探讨未来的合作机会。

阿里云智能高级产品专家李媛分享了《企业建设高可用能力的必要性与架构分级》,为了保证业务的连续性,应对各种意外的发生,企业需要加强IT架构高可用能力的建设。同时,高可用架构分为数据备份容灾、故障切换、应用双活等多个等级,不同的等级也对应不同的 RPO / RTO 及成本,企业应该根据自身的业务或合规需求进行选择。

接着是《面向不同场景的阿里云高可用设计方案》的主题分享,阿里云智能云网络高级解决方案架构师潘志新、阿里云智能弹性计算解决方案架构师储依帆、阿里云智能高级产品专家李媛、阿里云智能存储解决方案架构师王太平这四位专家为我们进行了不同层面的技术分享。

阿里云智能弹性计算解决方案架构师储依帆介绍了企业级应用架构高可用设计的六个关键要素,涵盖云上集群管控、工作负载平面等。他详细阐述了阿里云在虚拟机和容器环境的高可用方案能力。在虚拟机环境中,结合全量和增量快照、多版本和备份恢复能力,实现了多 AZ 、多地域的高可用设计。在容器环境中,介绍了 ACK 的控制面组件,包括跨可用区部署的 etcd 和 API Server 的高可用设计。此外,结合 ACK One 与 ALB/MSE Ingress ,实现ACK单域的故障隔离和跨集群应用的快速恢复,完成跨地域多集群的云上高可用架构 ;ACK 备份中心在多云/混合云环境下,支持K8s集群的快速备份与恢复。

阿里云智能高级产品专家李媛还为大家带来了企业灾备管理服务-数据灾备中心和阿里云统一灾备平台-云备份两款产品方案的讲解。针对企业的混合云或者公共云环境,云备份提供策略化备份归档上云、云上备份容灾等全方位能力,同时一系列企业级能力如跨账号备份、不可变备份、备份点病毒检测、自动归档等可以帮助企业搭建更易用、合规、降本增效的备份架构。数据灾备中心覆盖了多种 IAAS 层和 SAAS 化数据灾备方案,通过可视化界面、资源分类管理、集中化保护策略等方式助力企业更好地完善和规划阿里云上的数据保护架构。

基础不牢,地动山摇。阿里智能云网络高级解决方案架构师潘志新在现场跟大家分享了云网络作为用户云上业务的底层基础设施.整个云网络的设计和规划,直接决定了网络基础设施能否给业务提供各种场景下的容灾和弹性能力。云上网络在最基础的 VPC 设计层面,就需要考虑到 AZ 的设计,在不同的AZ都能够同时提供网络接入和服务能力。网元产品上,如负载均衡 NLB/ALB ,支持同时在多个可用区绑定公网 EIP ,为该 region 的业务提供冗余可靠的公网及内网服务能力。内网产品上,云企业网提供了全球互联网的组网能力,其部署的 overlay 快速重路由黑科技 zooroute ,能够让云企业网有一张底层全路径质量的全局视图,当物理层的设备和线路发生故障无法自行收敛恢复,需要人工介入, zooroute 会在 overlay 层面标记出这些路径,然后在实际流量转发过程中规避有问题的路径,从而帮助用户实现 99.995% 的云网络高可靠性。

阿里云智能存储解决方案架构师王太平介绍了 ESSD 同城冗余云盘( regional ESSD ),该云盘可以在多个可用区存储数据,实现高可用性和业务连续性,确保在物理故障时数据不丢失。相较于传统主备复制方案, ESSD 的部署方式消除了复制延迟和数据不一致的问题,且具有零改造成本的优势,能够帮助有状态应用轻松实现可用区级容灾能力。在互联网媒体娱乐行业,阿里云提供高可用的源站建设方案,特别是针对跨地域高可用存储需求,如视频点播客户,通过 OSS 的跨区域复制和传输加速来构建多活源站。最后,针对大型全球化企业的灾备需求,阿里云的 OSS 方案结合了跨区域复制、传输加速、存储和镜像回源,能支持全球范围内的数据持续复制和多读多写,满足跨境数据需求。

近年来,企业用户对系统稳定性的关注不断增加,尽管新技术层出不穷,重大故障依然屡见不鲜,且影响显著。阿里云智能云原生高级解决方案架构师卢萌凯分享了《云原生弹性高可用设计实践》,从四个方面探讨了如何提升系统稳定性和业务连续性:首先,介绍阿里巴巴利用技术手段和管理措施实现容错、容量和容灾以构建稳健的生产环境;其次,分享考虑故障场景的架构设计最佳实践;然后,讨论有效容量管理的设计与实践方案,以保障高峰期系统稳定;最后,探讨实现同城和异地多活的高可用设计。

茶歇过后,大家迎来了热烈的互动讨论环节。在此环节中,与会者围绕沙龙提出的话题,结合各自的业务场景,展开了深入且激烈的讨论。现场的客户代表踊跃发言,积极分享他们在技术应用中的思考与实践,进一步丰富了讨论的深度与广度。各小组的专家积极响应,给出了建设性的反馈和建议,促进了各方的思维碰撞与知识共享,推动了整个讨论的热烈气氛与成果的落地实施。通过这样的互动交流,大家不仅深化了对技术的理解,也为今后的合作奠定了更加坚实的基础。

活动结束后,来宾们领取了结业证书和伴手礼。通过这次活动,大家不仅对建设高可用能力的重要性有了深度了解,也学习了企业应该如何在阿里云上搭建高可用架构。基于公共云的弹性能力,很多本地机房难以解决的挑战都可以在云上找到更简单、更具性价比的解法。大家都十分期待参加下一次的沙龙活动,也将在未来企业 IT 架构的运维中,学以致用,让业务更连续。

来源:凌云时刻

相关推荐