阿里云OSS 可用性诊断排查

客户问题:

阿里云OSS 如何可用性诊断排查?

凯铧互联技术回复:

阿里云对象存储OSS(Object Storage Service)是阿里云提供的海量、安全、低成本、高可靠的云存储服务。其数据设计持久性不低于99.9999999999%(12个9),服务可用性(或业务连续性)不低于99.995%。目前发现您阿里云账号下的 Bucket 出现可用性(5xx)降低的潜在风险,建议您按照如下思路检查:

1、如果发现客户端侧出现 504/502/503 的场景,可以尝试 ping 延迟是否稳定、MTR 链路是否存在间接性丢包、telnet 服务端 80/443 端口是否正常通信。如果发现网络异常,需要先排除掉客户端的网络链路异常后再向下分析。

2、如果发现客户端侧出现 500 的场景并且复现频率较高,可以先通过 try catch 机制捕获到异常后合理进行重试,记录下异常的 requestID 尽快反馈到阿里云售后进行分析。

3、如果是 ECS 通过公网访问 OSS 出现了 5xx ,检查您的 ECS 是否有公网带宽超过限制、网卡持续跑满的情况。带宽超限后应及时扩容 ECS 带宽,避免带来业务影响。

4、检查 ECS 主机的网络连接数、文件描述符的数量是否出现瓶颈,可能导致 SocketTimeOut 的问题出现。根据主机的负载情况、实例规格,合理的设置并发数量,优化业务代码。

5、检查客户业务代码中初始化配置的, MaxConnections、SocketTimeout、ConnectionTimeout 参数是否合理,弱网情况下应该适当放大。

6、检查客户是否配置过 OSS 镜像回源功能,保证镜像回源的站点可以正常通信,尽量不要对 OSS 回源 IP 设置防火墙策略, OSS 镜像回源采用的是公网 IP 回源,定期会进行 IP 或者 IP 段的更换,如果客户的原站设置了防火墙,可能出现 5xx 的回源超时

 
 

以上就是阿里云OSS 如何可用性诊断排查的说明。阿里云代理商凯铧互联提供阿里云服务器/企业邮箱等阿里云全线产品的代购服务,为您提供阿里云产品专属优惠折扣,通过凯铧互联购买可以获得折上折,若您需要帮助可以直接联系我方客服!同样的品质,更多贴心的服务,阿里云代理商凯铧互联专业技术团队同时为您提供便捷专业的7x24一对一专业全面的技术服务。 电话专线:136-5130-9831,QQ:3398234753。

为什么选择我们:北京凯铧互联科技有限公司(简称凯铧互联)由多名前阿里云资深技术专家创立,核心员工来自阿里巴巴、腾讯等,作为阿里云,华为云,腾讯云,百度云,金山云,华为云重要的合作伙伴,专注于为企业用户提供云计算及基于云服务器的解决方案。总部设在北京,并在内蒙设有办事处。做为一家综合性方案商,凯铧互联向各行业用户提供基于云服务器的各种解决方案。为用户获得优质服务的同时,秉承"专业规划、周到服务"的服务理念,根据用户的实际情况,充分考虑各种网络资源的特点及功效,为用户量身定做一套适合于其实际应用需求的网络应用方案。帮助用户利用互联网的力量展开新的营销方式,并大大缩短了项目实施周期,获得用户的一致好评。 

本公司销售:阿里云、腾讯云、百度云、天翼云、金山大米云、金山企业云盘!可签订合同,开具发票。
?