springcloud之Feign、ribbon如何设置超时时间和重试机制
作者:NPException
Feign、ribbon设置超时时间和重试机制
前言
我们在微服务调用服务的时候,会使用feign和ribbon,比如有一个实例发生了故障而该情况还没有被服务治理机制及时的发现和摘除,这时候客户端访问该节点的时候自然会失败。
所以,为了构建更为健壮的应用系统,我们希望当请求失败的时候能够有一定策略的重试机制,而不是直接返回失败。
先看一个配置:
#预加载配置,默认为懒加载 ribbon: eager-load: enabled: true clients: zoo-plus-email zoo-plus-email: ribbon: # 代表Ribbon使用的负载均衡策略 NFLoadBalancerRuleClassName: com.netflix.loadbalancer.RandomRule # 每台服务器最多重试次数,但是首次调用不包括在内 MaxAutoRetries: 1 # 最多重试多少台服务器 MaxAutoRetriesNextServer: 1 # 无论是请求超时或者socket read timeout都进行重试 OkToRetryOnAllOperations: true ReadTimeout: 3000 ConnectTimeout: 3000 hystrix: command: default: execution: isolation: thread: timeoutInMilliseconds: 4000
一般情况下 都是 ribbon 的超时时间(<)hystrix的超时时间(因为涉及到ribbon的重试机制)
Feign重试:
因为ribbon的重试机制和Feign的重试机制有冲突,所以源码中默认关闭Feign的重试机制,具体看一看源码
要开启Feign的重试机制如下:(Feign默认重试五次 源码中有)
@Bean Retryer feignRetryer() { return new Retryer.Default(); }
ribbon的重试机制 :
ribbon: ReadTimeout: 3000 ConnectTimeout: 3000 MaxAutoRetries: 1 #同一台实例最大重试次数,不包括首次调用 MaxAutoRetriesNextServer: 1 #重试负载均衡其他的实例最大重试次数,不包括首次调用 OkToRetryOnAllOperations: false #是否所有操作都重试
计算重试的次数:
MaxAutoRetries+MaxAutoRetriesNextServer+(MaxAutoRetries *MaxAutoRetriesNextServer)
即重试3次 加上第一次调用一共产生4次调用 。
注意:如果在重试期间,时间超过了hystrix的超时时间,便会立即执行熔断,fallback。所以要根据上面配置的参数计算hystrix的超时时间,使得在重试期间不能达到hystrix的超时时间,不然重试机制就会没有意义 。
hystrix超时时间的计算:
(1 + MaxAutoRetries + MaxAutoRetriesNextServer) * ReadTimeout
即按照以上的配置 hystrix的超时时间应该配置为 (1+1+1)*3=9秒
当ribbon超时后且hystrix没有超时,便会采取重试机制。当OkToRetryOnAllOperations设置为false时,只会对get请求进行重试。如果设置为true,便会对所有的请求进行重试,如果是put或post等写操作,如果服务器接口没做幂等性,会产生不好的结果,所以OkToRetryOnAllOperations慎用。
如果不配置ribbon的重试次数,默认会重试一次
注意: 默认情况下,GET方式请求无论是连接异常还是读取异常,都会进行重试 ,非GET方式请求,只有连接异常时,才会进行重试
Feign、Ribbon、Hystrix三者超时时间配置
Feign设置
feign: hystrix: enabled: true client: config: # 全局配置 default: connectTimeout: 5000 readTimeout: 5000 # 实例配置,feignName即@feignclient中的value,也就是服务名 feignName: connectTimeout: 5000 readTimeout: 5000
Ribbon设置
# 全局配置 ribbon: # 单个服务最大重试次数,不包含对单个服务的第一次请求,默认0 MaxAutoRetries: 3 # 服务切换次数,不包含最初的服务,如果服务注册列表小于 nextServer count 那么会循环请求 A > B > A,默认1 MaxAutoRetriesNextServer: 2 #是否所有操作都进行重试,默认只重试get请求,如果修改为true,则需注意post\put等接口幂等性 OkToRetryOnAllOperations: false #连接超时时间,单位为毫秒,默认2秒 ConnectTimeout: 3000 #读取的超时时间,单位为毫秒,默认5秒 ReadTimeout: 3000 # 实例配置 clientName: ribbon: MaxAutoRetries: 5 MaxAutoRetriesNextServer: 3 OkToRetryOnAllOperations: false ConnectTimeout: 3000 ReadTimeout: 3000
Hystrix设置
hystrix: command: #全局默认配置 default: #线程隔离相关 execution: timeout: #是否给方法执行设置超时时间,默认为true。一般我们不要改。 enabled: true isolation: #配置请求隔离的方式,这里是默认的线程池方式。还有一种信号量的方式semaphore。 strategy: THREAD thread: #方式执行的超时时间,默认为1000毫秒,在实际场景中需要根据情况设置 timeoutInMilliseconds: 10000 # 实例配置 HystrixCommandKey: execution: timeout: enabled: true isolation: strategy: THREAD thread: timeoutInMilliseconds: 10000
Feign重试和Ribbon重试
feign自身重试目前只有一个简单的实现Retryer.Default,包含三个属性:
maxAttempts
:重试次数,包含第一次period
:重试初始间隔时间,单位毫秒maxPeriod
:重试最大间隔时间,单位毫秒
ribbon重试包含两个属性:MaxAutoRetries和MaxAutoRetriesNextServer
总重试次数= 访问的服务器数 * 单台服务器最大重试次数
即:(1+MaxAutoRetriesNextServer)*(1+MaxAutoRetries )
按上面实例的配置,则总重试次数 =(1+2)*(1+3) = 12
超时时间设置
feign和ribbon的超时时间只会有一个生效,规则:如果没有设置过feign超时,也就是等于默认值的时候,就会读取ribbon的配置,使用ribbon的超时时间和重试设置。否则使用feign自身的设置。两者是二选一的,且feign优先。
以Ribbon的时间生效为例,Hystrix的超时时间需大于Ribbon重试总和时间,否则重试将失效,即: Hystrix超时时间 > (Ribbon超时时间总和)*重试次数
按上面的例子,hystrix超时时间>12*(3000+3000)
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。