Spring Cloud Hystrix是用于做微服务之间服务短路,服务限流,服务降级,服务容错等的组件,为了避免在庞大微服务系统中,因为某一服务依赖出现异常导致全盘崩溃的严重问题。
1.快速入门
@EnableCircuitBreaker
@EnableDiscoveryClient
@SpringBootApplication
public class ConsumerApplication {
@Bean
@LoadBalanced
RestTemplate restTemplate () {
return new RestTemplate ();
}
public static void main(String[] args) {
SpringApplication.run(ConsumerApplication.class, args);
}
}
- 使用@EnableCircuitBreaker开启断路器
注意:这里还可以直接使用@SpringCloudApplication来开启断路器 他相当于我们上面加的三个注解,也就是说Spring Cloud应用默认包含了服务发现和断路器功能
@SpringBootApplication
@EnableDiscoveryClient
@EnableCircuitBreaker
public interface SpringCloudApplication {
}
- 改造服务消费方式 新增 HelloService 类, 注入RestTemplate 实例。 然后在 helloService 函数上增加@HystrixCommand 注解来指定降级方法,最后就可以在调用的Controller中注入该service进行函数式调用即可。
@Service
public class HelloService {
@Autowired
RestTemplate restTemplate;
@HystrixCommand(fallbackMethod = "helloFallback")
public String helloService() {
return restTemplate.getForEntity("http://HELLO-SERVICE/hello", String.class) .getBody();
}
public String helloFallback () (
return "error";
}
}
- Hystrix默认超时时间2000ms,我们可以在HELLO-SERVICE服务的 /hello接口中随机sleep 1000-3000ms来模拟超时降级,返回error情况。
2.原理分析
本文先研究Hystrix断路器功能,所以对一些流程先讲个概念,可以先行跳过到断路器源码处继续阅读。
-
创建HystrixCommand或HystrixObservableCommand对象,使用了Command设计模式来构造请求。
-
简要区别: • HystrixCommand: 用在依赖的服务返回单个操作结果的时候。 • HystrixObservableCommand: 用在依赖的服务返回多个操作结果的时候。
-
HystrixCommand命令执行 HystrixCommand包含了下面两个命令 • execute (): 同步执行,从依赖的服务 返回一个单 一的结果对象, 或是在发生错误 的时候抛出异常。 • queue (): 异步执行,直接返回 一个Future对象, 其中包含了服务 执行 结束时要 返回的单 一 结果对象。
R value = command.execute() ;
Future<R> fValue = command.queue() ;
- HystrixObservableCommand命令执行 HystrixObservableCommand包含这两个命令 • observe () : 返回Observable对象,它代表了操作的多个结果,它是一个Hot Observable。 • toObservable(): 同样会返回Observable对象, 也代表了操作的多个结果, 但它返回的是一个Cold Observable。
Observable<R> ohValue = command.observe(};
Observable<R> ocValue = command.toObservable(}
-
结果是否被缓存 若当前命令的请求缓存功能是被启用的, 并且该命令缓存命中, 那么缓存的结果会立 即以Observable 对象的形式返回。
-
断路器是否打开 在命令结果没有缓存命中的时候, Hystrix在执行命令前需要检查断路器是否为打开状态: • 如果断路器是打开的,那么Hystrix不会执行命令,而是转接到fallback处理逻辑 • 如果断路器是关闭的, 那么Hystrix继续执行,检查是否有可用资源来 执行命令。
-
线程池/请求队列/信号量是否占满
-
HystrixObservableCommand.construct()或HystrixCommand.run() Hystrix会根据我们编写的方法来决定采取什么样的方式去请求依赖服务。 • HystrixCommand.run(): 返回一个单一 的结果,或者抛出异常。 • HystrixObservableCommand.construct(): 返回一个Observable对象来 发射多个结果,或通过onError发送错误通知
-
计算断路器的健康度
-
fallback处理
-
返回成功的响应
相信这个简短流程图,肯定很晦涩难懂,那么这里就单一从HystrixCommand执行过程中举足轻重的断路器开始讲起。
3.断路器源码分析
- HystrixCircuitBreaker接口 可见断路器就三个抽象方法,后续断路器起决定性作用的也是这三个方法。 • allowRequest(): 每个Hystrix 命令的请求都通过它判断是否被执行。 • isOpen(): 返回当前断路器是否打开。 • markSuccess(): 用来在服务调用成功后,闭合断路器。
public interface HystrixCircuitBreaker {
public static class Factory { ... }
static class HystrixCircuitBreakerimpl implements HystrixCircuitBreaker { ... }
static class NoOpCircuitBreaker implements HystrixCircuitBreaker { ... }
public boolean allowRequest();
public boolean isOpen();
void markSuccess();
}
-
接口实现类 它的实现类可以看到有两个,第一个是NoOpCircuitBreaker,顾名思义是什么作用都不起,第二个是HystrixCircuitBreakerimpl,这个断路器方法就是接口实现方法 它有四个很重要的成员属性,用于统计和判断短路器状态; HystrixCommandProperties properties:断路器对应 HystrixCommand实例的属性对象 HystrixCommandMetrics metrics:用来让HystrixCommand 记录各类度量指标的对象。这个记录了当前执行情况。 AtomicBoolean circuitOpen:断路器是否打开的标志,默认为 false。 AtomicLong circuitOpenedOrLastTestedTime:断路器打开或是上一次测试的时间戳。
-
isOpen(): 判断断路器的打开/关闭状态。 详细逻辑如下所示。 如果短路器已打开,则直接返回true, 表示断路器处于打开状态。如果没有就从上面成员属性metrics中获得HealthCounts属性,该对象记录了一个滑动时间窗,默认时间窗为十秒内的数据。 ——如果它的请求数(QPS)未达到了阈值,则返回false表示未开启,默认为20 ——如果错误百分比(失败/总共)在阈值内则返回false,默认为50%,只有两者都是失败才会打开断路器
public boolean isOpen() {
// 如果开启了默认返回true
if (circuitOpen.get()) (
return true;
}
// 拿到健康监控数据
HealthCounts health = metrics.getHealthCounts();
// 如果总共请求少于设置值返回false
if (health.getTotalRequests() < properties.circuitBreakerRequestVolumeThreshold() .get()) {
return false;
}
// 如果错误率少于设置值返回false
if (health.getErrorPercentage() < properties.circuitBreakerErrorThresholdPercentage().get()) {
return false;
} else {
// 只有上述两个条件都不满足 且断路器未开启,把断路器打开同时修改上次测试时间戳
if (circuitOpen.compareAndSet(false, true)) {
circuitOpenedOrLastTestedTime.set(System.currentTimeMillis());
return true;
// 保证只有一个线程能够设置时间戳,多线程情况下
} else {
return true;
}
}
}
滑动时间窗:类似一个数组对象,如果设置统计时间为十秒那么数组长度为10,每一格记录对应一秒的请求数据,比如请求成功数、请求失败数、拒绝数、超时数等。随着时间更新最新10s内的数据
- allowRequest():判断是否允许请求,满足两个条件之一就可,断路器开启状态为false即isOpen() = false、达到熔断时间即距离上次失败时间够长那么允许再次请求allowSingleTest()
@Override
public boolean allowRequest() {
//下面两个都是判断是否强制开/关断路器,如果配置了就直接返回
if (properties.circuitBreakerForceOpen().get()) (
return false;
}
if (properties.circuitBreakerForceClosed().get()) {
// 更新上面说的测试时间戳,如果断路器之前关闭了
isOpen();
return true;
}
//
return !isOpen() || allowSingleTest();
}
- allowSingleTest():判断是否断路器休眠时间到了,运行发起新的重试请求
public boolean allowSingleTest (} {
// 拿到上次测试时间
long timeCircuitOpenedOrWasLastTested = circuitOpenedOrLastTestedTime.get();
// 判断是否超过设置的重试时间且断路器为开,是就发起新的请求
if (circuitOpen.get() && System.currentTimeMillis() > timeCircuitOpenedOrWasLastTested + properties.circuitBreakerSleepWindowinMilliseconds() .get()) {
// 只允许有一个线程设置新的测试时间,并发起请求,后续的请求都将被拦截
if (circuitOpenedOrLastTestedTime.compareAndSet(
timeCircuitOpenedOrWasLastTested, System.currentTimeMillis())) {
return true;
}
}
return false;
}
- marksuccess():将断路器关闭,重置度量指标
public void markSuccess() {
if (circuitOpen.get(){
if (circuitOpen.compareAndSet(true, false)) {
metrics.resetstream();
}
}
}
官网完整流程图
总结
本文简要讲了Hystrix组件的断路器请求工作原理,Hystrix还包括很多功能比如依赖隔离、请求缓存、请求合并、还有Hystrix仪表盘、集群监控等功能。Hystrix功能强大,是微服务中核心的一个组件。
评论