Spring Cloud服务容错Hystrix断路器原理

Spring Cloud Hystrix是用于做微服务之间服务短路,服务限流,服务降级,服务容错等的组件,为了避免在庞大微服务系统中,因为某一服务依赖出现异常导致全盘崩溃的严重问题。

1.快速入门

@EnableCircuitBreaker
@EnableDiscoveryClient 
@SpringBootApplication 
public class ConsumerApplication { 
	@Bean 
	@LoadBalanced 
	RestTemplate restTemplate () { 
		return new RestTemplate (); 
	} 
	public static void main(String[] args) { 
		SpringApplication.run(ConsumerApplication.class, args); 
	} 
}
  1. 使用@EnableCircuitBreaker开启断路器

注意:这里还可以直接使用@SpringCloudApplication来开启断路器 他相当于我们上面加的三个注解,也就是说Spring Cloud应用默认包含了服务发现和断路器功能

@SpringBootApplication 
@EnableDiscoveryClient 
@EnableCircuitBreaker 
public interface SpringCloudApplication {
}
  1. 改造服务消费方式 新增 HelloService 类, 注入RestTemplate 实例。 然后在 helloService 函数上增加@HystrixCommand 注解来指定降级方法,最后就可以在调用的Controller中注入该service进行函数式调用即可。
@Service 
public class HelloService { 
	@Autowired 
	RestTemplate restTemplate; 

	@HystrixCommand(fallbackMethod = "helloFallback") 
	public String helloService() { 
		return restTemplate.getForEntity("http://HELLO-SERVICE/hello", String.class) .getBody(); 
	} 
	public String helloFallback () ( 
		return "error"; 
	}
}
  1. Hystrix默认超时时间2000ms,我们可以在HELLO-SERVICE服务的 /hello接口中随机sleep 1000-3000ms来模拟超时降级,返回error情况。

2.原理分析

本文先研究Hystrix断路器功能,所以对一些流程先讲个概念,可以先行跳过到断路器源码处继续阅读。

  1. 创建HystrixCommand或HystrixObservableCommand对象,使用了Command设计模式来构造请求。

  2. 简要区别: • HystrixCommand: 用在依赖的服务返回单个操作结果的时候。 • HystrixObservableCommand: 用在依赖的服务返回多个操作结果的时候。

  3. HystrixCommand命令执行 HystrixCommand包含了下面两个命令 • execute (): 同步执行,从依赖的服务 返回一个单 一的结果对象, 或是在发生错误 的时候抛出异常。 • queue (): 异步执行,直接返回 一个Future对象, 其中包含了服务 执行 结束时要 返回的单 一 结果对象。

R value = command.execute() ; 
Future<R> fValue = command.queue() ;
  1. HystrixObservableCommand命令执行 HystrixObservableCommand包含这两个命令 • observe () : 返回Observable对象,它代表了操作的多个结果,它是一个Hot Observable。 • toObservable(): 同样会返回Observable对象, 也代表了操作的多个结果, 但它返回的是一个Cold Observable
Observable<R> ohValue = command.observe(}; 
Observable<R> ocValue = command.toObservable(}
  1. 结果是否被缓存 若当前命令的请求缓存功能是被启用的, 并且该命令缓存命中, 那么缓存的结果会立 即以Observable 对象的形式返回。

  2. 断路器是否打开 在命令结果没有缓存命中的时候, Hystrix在执行命令前需要检查断路器是否为打开状态: • 如果断路器是打开的,那么Hystrix不会执行命令,而是转接到fallback处理逻辑 • 如果断路器是关闭的, 那么Hystrix继续执行,检查是否有可用资源来 执行命令。

  3. 线程池/请求队列/信号量是否占满

  4. HystrixObservableCommand.construct()或HystrixCommand.run() Hystrix会根据我们编写的方法来决定采取什么样的方式去请求依赖服务。 • HystrixCommand.run(): 返回一个单一 的结果,或者抛出异常。 • HystrixObservableCommand.construct(): 返回一个Observable对象来 发射多个结果,或通过onError发送错误通知

  5. 计算断路器的健康度

  6. fallback处理

  7. 返回成功的响应

相信这个简短流程图,肯定很晦涩难懂,那么这里就单一从HystrixCommand执行过程中举足轻重的断路器开始讲起。

3.断路器源码分析

  1. HystrixCircuitBreaker接口 可见断路器就三个抽象方法,后续断路器起决定性作用的也是这三个方法。 • allowRequest(): 每个Hystrix 命令的请求都通过它判断是否被执行。 • isOpen(): 返回当前断路器是否打开。 • markSuccess(): 用来在服务调用成功后,闭合断路器
public interface HystrixCircuitBreaker { 
	public static class Factory { ... } 
	
	static class HystrixCircuitBreakerimpl implements HystrixCircuitBreaker { ... } 
	
	static class NoOpCircuitBreaker implements HystrixCircuitBreaker { ... } 
	
	public boolean allowRequest(); 
	
	public boolean isOpen(); 
	
	void markSuccess();
}
  1. 接口实现类 它的实现类可以看到有两个,第一个是NoOpCircuitBreaker,顾名思义是什么作用都不起,第二个是HystrixCircuitBreakerimpl,这个断路器方法就是接口实现方法 它有四个很重要的成员属性,用于统计和判断短路器状态; HystrixCommandProperties properties:断路器对应 HystrixCommand实例的属性对象 HystrixCommandMetrics metrics:用来让HystrixCommand 记录各类度量指标的对象。这个记录了当前执行情况。 AtomicBoolean circuitOpen:断路器是否打开的标志,默认为 false。 AtomicLong circuitOpenedOrLastTestedTime:断路器打开或是上一次测试的时间戳。

  2. isOpen(): 判断断路器的打开/关闭状态。 详细逻辑如下所示。 如果短路器已打开,则直接返回true, 表示断路器处于打开状态。如果没有就从上面成员属性metrics中获得HealthCounts属性,该对象记录了一个滑动时间窗,默认时间窗为十秒内的数据。 ——如果它的请求数(QPS)未达到了阈值,则返回false表示未开启,默认为20 ——如果错误百分比(失败/总共)在阈值内则返回false,默认为50%,只有两者都是失败才会打开断路器

public boolean isOpen() { 
	// 如果开启了默认返回true
	if (circuitOpen.get()) ( 
		return true; 
	}
	// 拿到健康监控数据
	HealthCounts health = metrics.getHealthCounts(); 
	// 如果总共请求少于设置值返回false
	if (health.getTotalRequests() < properties.circuitBreakerRequestVolumeThreshold() .get()) { 
		return false; 
	}
	// 如果错误率少于设置值返回false
	if (health.getErrorPercentage() < properties.circuitBreakerErrorThresholdPercentage().get()) { 
		return false; 
	} else { 
		// 只有上述两个条件都不满足 且断路器未开启,把断路器打开同时修改上次测试时间戳
		if (circuitOpen.compareAndSet(false, true)) { 
			circuitOpenedOrLastTestedTime.set(System.currentTimeMillis());
			return true; 
		// 保证只有一个线程能够设置时间戳,多线程情况下
		} else { 
			return true;
		}
	}
}

滑动时间窗:类似一个数组对象,如果设置统计时间为十秒那么数组长度为10,每一格记录对应一秒的请求数据,比如请求成功数、请求失败数、拒绝数、超时数等。随着时间更新最新10s内的数据

  1. allowRequest():判断是否允许请求,满足两个条件之一就可,断路器开启状态为false即isOpen() = false、达到熔断时间即距离上次失败时间够长那么允许再次请求allowSingleTest()
@Override 
public boolean allowRequest() { 
	//下面两个都是判断是否强制开/关断路器,如果配置了就直接返回
	if (properties.circuitBreakerForceOpen().get()) ( 
		return false; 
	}
	if (properties.circuitBreakerForceClosed().get()) { 
		// 更新上面说的测试时间戳,如果断路器之前关闭了
		isOpen(); 
		return true; 
	}
	//
	return !isOpen() || allowSingleTest(); 
}

  1. allowSingleTest():判断是否断路器休眠时间到了,运行发起新的重试请求
public boolean allowSingleTest (} { 
	// 拿到上次测试时间
	long timeCircuitOpenedOrWasLastTested = circuitOpenedOrLastTestedTime.get(); 
	// 判断是否超过设置的重试时间且断路器为开,是就发起新的请求
	if (circuitOpen.get() && System.currentTimeMillis() > timeCircuitOpenedOrWasLastTested + properties.circuitBreakerSleepWindowinMilliseconds() .get()) { 
		// 只允许有一个线程设置新的测试时间,并发起请求,后续的请求都将被拦截
		if (circuitOpenedOrLastTestedTime.compareAndSet(
			timeCircuitOpenedOrWasLastTested, System.currentTimeMillis())) { 
				return true; 
		}
	}
	return false;
}
  1. marksuccess():将断路器关闭,重置度量指标
public void markSuccess() { 
	if (circuitOpen.get(){
		if (circuitOpen.compareAndSet(true, false)) { 
			metrics.resetstream();
		}
	}
}

官网完整流程图

在这里插入图片描述


总结

本文简要讲了Hystrix组件的断路器请求工作原理,Hystrix还包括很多功能比如依赖隔离、请求缓存、请求合并、还有Hystrix仪表盘、集群监控等功能。Hystrix功能强大,是微服务中核心的一个组件。

end
  • 作者:Endwas(联系作者)
  • 发表时间:2021-06-13 00:17
  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)
  • 转载声明:如果是转博主转载的文章,请附上原文链接
  • 公众号转载:请在文末添加作者名字和博客地址
  • 评论