ZipKin概述
ZipKin 是一个开放源代码的分布式跟踪系统,由 Twitter 公司开源,它致力于收集服务的定时数据,以解决微服务架构中的延迟问题,包括数据的收集、存储、查找和展现。它的理论模型来自于 Google Dapper 论文。
每个服务向 ZipKin 报告计时数据,ZipKin 会根据调用关系通过 ZipKin UI 生成依赖关系图,显示了多少跟踪请求通过每个服务,该系统让开发者可通过一个 Web 前端轻松的收集和分析数据,例如用户每次请求服务的处理时间等,可方便的监测系统中存在的瓶颈。
服务追踪说明
微服务架构是通过业务来划分服务的,使用 REST 调用。对外暴露的一个接口,可能需要很多个服务协同才能完成这个接口功能,如果链路上任何一个服务出现问题或者网络超时,都会形成导致接口调用失败。随着业务的不断扩张,服务之间互相调用会越来越复杂。
随着服务的越来越多,对调用链的分析会越来越复杂。它们之间的调用关系也许如下:
术语解释
- Span:基本工作单元,例如,在一个新建的 Span 中发送一个 RPC 等同于发送一个回应请求给 RPC,Span 通过一个 64 位 ID 唯一标识,Trace 以另一个 64 位 ID 表示。
- Trace:一系列 Spans 组成的一个树状结构,例如,如果你正在运行一个分布式大数据工程,你可能需要创建一个 Trace。
- Annotation:用来即使记录一个事件的存在,一些核心 Annotations 用来定义一个请求的开始和结束
- cs:Client Sent,客户端发起一个请求,这个 Annotation 描述了这个 Span 的开始
- sr:Server Received,服务端获得请求并准备开始处理它,如果将其 sr 减去 cs 时间戳便可得到网络延迟
- ss:Server Sent 表明请求处理的完成(当请求返回客户端),如果 ss 减去 sr 时间戳便可得到服务端需要的处理请求时间
- cr:Client Received 表明 Span 的结束,客户端成功接收到服务端的回复,如果 cr 减去 cs 时间戳便可得到客户端从服务端获取回复的所有所需时间
将 Span 和 Trace 在一个系统中使用 Zipkin 注解的过程图形化:
创建 ZipKin 服务端
这里踩了很多坑,本来是采用新建一个项目,并使用 io.zipkin.java:zipkin
、io.zipkin.java:zipkin-server
、io.zipkin.java:zipkin-autoconfigure-ui
来构建,但是,首先遇到的一个问题就是日志框架的冲突问题,严重到无法运行,接下来又是一个The bean 'characterEncodingFilter', could not be registered.
的问题。我到这里就止步了,感觉自建server的方式不太稳定。希望或者需要使用这种方式的自行搜索解决问题吧。
官方给出的三种方案:
Docker
The Docker Zipkin project is able to build docker images, provide scripts and a docker-compose.yml
for launching pre-built images. The quickest start is to run the latest image directly:
1 | docker run -d -p 9411:9411 openzipkin/zipkin |
Java
If you have Java 8 or higher installed, the quickest way to get started is to fetch the latest release(jar包的下载连接,如果失效请去 官网下载) as a self-contained executable jar:
1 | curl -sSL https://zipkin.io/quickstart.sh | bash -s |
Running from Source
Zipkin can be run from source if you are developing new features. To achieve this, you’ll need to get Zipkin’s source and build it.
1 | get the latest source |
追踪服务
在 所有需要被追踪的项目 中增加 spring-cloud-starter-zipkin
依赖
1 | <dependency> |
默认配置为http://localhost:9411
。如果要更换ip,在public.yml
(公共配置文件)和注册中心与配置中心的application.yml
追加如下配置:
1 | spring: |
注意:以eureka为例,在第一次请求eureka控制面板,或者第一次向eureka注册时,eureka会去请求追踪服务器(http://localhost:9411/api/v2/spans
),所以追踪服务器至少应在eureka启动之后立即启动。对于开启了自注册的eureka,追踪服务器应当优先启动。
测试
依次启动,zipkin-server
,eureka
,config
,feign
,admin-service
,多次请求feign
接口