前一篇文章 使用四种框架分别实现百万websocket常连接的服务器 介绍了四种websocket框架的测试方法和基本数据。 最近我又使用几个框架实现了websocket push服务器的原型,并专门对这七种实现做了测试。 本文记录了测试结果和一些对结果的分析。

这七种框架是:

最近用Golang实现了第八种,Go表现还不错。

测试环境

使用三台C3.4xlarge AWS服务器做测试。 一台作为服务器,两台作为客户端机器, 每台客户端机器启动10个client,一共20个client

C3.4xlarge的配置如下:

20170127085832_280.png

服务器和客户端机器按照上一篇文章做了基本的优化。

以下是测试的配置数据:

20 clients

setup rate设为500 * 20 requests/second = 10000 request /second

每个client负责建立50000个websocket 连接

等1,000,000个websocket建好好,发送一个消息(时间戳)给所有的客户端,客户端根据时间戳计算latency

如果服务器setup rate建立很慢,主动停止测试

监控三个阶段的性能指标: setup时, setup完成后应用发呆(idle)时,发送消息时

1 Netty

Setup时

cpu idle: 90%

minor gc: Few

full gc: No

Setup完成, 应用Idle时

cpu idle: 100%

memory usage: 1.68G

server free memory: 16.3G

发送消息时

cpu idle: 75%

minor gc: few

full gc: No

Message latency (one client)

count = 50000

min = 0

max = 18301

mean = 2446.09

stddev = 3082.11

median = 1214.00

75% <= 3625.00

95% <= 8855.00

98% <= 12069.00

99% <= 13274.00

99.9% <= 18301.00

2 Vert.x

Setup时

cpu idle: 95%

minor gc: Few

full gc: No

Setup完成, 应用Idle时

cpu idle: 100%

memory usage: 6.37G

server free memory: 16.3G

发送消息时

cpu idle: 47% ~ 76%

minor gc: few

full gc: few

Message latency (one client)

count = 50000

min = 49

max = 18949

mean = 10427.00

stddev = 5182.72

median = 10856.00

75% <= 14934.00

95% <= 17949.00

98% <= 18458.00

99% <= 18658.00

99.9% <= 18949.00

3 Undertow

Setup时

cpu idle: 90%

minor gc: Few

full gc: No

Setup完成, 应用Idle时

cpu idle: 100%

memory usage: 4.02G

server free memory: 14.2G

发送消息时

cpu idle: 65%

minor gc: few

full gc: No

Message latency

count = 50000

min = 1

max = 11948

mean = 1366.86

stddev = 2007.77

median = 412.00

75% <= 2021.00

95% <= 5838.00

98% <= 7222.00

99% <= 8051.00

99.9% <= 11948.00

4 Jetty

Setup时

cpu idle: 2%

minor gc: Many

full gc: No

memory usage: 5G

server free memory: 17.2G

当建立360,000左右的websocket时, setup非常的慢, gc频繁,无法继续正常建立websocket, 主动终止测试。

5 Grizzly

Setup时

cpu idle: 20%

minor gc: Some

full gc: Some

memory usage: 11.5G

server free memory: 12.3G

当建立500,000左右的websocket时, setup非常的慢, gc频繁,无法继续正常建立websocket, 主动终止测试。

6 Spray

Setup时

cpu idle: 80%

minor gc: Many

full gc: No

当建立500,000左右的websocket时, setup非常的慢, gc频繁,无法继续正常建立websocket, 主动终止测试。

7 Node.js

Setup时

cpu idle: 94%

Setup完成, 应用Idle时

cpu idle: 100%

memory usage: 5.0G

server free memory: 16.3G

发送消息时

cpu idle: 94%

Message latency (one client)

Message latency

count = 50000

min = 0

max = 18

mean = 1.27

stddev = 3.08

median = 1.00

75% <= 1.00

95% <= 1.00

98% <= 1.00

99% <= 1.00

99.9% <= 15.00

8 Go

Setup时

cpu idle: 94%

Setup完成, 应用Idle时

cpu idle: 100%

memory usage: 15G

server free memory: 6G

发送消息时

cpu idle: 94%

Message latency (one client)

Message latency

count = 50000

min = 0

max = 35

mean = 1.89

stddev = 1.83

median = 1.00

75% <= 1.00

95% <= 2.00

98% <= 2.00

99% <= 4.00

99.9% <= 34.00

测试结果分析

Netty, Go, Node.js, Undertow, Vert.x都能正常建立百万连接。 Jetty, Grizzly 和 Spray未能完成百万连接

Netty表现最好。内存占用非常的少, CPU使用率也不高。 尤其内存占用,远远小于其它框架

Jetty, Grizzly和Spray会产生大量的中间对象,导致垃圾回收频繁。Jetty表现最差

Node.js表现非常好。 尤其是测试中使用单实例单线程,建立速度非常快,消息的latency也很好。 内存占用也不错

Undertow表现也不错,内存占用比Netty高一些,其它差不多

这里还未测到Spray另一个不好的地方。 在大量连接的情况小,即使没有消息发送,Spray也会占用40% CPU 时间

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐