关于小说网站的一些建设流程,公司的网络规划与设计,WordPress写文章一直转,南通通州建设工程质量监督网站一、 消息队列概述 前些天发现了一个巨牛的人工智能学习网站#xff0c;通俗易懂#xff0c;风趣幽默#xff0c;忍不住分享一下给大家。点击跳转到教程。 消息队列中间件是分布式系统中重要的组件#xff0c;主要解决应用耦合、异步消息、流量削锋等问题。实现高性能、高可…一、 消息队列概述 前些天发现了一个巨牛的人工智能学习网站通俗易懂风趣幽默忍不住分享一下给大家。点击跳转到教程。 消息队列中间件是分布式系统中重要的组件主要解决应用耦合、异步消息、流量削锋等问题。实现高性能、高可用、可伸缩和最终一致性架构。是大型分布式系统不可缺少的中间件。
目前在生产环境使用较多的消息队列有ActiveMQ、RabbitMQ、ZeroMQ、Kafka、MetaMQ、RocketMQ等。
二、 消息队列应用场景
下面详细介绍一下消息队列在实际应用中常用的使用场景。场景分为异步处理、应用解耦、流量削锋和消息通讯四个场景。
2.1 异步处理 场景说明用户注册后需要发送注册邮件和发送注册信息传统的做法有两种串行方式、并行方式 串行方式
将注册信息写入数据库成功后发送注册邮件然后发送注册短信而所有任务执行完成后返回信息给客户端 串行方式
并行方式
将注册信息写入数据库成功后同时进行发送注册邮件和发送注册短信的操作。而所有任务执行完成后返回信息给客户端。同串行方式相比并行方式可以提高执行效率减少执行时间。 并行方式
上面的比较可以发现假设三个操作均需要50ms的执行时间排除网络因素则最终执行完成串行方式需要150ms而并行方式需要100ms。
因为cpu在单位时间内处理的请求数量是一致的假设CPU每1秒吞吐量是100此则串行方式1秒内可执行的请求量为1000/150不到7次并行方式1秒内可执行的请求量为1000/100为10次。
由上可以看出传统串行和并行的方式会受到系统性能的局限那么如何解决这个问题 我们需要引入消息队列将不是必须的业务逻辑异步进行处理由此改造出来的流程为 引入消息队列异步处理消息 根据上述的流程用户的响应时间基本相当于将用户数据写入数据库的时间发送注册邮件、发送注册短信的消息在写入消息队列后即可返回执行结果写入消息队列的时间很快几乎可以忽略也有此可以将系统吞吐量提升至20QPS比串行方式提升近3倍比并行方式提升2倍。
2.2 应用解耦 场景说明用户下单后订单系统需要通知库存系统。 传统的做法为订单系统调用库存系统的接口。如下图所示 传统方式调用库存接口
传统方式具有如下缺点 -1. 假设库存系统访问失败则订单减少库存失败导致订单创建失败 -2. 订单系统同库存系统过度耦合
如何解决上述的缺点呢需要引入消息队列引入消息队列后的架构如下图所示 引入消息队列实现应用解耦
订单系统用户下单后订单系统进行数据持久化处理然后将消息写入消息队列返回订单创建成功库存系统使用拉/推的方式获取下单信息库存系统根据订单信息进行库存操作。
假如在下单时库存系统不能正常使用。也不影响正常下单因为下单后订单系统写入消息队列就不再关心其后续操作了。由此实现了订单系统与库存系统的应用解耦。
2.3 流量削锋
流量削锋也是消息队列中的常用场景一般在秒杀或团抢活动中使用广泛。 应用场景秒杀活动一般会因为流量过大导致流量暴增应用挂掉。为解决这个问题一般需要在应用前端加入消息队列。 可以控制参与活动的人数可以缓解短时间内高流量对应用的巨大压力
流量削锋处理方式系统图如下 流量削锋方式系统图
服务器在接收到用户请求后首先写入消息队列。这时如果消息队列中消息数量超过最大数量则直接拒绝用户请求或返回跳转到错误页面秒杀业务根据秒杀规则读取消息队列中的请求信息进行后续处理。
2.4 日志处理
日志处理是指将消息队列用在日志处理中比如Kafka的应用解决大量日志传输的问题。架构简化如下 消息队列应用于日志处理的架构
日志采集客户端负责日志数据采集定时写受写入Kafka队列Kafka消息队列负责日志数据的接收存储和转发日志处理应用订阅并消费kafka队列中的日志数据
这种架构在实际开发中的应用可以参照案例新浪技术分享我们如何扛下32亿条实时日志的分析处理 服务的技术架构设计
Kafka接收用户日志的消息队列。Logstash做日志解析统一成JSON输出给Elasticsearch。Elasticsearch实时日志分析服务的核心技术一个schemaless实时的数据存储服务通过index组织数据兼具强大的搜索和统计功能。Kibana基于Elasticsearch的数据可视化组件超强的数据可视化能力是众多公司选择ELK stack的重要原因。
2.5 消息通讯
消息通讯是指消息队列一般都内置了高效的通信机制因此也可以用在纯的消息通讯。比如实现点对点消息队列、聊天室等。
点对点通讯 点对点通讯架构设计 在点对点通讯架构设计中客户端A和客户端B共用一个消息队列即可实现消息通讯功能。
聊天室通讯 聊天室通讯架构设计 客户端A、客户端B、直至客户端N订阅同一消息队列进行消息的发布与接收即可实现聊天通讯方案架构设计。
三、 消息中间件示例
3.1 电商系统 电商系统架构示意图 消息队列采用高可用、可持久化的消息中间件。比如Active MQRabbit MQRocket MQ。
应用将主干逻辑处理完成后写入消息队列。消息发送是否成功可以开启消息的确认模式。消息队列返回消息接收成功状态后应用再返回这样保障消息的完整性扩展流程发短信、配送处理订阅队列消息。采用推或拉的方式获取消息并处理。消息将应用解耦的同时带来了数据一致性问题可以采用最终一致性方式解决。比如主数据写入数据库扩展应用根据消息队列并结合数据库方式实现基于消息队列的后续处理。
3.2 日志收集系统 日志收集系统架构示意图 分为Zookeeper注册中心日志收集客户端Kafka集群和Storm集群OtherApp四部分组成。
Zookeeper注册中心提出负载均衡和地址查找服务日志收集客户端用于采集应用系统的日志并将数据推送到kafka队列Kafka集群接收路由存储转发等消息处理Storm集群与OtherApp处于同一级别采用拉的方式消费队列中的数据
四、JMS消息服务
讲消息队列就不得不提JMS 。JMSJava Message Service,Java消息服务API是一个消息服务的标准/规范允许应用程序组件基于JavaEE平台创建、发送、接收和读取消息。它使分布式通信耦合度更低消息服务更加可靠以及异步性。 在EJB架构中有消息bean可以无缝的与JM消息服务集成。在J2EE架构模式中有消息服务者模式用于实现消息与应用直接的解耦。
4.1 消息模型
在JMS标准中有两种消息模型P2PPoint to Point,Publish/Subscribe(Pub/Sub)。
4.1.1 P2P模式 P2P模式 P2P模式包含三个角色消息队列Queue发送者(Sender)接收者(Receiver)。每个消息都被发送到一个特定的队列接收者从队列中获取消息。队列保留着消息直到他们被消费或超时。
P2P的特点
每个消息只有一个消费者Consumer(即一旦被消费消息就不再在消息队列中)发送者和接收者之间在时间上没有依赖性也就是说当发送者发送了消息之后不管接收者有没有正在运行它不会影响到消息被发送到队列接收者在成功接收消息之后需向队列应答成功
如果希望发送的每个消息都会被成功处理的话那么需要P2P模式。 4.1.2 Pub/Sub模式 Pub/Sub模式 包含三个角色主题Topic发布者Publisher订阅者Subscriber 。多个发布者将消息发送到Topic,系统将这些消息传递给多个订阅者。
Pub/Sub的特点
每个消息可以有多个消费者发布者和订阅者之间有时间上的依赖性。针对某个主题Topic的订阅者它必须创建一个订阅者之后才能消费发布者的消息。为了消费消息订阅者必须保持运行的状态。
为了缓和这样严格的时间相关性JMS允许订阅者创建一个可持久化的订阅。这样即使订阅者没有被激活运行它也能接收到发布者的消息。 如果希望发送的消息可以不被做任何处理、或者只被一个消息者处理、或者可以被多个消费者处理的话那么可以采用Pub/Sub模型。
4.2消息消费
在JMS中消息的产生和消费都是异步的。对于消费来说JMS的消息者可以通过两种方式来消费消息。
同步 订阅者或接收者通过receive方法来接收消息receive方法在接收到消息之前或超时之前将一直阻塞异步 订阅者或接收者可以注册为一个消息监听器。当消息到达之后系统自动调用监听器的onMessage方法。
JNDIJava命名和目录接口,是一种标准的Java命名系统接口。可以在网络上查找和访问服务。通过指定一个资源名称该名称对应于数据库或命名服务中的一个记录同时返回资源连接建立所必须的信息。 JNDI在JMS中起到查找和访问发送目标或消息来源的作用。
4.3JMS编程模型
1. ConnectionFactory
创建Connection对象的工厂针对两种不同的JMS消息模型分别有QueueConnectionFactory和TopicConnectionFactory两种。可以通过JNDI来查找ConnectionFactory对象。
2. Destination
Destination的意思是消息生产者的消息发送目标或者说消息消费者的消息来源。对于消息生产者来说它的Destination是某个队列Queue或某个主题Topic;对于消息消费者来说它的Destination也是某个队列或主题即消息来源。 所以Destination实际上就是两种类型的对象Queue、Topic可以通过JNDI来查找Destination。
3. Connection
Connection表示在客户端和JMS系统之间建立的链接对TCP/IP Socket的包装。Connection可以产生一个或多个Session。跟ConnectionFactory一样Connection也有两种类型QueueConnection和TopicConnection。
4. Session
Session是操作消息的接口。可以通过session创建生产者、消费者、消息等。Session提供了事务的功能。当需要使用session发送/接收多个消息时可以将这些发送/接收动作放到一个事务中。同样也分QueueSession和TopicSession。
5. 消息的生产者
消息生产者由Session创建并用于将消息发送到Destination。同样消息生产者分两种类型QueueSender和TopicPublisher。可以调用消息生产者的方法send或publish方法发送消息。
6. 消息消费者
消息消费者由Session创建用于接收被发送到Destination的消息。两种类型QueueReceiver和TopicSubscriber。可分别通过session的createReceiver(Queue)或createSubscriber(Topic)来创建。当然也可以session的creatDurableSubscriber方法来创建持久化的订阅者。
7. MessageListener
消息监听器。如果注册了消息监听器一旦消息到达将自动调用监听器的onMessage方法。EJB中的MDBMessage-Driven Bean就是一种MessageListener。
深入学习JMS对掌握JAVA架构、EJB架构有很好的帮助消息中间件也是大型分布式系统必须的组件。本次分享主要做全局性介绍具体的深入需要大家学习实践总结领会。
五、常用消息队列
一般商用的容器比如WebLogicJBoss都支持JMS标准开发上很方便。但免费的比如TomcatJetty等则需要使用第三方的消息中间件。本部分内容介绍常用的消息中间件Active MQRabbit MQZero MQKafka以及他们的特点。
5.1 ActiveMQ
ActiveMQ 是Apache出品最流行的能力强劲的开源消息总线。ActiveMQ 是一个完全支持JMS1.1和J2EE 1.4规范的 JMS Provider实现尽管JMS规范出台已经是很久的事情了但是JMS在当今的J2EE应用中间仍然扮演着特殊的地位。 ActiveMQ特性如下
多种语言和协议编写客户端。 语言: Java,C,C,C#,Ruby,Perl,Python,PHP。 应用协议 OpenWire,Stomp REST,WS Notification,XMPP,AMQP完全支持JMS1.1和J2EE 1.4规范 持久化XA消息事务)对Spring的支持。 ActiveMQ可以很容易内嵌到使用Spring的系统里面去而且也支持Spring2.0的特性通过了常见J2EE服务器如 Geronimo,JBoss 4,GlassFish,WebLogic)的测试其中通过JCA 1.5 resource adaptors的配置可以让ActiveMQ可以自动的部署到任何兼容J2EE 1.4 商业服务器上支持多种传送协议in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA支持通过JDBC和journal提供高速的消息持久化从设计上保证了高性能的集群客户端-服务器点对点支持Ajax支持与Axis的整合可以很容易得调用内嵌JMS provider进行测试
5.2 RabbitMQ
RabbitMQ是流行的开源消息队列系统用erlang语言开发。RabbitMQ是AMQP高级消息队列协议的标准实现。支持多种客户端如Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等支持AJAX持久化。用于在分布式系统中存储转发消息在易用性、扩展性、高可用性等方面表现不俗。 RabbitMQ结构图 上图中有几个重要概念
Broker简单来说就是消息队列服务器实体。Exchange消息交换机它指定消息按什么规则路由到哪个队列。Queue消息队列载体每个消息都会被投入到一个或多个队列。Binding绑定它的作用就是把Exchange和Queue按照路由规则绑定起来。Routing Key路由关键字Exchange根据这个关键字进行消息投递。vhost虚拟主机一个broker里可以开设多个vhost用作不同用户的权限分离。producer消息生产者就是投递消息的程序。consumer消息消费者就是接受消息的程序。channel消息通道在客户端的每个连接里可建立多个channel每个channel代表一个会话任务。
消息队列的使用过程如下
客户端连接到消息队列服务器打开一个channel。客户端声明一个exchange并设置相关属性。客户端声明一个queue并设置相关属性。客户端使用routing key在exchange和queue之间建立好绑定关系。客户端投递消息到exchange。
exchange接收到消息后就根据消息的key和已经设置的binding进行消息路由将消息投递到一个或多个队列里。
5.3 ZeroMQ
号称史上最快的消息队列它实际类似于Socket的一系列接口他跟Socket的区别是普通的socket是端到端的1:1的关系而ZMQ却是可以NM 的关系人们对BSD套接字的了解较多的是点对点的连接点对点连接需要显式地建立连接、销毁连接、选择协议TCP/UDP和处理错误等而ZMQ屏蔽了这些细节让你的网络编程更为简单。ZMQ用于node与node间的通信node可以是主机或者是进程。 引用官方的说法 “ZMQ(以下ZeroMQ简称ZMQ)是一个简单好用的传输层像框架一样的一个socket library他使得Socket编程更加简单、简洁和性能更高。是一个消息处理队列库可在多个线程、内核和主机盒之间弹性伸缩。ZMQ的明确目标是“成为标准网络协议栈的一部分之后进入Linux内核”。现在还未看到它们的成功。但是它无疑是极具前景的、并且是人们更加需要的“传统”BSD套接字之上的一层封装。ZMQ让编写高性能网络应用程序极为简单和有趣。”
特点是
高性能非持久化跨平台支持Linux、Windows、OS X等。多语言支持 C、C、Java、.NET、Python等30多种开发语言。可单独部署或集成到应用中使用可作为Socket通信库使用。
与RabbitMQ相比ZMQ并不像是一个传统意义上的消息队列服务器事实上它也根本不是一个服务器更像一个底层的网络通讯库在Socket API之上做了一层封装将网络通讯、进程通讯和线程通讯抽象为统一的API接口。支持“Request-Reply “”Publisher-Subscriber“”Parallel Pipeline”三种基本模型和扩展模型。
ZeroMQ高性能设计要点
无锁的队列模型 对于跨线程间的交互用户端和session之间的数据交换通道pipe采用无锁的队列算法CAS在pipe两端注册有异步事件在读或者写消息到pipe的时会自动触发读写事件。批量处理的算法 对于传统的消息处理每个消息在发送和接收的时候都需要系统的调用这样对于大量的消息系统的开销比较大zeroMQ对于批量的消息进行了适应性的优化可以批量的接收和发送消息。多核下的线程绑定无须CPU切换 区别于传统的多线程并发模式信号量或者临界区 zeroMQ充分利用多核的优势每个核绑定运行一个工作者线程避免多线程之间的CPU切换开销。
5.4 Kafka
Kafka是一种高吞吐量的分布式发布订阅消息系统它可以处理消费者规模的网站中的所有动作流数据。 这种动作网页浏览搜索和其他用户的行动是在现代网络上的许多社会功能的一个关键因素。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。 对于像Hadoop的一样的日志数据和离线分析系统但又要求实时处理的限制这是一个可行的解决方案。Kafka的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理也是为了通过集群机来提供实时的消费。 Kafka是一种高吞吐量的分布式发布订阅消息系统有如下特性
通过O(1)的磁盘数据结构提供消息的持久化这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。文件追加的方式写入数据过期的数据定期删除高吞吐量即使是非常普通的硬件Kafka也可以支持每秒数百万的消息。支持通过Kafka服务器和消费机集群来分区消息。支持Hadoop并行数据加载。
Kafka相关概念
Broker
Kafka集群包含一个或多个服务器这种服务器被称为broker
Topic
每条发布到Kafka集群的消息都有一个类别这个类别被称为Topic。物理上不同Topic的消息分开存储逻辑上一个Topic的消息虽然保存于一个或多个broker上但用户只需指定消息的Topic即可生产或消费数据而不必关心数据存于何处
Partition
Parition是物理上的概念每个Topic包含一个或多个Partition.
Producer
负责发布消息到Kafka Broker
Consumer
消息消费者向Kafka Broker读取消息的客户端。
Consumer Group
每个Consumer属于一个特定的Consumer Group可为每个Consumer指定group name若不指定group name则属于默认的group。
Kafka一般应用在大数据日志处理或对实时性少量延迟可靠性少量丢数据要求稍低的场景使用。 六、参考资料 以下是本次分享参考的资料和推荐大家参考的资料。
参考资料可参考资料
JMS
点对点和发布订阅模型的对比深入浅出JMS(一)--JMS基本概念
RabbitMQ
百度百科RabbitMQ柯南君看大数据时代下的IT架构2消息队列之RabbitMQ-基础概念详细介绍
Zero MQ
高性能的通讯库-zeroMQ的几个高性能特征百度文库ZeroMQ使用环境和结构详细分析
Kafka
百度百科KafkaApache Kafka下一代分布式消息系统kafka一个分布式消息系统
参考
大型网站架构系列分布式消息队列一大型网站架构系列消息队列二 转自https://juejin.im/entry/590c2d9061ff4b006239098e