Java分布式详解(6大Java分布式技术)

Java分布式详解(6大Java分布式技术)-mikechen

Java分布式是大型网站必备技术，Java分布式技术会涉及到分布式架构、分布式计算等内容，下面重点详解Java分布式。

分布式计算框架

例如Hadoop、Spark、Flink等，用于实现大数据处理和分布式计算。

1.Spark

Spark是专为大规模数据处理而设计的快速通用的计算引擎，设计用于大型分布式数据处理、数据中心或云计算。

Java分布式详解(6大Java分布式技术)-mikechen

Hadoop虽然已成为大数据技术的事实标准，但其本身还存在诸多缺陷，最主要的缺陷是其MapReduce计算模型延迟过高，无法胜任实时、快速计算的需求，因而适用于离线批处理的应用场景。

2.Flink

Flink是Apache Apache的一个开源的流处理框架，用于在无边界和有边界数据流上进行有状态的计算。

在Flink之前主流的计算框架以Hadoop和Spark占据主流，Hadoop是第一代大数据计算框架，而其后的Spark则是在Hadoop的基础上进行内存计算，实现了计算性能上的大大提升。

分布式消息中间件

例如：Kafka、RocketMQ、RabbitMQ等，用于实现异步消息传输和解耦。

1.Kafka

Java分布式详解(6大Java分布式技术)-mikechen

Kafka是一个由Scala和Java编写的企业级的消息发布和订阅系统，主要应用如下场景：

Java分布式详解(6大Java分布式技术)-mikechen

1).日志收集

一个公司可以用Kafka可以收集各种服务的log。

2).消息系统

解耦和生产者和消费者，这也是目前使用比较多的场景，相当于起了一个缓存消息的作用。

3).用户活动跟踪

Kafka经常被用来记录web用户，或者app用户的各种活动，如浏览网页、搜索、点击等活动。

4).运营指标

Kafka也经常用来记录运营监控数据，包括：收集各种分布式应用的数据，生产各种操作的集中反馈，比如：报警和报告。

2.RocketMQ

RocketMQ是阿里研发的一个队列模型的消息中间件，后开源给apache基金会成为了apache的顶级开源项目。

RocketMQ架构，如下图所示：

Java分布式详解(6大Java分布式技术)-mikechen

RocketMQ架构：主要由NameServer、Broker、Producer以及Consumer四部分构成。

主要应用于：秒杀削峰填谷、异步解耦等场景。

Java分布式详解(6大Java分布式技术)-mikechen

3.RabbitMQ

Java分布式详解(6大Java分布式技术)-mikechen

RabbitMQ是一个开源的AMQP实现，服务器端用Erlang语言编写，支持多种客户端。

RabbitMQ架构，如下图所示：

Java分布式详解(6大Java分布式技术)-mikechen

分布式数据库

例如：MySQL Cluster、Cassandra等，用于实现数据的高可用性、容错性和可扩展性。

分布式缓存

例如Redis、Memcached等，用于提高系统的性能和扩展性。

Redis 是一个开源的，使用C语言编写的，支持网络交互的、可基于内存也可持久化的Key-Value数据库存储系统。

更加详细的Redis介绍，请查看：Redis教程(万字图文全面详解)

分布式RPC框架

例如Dubbo、gRPC等，用于实现分布式服务调用和远程过程调用。

Dubbo是一个Java RPC框架，致力于分布式、高性能、透明化的远程服务调用方案。

1)服务提供者（Server）

对外提供后台服务，将自己的服务信息，注册到注册中心

2)注册中心（Registry）

用于服务端注册远程服务以及客户端发现服务。

目前主要的注册中心可以借由 zookeeper，eureka，consul，etcd 等开源框架实现。

比如：阿里的Dubbo就是采用zookeeper实现注册中心。

3)服务消费者（Client）

从注册中心获取远程服务的注册信息，然后进行远程过程调用。

Dubbo核心功能，主要提供了：远程方法调用、智能容错和负载均衡、提供服务自动注册、自动发现等高效服务治理功能。

更加详细的Dubbo介绍，请查看:Dubbo最全详解(万字图文教程)。

分布式事务

分布式事务是指涉及多个计算机，或进程的一系列操作，这些操作需要保证在所有节点上的一致性和原子性。

如下图所示：
Java分布式详解(6大Java分布式技术)-mikechen

例如XA事务、TCC事务等，用于保证分布式环境下的数据一致性。

更加详细的分布式事务，请查看：分布式事务详解(四种分布式事务方案)。

在Java分布式应用中，需要考虑多个节点之间的通信和协作，通常需要使用网络编程和多线程编程技术来实现。

同时在Java分布式环境下，还需要考虑的数据安全和一致性问题，例如分布式锁、数据同步等。

分布式计算框架

分布式消息中间件

分布式数据库

分布式缓存

分布式RPC框架

分布式事务

大厂技术架构面试专题

阿里技术架构面试专题

腾讯技术架构面试专题

蚂蚁技术架构面试专题