集群(一)- 基础
00 分钟
2024-6-25
Created
Jun 6, 2024 03:36 AM
Tags

讲在集群前

流量相关

  • PV
PV(page view)即页面浏览量或点击量。
是衡量一个网站或网页用户访问量。具体的说, PV 值就是所有访问者在24小时(0点到24点)内看了某个网站多少个页面或某个网页多少次。PV 是指页面刷新的次数,每一次页面刷新,就算做一次 PV 流量。
  • UV
UV(Unique Visitor)独立访客。
统计1天内访问某站点的用户数(以 cookie 为依据);访问网站的一台电脑客户端为一个访客。可以理解成访问某网站的电脑的数量。网站判断来访电脑的身份是通过来访电脑的 cookies 实现的。如果更换了 IP 后但不清除 cookies,再访问相同网站,该网站的统计中 UV 数是不变的。如果用户不保存 cookies 访问、清除了 cookies 或者更换设备访问,计数会加1。00:00-24:00内相同的客户端多次访问只计为1个访客。
  • IP
独立 IP 的访问用户。
指1天内使用不同 IP 地址的用户访问网站的数量,同一 IP 无论访问了几个页面,独立 IP 数均为1。但是假如说两台机器访问而使用的是同一个 IP,那么只能算是一个 IP 的访问。
一般情况PV > UV > IP
小贴士
IP 和 UV 之间的数据不会有太大的差异,通常 UV 量会比 IP 量高出一点,每个 UV 相对于每个 IP 更准确地对应一个实际的浏览者。
  • UV 大于 IP
    • 这种情况就是在网吧、学校、公司等,公用相同 IP 的场所中不同的用户,或者多种不同浏览器访问您网站,那么 UV 数会大于 IP 数。
  • UV 小于 IP
    • 在家庭中大多数电脑使用 ADSL 拨号上网,所以同一个用户在家里不同时间访问您网站时, IP 可能会不同,因为它会根据时间变动 IP ,即动态的 IP 地址,但是实际访客数唯一,便会出现 UV 数小于 IP 数。

性能扩展

  • 垂直扩展(纵向扩展)
为同样的计算资源池加入更多资源,比如增加更多内存、磁盘或是虚拟cpu,来应对增加的应用负载。
典型案例:对称多处理机(SMP)
  • 水平扩展(横向扩展)
需要向计算平台加入更多的机器或设备,来处理增长的需求。

集群概述

什么是集群 ?

💡
集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以统一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高 可用性可缩放性
通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益,其任务调度则是集群系统中的核心技术。
简单总结为:一组协同工作但对外表现为一个整体的服务器组
无论是哪种集群,都至少包括两台节点服务器,而对外表现为一个整体,只提供一个访问入口(域名或IP地址),相当于一台大型计算机。
集群系统在面对不同负载和故障情况下的表现即体现在集群的可用性和可伸缩性上。
  • 可用性(Availability)
    • 指的是集群系统对用户请求的响应能力,在面对部分故障或异常情况时能够继续提供服务。
      具体来说,可用性是指集群系统能够在预期的时间内正常运行,对用户提供稳定的服务,不会因为某个节点的故障或网络问题而导致整个系统不可用。在实际应用中,通常使用百分比来表示可用性,例如"99.99% 可用性"表示系统每年只有很短的时间不可用。
  • 可伸缩性(Scalability)
    • 指的是集群系统在面对不断增长的负载或数据规模时,能够有效地扩展性能和资源,以保持系统的高性能和吞吐量。
      可伸缩性可以分为纵向伸缩性(添加更多资源,如CPU、内存)和横向伸缩性(通过增加节点数量来分担负载)两种。一个可伸缩的集群系统应当能够灵活地扩展,适应业务的增长需求,而不会因为负载增加而导致性能下降或故障发生。
集群的可用性和可伸缩性是衡量集群系统质量和稳定性的重要指标,对于构建高可用、高性能的分布式系统非常关键。

集群系统的优点

  1. 高可扩展性:如上所述,可以通过增加服务器数量达到 性能扩展
  1. 高可用性:集群中的一个节点失效,它的任务可以传递给其他节点。可以有效防止 单点故障
  1. 高性能:负载均衡集群允许系统同时接入更多的用户。
  1. 高性价比:可以采用廉价的硬件服务器构造高性能的系统。
 
负载和分布式的区别?
饭店原来只有一个厨师,切菜洗菜备料炒菜全干。后来客人多了,厨房一个厨师忙不过来,又请了个厨师,两个厨师都能炒一样的菜,这两个厨师的关系是负载均衡。为了让厨师专心炒菜,把菜做到极致,又请了个配菜师负责切菜,备菜,备料,厨师和配菜师的关系是分布式,一个配菜师也忙不过来了,又请了个配菜师,两个配菜师关系是负载均衡

集群的分类

根据群集所针对的目标差异,可以分为以下三种类型:
  • LBC负载均衡集群
    • 以提高应用系统的响应能力、尽可能处理更多的访问请求、较少延迟为目的,获得高并发、高负载的整体性能。
      例如,“DNS轮询” 、“应用层交换”、“反向代理”等都可用做负载均衡集群。LBC 的负载分配 依赖于主节点的分流算法,将来自客户机的访问请求分担给多个服务器节点,从而缓解整个系统的负载压力。
      负载均衡集群图例
      负载均衡集群图例
  • HAC高可用集群
    • 以提高应用系统的可靠性,尽可能地减少中断时间为目标,确保服务的连续性,达到高可用(HA)的容错效果,例如,“故障切换”。
      “双机热备”、“多机热备”、等都属于高可用群集技术,HAC 的工作方式包括双工和主从两种模式。双工就是所有节点同时在线;主从则只有主节点在线,但当出现故障时从节点能自动切换为主节点,和 Cisco 路由器的 HSRP 原理类似。
      不同类型的群集可以根据实际需求进行合并,如 高可用的负载均衡集群
      高可用的负载均衡集群
      高可用的负载均衡集群
  • HPC高性能计算集群(科学计算集群)
    • 以提高应用系统的CPU运算速度,扩展硬件资源和分析能力为目标,获得相当于大型、超级计算机的高性能运算(HPC)能力。
      例如,“云计算”、“网格计算”也可以当成 HPC 的一种。HPC 群集的高性能依赖于“分布式计算” “并行计算”,通过专用硬件和软件将多台服务器的 CPU 、内存等资源整合在一起,实现只有大型、超级计算机才具备的计算能力。
      高性能计算集群
      高性能计算集群

相关笔记:
 
上一篇
Linux 基础知识 往期汇总
下一篇
<K8S> vol. 01 - kubernetes 组件