Varnish介绍

稀土 2018-02-24

varnish介绍

varnish

官方网站
        https://varnish-cache.org/
        http://book.varnish-software.com/4.0/
    Varnish是反向HTTP代理,有时被称为gaHTTP加速器或Web加速器,反向代理是作为普通服务器向客户端显示的代理服务器。
    varnish(高速缓存)存储器中的文件或文件片段,用于减少将来的等效请求时的响应时间和网络带宽消耗。
    varnish设计用于现代硬件,现代操作系统和现代工作负载。
    Varnish采用全新的软件体系结构,和现在的硬件体系配合比较紧密。
    Varnish不仅仅是用缓存内容来加速你服务器的反向HTTP代理,根据安装情况,varnish也可以用作:
        web应用防火墙,DDoS攻击防御者,热链保护器,负载平衡器,整合点,单点登录网关,认证授权策略机制,快速修复不稳定的后端和HTTP路由器。
    varnish是灵活的,因为可以在其Varnish配置语言(VCL)中编写自己的缓存策略,VCL是基于C的域特定语言,配置完成VCL后,将VCL转换为C代码并进行编译,因此Varnish可以快速执行。

varnish的特点

Varnish基于内存缓存,重启后数据将消失      
    利用虚拟内存方式,io性能好
    支持设置0~60秒内的精确缓存时间
    VCL配置管理比较灵活
    32位机器上缓存文件大小为最大2G
    具有强大的管理功能,例如top,stat,admin,list等
    状态机设计巧妙,结构清晰
    利用二叉堆管理缓存文件,达到积极删除目的

varnish的工作原理

Varnish 与一般服务器软件类似,分为master 进程和child 进程。
        master进程读入存储配置文件,调用合适的存储类型,然后创建/读入相应大小的缓存文件,接着master 初始化管理该存储空间的结构体,然后fork 并监控child 进程。child进程在主线程的初始化的过程中,将前面打开的存储文件整个mmap 到内存中,此时创建并初始化空闲结构体,挂到存储管理结构体,以待分配。
        child进程分配若干线程进行工作,主要包括一些管理线程和很多worker 线程。
    varnish的某个负责接收新HTTP 连接线程开始等待用户,如果有新的HTTP连接过来,它总负责接收,然后唤醒某个等待中的线程,并把具体的处理过程交给它。
    Worker线程读入HTTP 请求的URI,查找已有的object,如果命中则直接返回并回复用户,如果没有命中,则需要将所请求的内容,从后端服务器中取过来,存到缓存中,然后再回复。
    分配缓存的过程:
        它根据所读到object 的大小,创建相应大小的缓存文件。
        为了读写方便,程序会把每个object的大小变为最接近其大小的内存页面倍数。
        然后从现有的空闲存储结构体中查找,找到最合适的大小的空闲存储块,分配给它。
        如果空闲块没有用完,就把多余的内存另外组成一个空闲存储块,挂到管理结构体上。
        如果缓存已满,就根据LRU 机制,把最旧的object 释放掉。
    释放缓存的过程:
        有一个超时线程,检测缓存中所有object 的生存期,如果超初设定的TTL(Time To Live)没有被访问,就删除之,并且释放相应的结构体及存储内存。
        注意释放时会检查该存储内存块前面或后面的空闲内存块,如果前面或后面的空闲内存和该释放内存是连续的,就将它们合并成更大一块内存。
    整个文件缓存的管理,没有考虑文件与内存的关系,实际上是将所有的object 都考虑是在内存中,如果系统内存不足,系统会自动将其换到swap 空间,而不需要varnish 程序去控制。

varnish的优缺点

varnish的优点
        Varnish采用了“Visual Page Cache”技术,所有缓存的数据都直接从内存读取。
        Varnish稳定性比Squid高,宕机率很低。
        通过Varnish管理端口,可以使用正则表达式快速、批量地清除部分缓存。
        Varnish可以支持更多的并发连接。
    
    varnish的缺点
        Varnish在高并发状态下,CPU、I/O和内存等资源的开销高于Squid。
        Varnish的进程一旦挂起、崩溃或者重启,缓存的数据都会从内存中释放出来,此时的所有请求都会被发送到后端应用服务器上,在高并发的情况下,就会给后端服务器造成很大压力。

varnish设计原则

varnish设计目的:
        解决实际问题
        运行于现代硬件(64位多核架构)
        与内核协同工作,而不是针对内核
        将Varnish配置语言VCL翻译成C语言
        可通过varnish模块VMODs扩展
        通过其面向工作区的共享内存模型减少锁定争用
    varnish的重点始终是性能和灵活性。
    Varnish使用面向工作区的内存模型,而不是在运行时分配确切的空间空间。
    varnish不管理其分配的内存,但它将此任务委托给操作系统,因为内核通常可以比用户空间程序更好地执行此任务。
    事件过滤器和通知设施,例如epoll和kqueue是操作系统的高级特性,这些特性是为像varnish这样的高性能的服务器设计的,通过使用这些特性,varnish可以移动大量的复杂信息到操作系统的内核中,这样会更好地决定那些线程会被执行。
    Varnish使用Varnish配置语言VCL,允许准确地指定如何使用和组合Varnish的功能。
    VCL被翻译成C编程语言代码,该代码使用标准C编译器进行编译,然后在运行时直接动态链接到Varnish中。
    当你需要的功能在VCL中没有提供时,你可以在数据库中找到个ip地址,以便于你可以写原始C编码在自己的VCL上。
    那个地址是在线的,但不鼓励使用,相比于在线的C,建议把你的C编码放入varnish的VMOD模块中。
    VMOD通常以VCL和C编程语言编码,实际上,VMOD是一个共享库,具有可以从VCL代码调用的函数。
    varnish共享存储日志(VSL)允许Varnish让其他应用程序解析数据并提取有用的信息,这个过程几乎无需花费时间。

存储对象

对象:HTTP响应消息的本地存储
        varnish的对象存储在内存中,并通过hash key进行寻址
        可以控制hashing
        多个对象可以具有共同的hash
    对象是本地存储的响应信息且被定义在协议中,这些信息被映射为hash值并存储在内存中,涉及到的相关对象被存储hash树中。
    Varnish的一个相当独特的功能是它允许你控制散列算法的输入。
    默认情况下,hash key是由HTTP主机头和URL制成,且非常重要。
    但是,你也可以通过使用其他东西来创建hash key,例如,你可以使用Cookie或客户端请求的用户代理来创建hash key。
    HTTP指定可以根据客户端的偏好从相同的URL提供多个对象,例如,gzip格式的内容只发送到指示gzip支持的客户端。
    varnish在一个hash key下存储单个压缩对象。
    根据客户端请求,Varnish会检查Accept-Encoding头域。
    如果客户端不接受gzip对象,Varnish会即时解压缩对象并将其发送给客户端。

对象生命周期

Varnish介绍
图中显示了缓存对象的生命周期。
    缓存对象具有原始时间戳t_origin和三个持续时间属性:1)TTL,2)grace和3)keep。
    t_origin是在后端创建对象的时间。
    一个对象生活在缓存中,直到经过之后TTL + grace + keep,该对象被Varnish守护进程删除。
    VCL - vcl_backend_fetch和 VCL - vcl_backend_response有选择的解释了varnish是如何处理后端的响应以及这些时间属性是如何影响后续行动的。

varnish的应用程序

varnish应用程序组成:
        /usr/bin/varnishadm
        /usr/bin/varnishhist
        /usr/bin/varnishlog
        /usr/bin/varnishncsa
        /usr/bin/varnishstat
        /usr/bin/varnishtest
        /usr/bin/varnishtop
        /usr/sbin/varnishd
        。。。。
    varnissh最重要的部分是守护进程(后台服务)varnishd。
    核心进程varnish的接收来自客户端的HTTP请求,并将请求发送到后端backend,缓存返回的缓存的结果并回复客户端请求。 
    varnishtest是用于测试您的Varnish安装的脚本驱动程序, varnishtest非常强大,因为它允许创建客户端模型,从模型或真实的后端中获取内容,与实际的Varnish配置交互,并说明预期的行为。
    varnishadm控制正在运行的Varnish实例,该 varnishadm 实用程序建立在的命令行界面(CLI)连接的varnishd上,此实用程序是唯一可能影响运行的Varnish实例的实用程序,可以使用varnishadm开始和停止varnishd,更改配置参数,重新加载Varnish配置语言(VCL),查看最新的参数文档等。
    varnish日志varnishlog提供大量信息,因此通常需要对其进行过滤。例如,“只显示与X匹配的”。 
    varnishstat用于访问全局计数器,它提供总体统计信息,例如请求总数,对象数量等, varnishstat在将其varnishlog用于分析您的varnish安装时特别有用。

varnish安装

varnish官方站点: http://www.varnish-cache.org/
    直接下载安装包进行安装
    采用epel源安装
        yum install varnish
        rpm -ql varnish
        /etc/logrotate.d/varnish
        /etc/varnish
        /etc/varnish/default.vcl
        /etc/varnish/varnish.params
        /run/varnish.pid
        /usr/bin/varnishadm
        /usr/bin/varnishhist
        /usr/bin/varnishlog
        /usr/bin/varnishncsa
        /usr/bin/varnishstat
        /usr/bin/varnishtest
        /usr/bin/varnishtop
        /usr/lib/systemd/system/varnish.service
        /usr/lib/systemd/system/varnishlog.service
        /usr/lib/systemd/system/varnishncsa.service
        /usr/sbin/varnish_reload_vcl
        /usr/sbin/varnishd
        /usr/share/doc/varnish-4.0.4
        /var/lib/varnish
        /var/log/varnish

varnish程序架构

Manager进程
        Cacher进程,包含多种类型的线程:
                accept, worker, expiry, ... 
        shared memory log:
                统计数据:计数器;
                日志区域:日志记录;
                    varnishlog, varnishncsa, varnishstat... 
        配置接口:VCL(Varnish Configuration Language)
                vcl complier --> c complier --> shared object

varnish的程序环境

varnish环境配置,配置varnish服务进程的工作特性,例如监听的地址和端口,缓存机制:
            /etc/varnish/varnish.params
        VCL配置文件,配置各Child/Cache线程的缓存策略:
            /etc/varnish/default.vcl
        主程序:
                /usr/sbin/varnishd
        CLI interface:
                /usr/bin/varnishadm
        Shared Memory Log交互工具:
                /usr/bin/varnishhist
                /usr/bin/varnishlog
                /usr/bin/varnishncsa
                /usr/bin/varnishstat
                /usr/bin/varnishtop     
        测试工具程序:
                /usr/bin/varnishtest
        VCL配置文件重载程序:
                /usr/sbin/varnish_reload_vcl
        Systemd Unit File:
                /usr/lib/systemd/system/varnish.service:varnish服务
                /usr/lib/systemd/system/varnishlog.service:varnish日志服务
                /usr/lib/systemd/system/varnishncsa.service :varnish日志持久的服务

相关推荐