浅析Linux中的零拷贝技术

Jesuslovesme 2019-04-24

内核空间、用户空间、拷贝过程

当应用程序访问某块数据时，操作系统首先会检查，是不是最近访问过此文件，文件内容是否缓存在内核缓冲区，如果是，操作系统则直接根据read系统调用提供的buf地址，将内核缓冲区的内容拷贝到buf所指定的用户空间缓冲区中去。如果不是，操作系统则首先将磁盘上的数据拷贝的内核缓冲区，这一步目前主要依靠DMA来传输，然后再把内核缓冲区上的内容拷贝到用户缓冲区中。

接下来，write系统调用再把用户缓冲区的内容拷贝到网络堆栈相关的内核缓冲区中，最后socket再把内核缓冲区的内容发送到网卡上。

浅析Linux中的零拷贝技术

在此过程中，我们没有对文件内容做任何修改，那么在内核空间和用户空间来回拷贝数据无疑就是一种浪费，而零拷贝主要就是为了解决这种低效性。

什么是零拷贝技术（zero-copy）？

零拷贝主要的任务就是避免CPU将数据从一块存储拷贝到另外一块存储，主要就是利用各种零拷贝技术，避免让CPU做大量的数据拷贝任务，减少不必要的拷贝，或者让别的组件来做这一类简单的数据传输任务，让CPU解脱出来专注于别的任务。这样就可以让系统资源的利用更加有效。

我们继续回到引文中的例子，我们如何减少数据拷贝的次数呢？

一个很明显的着力点就是减少数据在内核空间和用户空间来回拷贝，这也引入了零拷贝的一个类型：

让数据传输不需要经过user space

使用mmap

我们减少拷贝次数的一种方法是调用mmap()来代替read调用：

buf = mmap(diskfd, len);

write(sockfd, buf, len);

应用程序调用mmap()，磁盘上的数据会通过DMA被拷贝的内核缓冲区，接着操作系统会把这段内核缓冲区与应用程序共享，这样就不需要把内核缓冲区的内容往用户空间拷贝。应用程序再调用write()，操作系统直接将内核缓冲区的内容拷贝到socket缓冲区中，这一切都发生在内核态，最后，socket缓冲区再把数据发到网卡去。

看图很简单：

浅析Linux中的零拷贝技术

: Jesuslovesme

相关推荐

设计模式系列—原型模式

23种设计模式快速记忆的请看上面第一篇，本篇和大家一起来学习原型模式，在学习原型模式之前我们需要先认识下浅拷贝和深拷贝这两个概念。浅拷贝是按位拷贝对象，它会创建一个新对象，这个对象有着原始对象属性值的一份精确拷贝。复制了对象的引用地址，两个对象指向同一个内

zhongshish 0喜欢 / 0评论 2020-10-21

源码分析C++的string的实现

我们平时使用C++开发过程中或多或少都会使用std::string，但您了解string具体是如何实现的吗，这里程序喵给大家从源码角度分析一下。string的常见的实现方式有几种？string类的内部结构是什么样子？string内部使用的内存是如何分配管理

abfdada 0喜欢 / 0评论 2020-08-26

从原型模式到浅拷贝和深拷贝

问题“如果你有一个对象，并希望生成与其完全相同的一个复制品，你该如何实现呢?首先，你必须新建一个属于相同类的对象。然后，你必须遍历原始对象的所有成员变量，并将成员变量值复制到新对象中。for { Sheep sheep = new Shee

jinfeng0 0喜欢 / 0评论 2020-08-03

浅析Linux中的零拷贝技术

本文探讨Linux中主要的几种零拷贝技术以及零拷贝技术适用的场景。为了迅速建立起零拷贝的概念，我们拿一个常用的场景进行引入：。在写一个服务端程序时，文件下载是一个基本功能。这时候服务端的任务是：将服务端主机磁盘中的文件不做修改地从已连接的socke

libowenhit 0喜欢 / 0评论 2020-07-23

浅析Linux中的零拷贝技术

在写一个服务端程序时，文件下载是一个基本功能。这时候服务端的任务是：将服务端主机磁盘中的文件不做修改地从已连接的socket发出去，我们通常用下面的代码完成：。基本操作就是循环的从磁盘读入文件内容到缓冲区，再将缓冲区的内容发送到socket。实际上在以上I

luckykapok 0喜欢 / 0评论 2020-07-06

Python中的深拷贝和浅拷贝

以及 python中的传参到底是传递值还是传递引用。python中的可变数据类型主要有 : 指的是在内存地址不变的情况下，可变数据类型的‘值’是可以发生改变的，如果可变类型是 +=, append等这种操作的话只是改变了变量的值，而不会新建一个对象，还是指

Jonderwu 0喜欢 / 0评论 2020-07-05

python当中的深浅copy

可变对象指可以在原处修改，而不用创建新的对象；不可变对象指不支持在原处修改，只能通过表达式创建新的对象，然后把结果分配给变量。在Python中对象的赋值其实就是对象的引用。拷贝有copy模块提供。换句话来说，深拷贝的对象和原始对象是完全不同的两个对

zk0 0喜欢 / 0评论 2020-06-21

Rust所有权进阶部分

　　为了演示所有权功能，我们需要一些复杂的数据类型，之前介绍的类型都是存储在栈上的并且当离开作用域就被移除栈，不过我们需要一个存储在堆上的数据来探索Rust是如何知道该在何时清理数据的。比如用户要输入时; let s = String::from, 这样就

Colourful 0喜欢 / 0评论 2020-06-14

Netty中使用零拷贝方式写大数据

因为网络饱和的可能性，如何在异步框架中高效地写大块的数据是一个特殊的问题。由于写操作是非阻塞的，所以即使没有写出所有的数据，写操作也会在完成时返回并通知ChannelFuture。当这种情况发生时，如果仍然不停地写入，就有内存耗尽的风险。所以在写大型数据时

arctan0 0喜欢 / 0评论 2020-06-11

nginx优化之keepalive

一个解决方案是 TCP 堆栈的 TCP_NODELAY选项。这样就可以使缓冲区中的数据立即发送出去。这一机制是由Nagle算法保证。Nagle化后来成了一种标准并且立即在因特网上得以实现。现在假设某个应用程序发出了一个请求，希望发送小块数据。如果请求立即发

houjinkai 0喜欢 / 0评论 2020-06-03

快照与备份的技术

快照是现在很多主流云服务器的数据备份功能,用于服务器故障时的数据恢复,将系统数据恢复至错误发生以前的某个时间。必专须先通过还原还原到数据库，然后属才能访问其中的数据。由于镜像服务器上的数据库始终处于“还原”状态，因此可以在特定的时间点生成快照，以便可以在镜

whyname 0喜欢 / 0评论 2020-05-28

rocketMQ(九) rocketMQ 高性能分析之ZeroCopy零拷贝技术

请求kernel直接把disk的data传输给socket，而不是通过应用程序传输。Zero copy大大提高了应用程序的性能，减少不必要的内核缓冲区跟用户缓冲区间的拷贝，从而减少CPU的开销和减少了kernel和user模式的上下文切换，达到性能的提升。

LCFlxfldy 0喜欢 / 0评论 2020-05-14

linux下如何实现快速拷贝大文件

远程拷贝数据的时候，我们一般使用rsync命令，但是如果拷贝大量的小文件，会导致rsync的传输速度慢。使用tar pv lz4打包压缩传输，可以解决这问题，使用这个方法，等同于使用scp、rsync传输大文件。实测，使用rsync传输1200G，单个文件

plusz 0喜欢 / 0评论 2020-05-09

nginx （linux）sendfile 参数解释

sendfile实际上是 Linux2.0+以后的推出的一个系统调用，web服务器可以通过调整自身的配置来决定是否利用 sendfile这个系统调用。来看看底层是怎么执行上面2行代码的：1、系统调用 read()产生一个上下文切换：从 user mode

bruce 0喜欢 / 0评论 2020-05-09

【设计模式】5.原型模式

　　原型模式，使用原型实例复制生成新的对象。若某个类的实例化比较复杂，完全重新创建成本较大，这时可以使用原型模式。这种模式是在内存（堆）中拷贝对象，比直接new一个对象节省资源。对象拷贝的时候构造器是不会执行。这里Cloneable即可为Prototype

钟鼎 0喜欢 / 0评论 2020-05-01

Python基础

浅拷贝只拷贝第一层。　　如果发生了拷贝,内存地址一定发生变化,说白了拷贝就是自己新建地址,放复制过来的内容.

HMHYY 0喜欢 / 0评论 2020-04-30

给SAN存储做定时/实时备份的操作方法

在SAN环境下，磁盘到磁盘的备份通常将存储阵列当成虚拟磁带库。通常情况下服务器磁盘的性能总是超过磁带的，因而较物理磁带库，使用虚拟磁带库从本质上能够更加快速地完成数据备份。在这种架构中会周期性地将虚拟磁带库中的内容拷贝到保存在离线站点的物理磁带库中。在这种

常言道 0喜欢 / 0评论 2020-04-25

N年Python老司机，血泪总结新手常见10大错误

作为python的新手，大家在上手python的时候都会或多或少的接触到一些rookie mistake，也就是菜鸟级别的错误。小编作为一个老司机也是从这些错误中一点一点的积累经验，才慢慢的能够熟练的使用python。遇到错误不可怕，关键是要学会如何去避

joyjoy0 0喜欢 / 0评论 2020-03-30

python变量存储，理解赋值、浅拷贝、深拷贝

在高级语言中，变量是对内存及其地址的抽象。采用这种方式，变量所需的存储空间大小一致，因为变量只是保存了一个引用。也被称为对象语义和指针语义。python中变量与对象的引用关系类似于c语言的指针变量与指针指向值的关系。　　在python的数据结构中，对象分为

hanyujianke 0喜欢 / 0评论 2020-03-06

Django虚拟环境拷贝到另一台电脑，不能直接使用的问题

最近折腾一个django的项目，想快速部署到服务器看看效果。virtualenv号称python三大神器之一，因此我打算把pycharm自动创建的虚拟环境直接拷贝到服务器运行代码。谁知出现了问题。系统中必须要安装有对应版本的python，并且卸载之后当前虚

cuiwenjie 0喜欢 / 0评论 2020-02-26

C++ 拷贝控制操作（三/五法则）

当定义一个类时，我们显式地或隐式地指定了此类型的对象在拷贝、赋值和销毁时做什么。一个类通过定义三种特殊的成员函数来控制这些操作，分别是拷贝构造函数、拷贝赋值运算符和析构函数。在较新的 C++11 标准中，为了支持移动语义，又增加了移动构造函数和移动赋值运算

一个逗逗 0喜欢 / 0评论 2020-02-24

C++中的深拷贝与浅拷贝

对诸如shared_ptr这样的资源管理类的copying行为[注1]，其深拷贝是指一并拷贝其包覆的资源，而非引用计数等其它行为

shangs00 0喜欢 / 0评论 2020-02-19

MySQL之Xtrabackup备份与恢复

　　MySQL冷备、mysqldump、MySQL热拷贝都无法实现对数据库进行增量备份。在实际生产环境中增量备份是非常实用的，如果数据大于50G或100G，存储空间足够的情况下，可以每天进行完整备份，如果每天产生的数据量较大，需要定制数据备份策略。例如每周

勇往直前 0喜欢 / 0评论 2020-02-13

python中的“赋值与深浅拷贝”

赋值不会改变内存中数据存放状态，比如在内存中存在一个名为data的数据，此时若执行语句data_01 = data，则现在该份数据有了两个名称,其余都不发生改变，使用任何一个名称对数据进行操作，那么用另外一个名称拿数据时，数据会呈现之间发生的改变。无论是哪

yogoma 0喜欢 / 0评论 2020-02-13

根文件系统制作（一）

UBIFS作为JFFS2的后继文件系统之一，在设计与性能上均较YAFFS2、JFFS2更适合于MLC NAND FLASH存储器。接下来进入rootfs目录，并在该目录下建立根目录树的第一层目录，执行“mkdir bin sbin etc dev proc

dongfangxiaozi 0喜欢 / 0评论 2020-02-12

Python核心编程 (全)

　　是对于一个对象的顶层拷贝，通俗的理解是：拷贝了引用，并没有拷贝内容。相当于把变量里面指向的一个地址给了另一个变量就是浅拷贝，而没有创建一个新的对象，如a=b。　　②deepcopy：深拷贝，里面不管是可变类型和不可变类型，被拷贝的对象都不会受到影响，递

小方哥哥 0喜欢 / 0评论 2020-02-01

docker拷贝宿主与容器中的文件

在宿主机上面执行命令

ujm0 0喜欢 / 0评论 2020-01-31

221 jQuery 拷贝对象：$.extend()

jQuery中分别为我们提供了两套快速获取和设置元素尺寸和位置的API，方便易用，内容如下。// console.log; // 会覆盖targetObj 里面原来的数据。console.log; // msg :{sex: "男",

tthappyer 0喜欢 / 0评论 2020-01-18

python 浅拷贝和深拷贝

　　深拷贝：会连子对象的内存也全部拷贝一份，对子对象的修改不会影响源对象

pythonxuexi 0喜欢 / 0评论 2020-01-12

vim中如何拷贝全文到win10的其他程序

vim有很多寄存器，其中在win10中，+号寄存器代表系统寄存器，在vim中只要把内容考到加号寄存器中，就可以在粘贴到其他程序里面了。

圆圆的世界CSDN 0喜欢 / 0评论 2020-01-10

Linux命令总结

管道: 可以理解成是一个容器，存放在终端显示的内容28.1 总结: ls /bin | more , cat， tree, ls都是可以结合管道使用完成分屏显示的

老谢的自留地 0喜欢 / 0评论 2020-01-08

远程登录和远程拷贝

A.安装ssh服务器 sudo apt-get install openssh-server. B.远程登陆 ssh 用户名@IP. ssh访问，如错误。可查看是否有该文件～/.ssh/known_ssh 尝试删除该文件解决。4>远程拷贝文件 sc

sshong 0喜欢 / 0评论 2020-01-08

Vim学习随笔

（一）Vim处理模式。编辑字符，通过Esc键进行切换。（二）Vim常用命令。保存并关闭文件: :wq. Vim拷贝/粘贴/删除。按单词移动：向前w/ 2w/,向后 b/ 2b/. 指定范围的替换：:21,23s/关键字/替换字/gc

linzb 0喜欢 / 0评论 2020-01-08

Linux 挂载移动硬盘拷贝数据（ubuntu）

可看到所有硬盘信息和分区信息，如：我的是/dev/sdb1 * 2048 976769023 488383488 7 HPFS/NTFS/exFAT. 先在服务器建立一个文件夹 sudo mkdir /media/disk ,然后把移动硬盘挂

andylanzhiyong 0喜欢 / 0评论 2013-06-07

Linux 企业实用命令 - 不断更新中

公司很多服务器都是Linux服务器，实际开发过程中，都是在Windows平台上进行开发，最终在部署到Linxu服务器上，在这过程中就会碰到许多常用的Linux命令。在这里这是写一个备份，避免忘记，以后会不停的更新相关有用的命令。将远程Linux服务器上的l

ftafta 0喜欢 / 0评论 2013-06-06

那些与Netty有关的知识点，你知道多少

Netty 原理Netty 是一个高性能、异步事件驱动的 NIO 框架，基于 JAVA NIO 提供的 API 实现。它提供了对TCP、UDP 和文件传输的支持，作为一个异步 NIO 框架，Netty 的所有 IO 操作都是异步非阻塞的，通过 Future

huaye00 0喜欢 / 0评论 2019-12-29

svn学习笔记

尽管Subversion的灵活性允许你自由布局版本库，但我们有一套推荐的方式，创建一个trunk目录来保存开发的“主线”，一个branches目录存放分支拷贝，tags目录保存标签拷贝，例如：。因为你的工作拷贝“同你系统上的文件和目录没有任何区别”，你可以

把握自己 0喜欢 / 0评论 2014-05-22

webpack静态资源拷贝插件

const copyWebpackPlugin=require('copy-webpack-plugin');from:__dirname+"/public/jquery.js",},from:__dirname+"/publ

csm0 0喜欢 / 0评论 2019-12-24

svn clean up命令的使用

如果SVN告诉你工作拷贝中的一部分已经“锁定”了，你就需要运行这个命令了。但有时SVN目录下可能有一些自己本地修改的文件，还未提交到SVN服务器，这时重新CHECKOUT需要注意本地文件的备份，并且不要强制覆盖服务器上其它人修改的内容。

dengweijunkedafu 0喜欢 / 0评论 2019-12-10

NGINX优化——包括HTTPS、KEEPALIVE等

一个解决方案是 TCP 堆栈的 TCP_NODELAY选项。这样就可以使缓冲区中的数据立即发送出去。这一机制是由Nagle算法保证。Nagle化后来成了一种标准并且立即在因特网上得以实现。现在假设某个应用程序发出了一个请求，希望发送小块数据。如果请求立即发

yongzhang 0喜欢 / 0评论 2019-12-09

redis 学习笔记：hash表的渐进式rehash

redis的数据库使用字典来作为底层实现的，对数据库的增删查改操作也是构建在对字典的操作之上。redis的字典使用hash表作为底层实现。redis作为一个广泛使用的内存数据库，时间和空间效率都是至关重要的。我们知道当hash表满员时会进行rehash,也

freesky 0喜欢 / 0评论 2019-11-27

scp和cp命令

Linux为我们提供了两个用于文件copy的命令，一个是cp，一个是scp，但是他们略有不同。-r 表示递归copy，若source中含有目录名，则将目录下之档案亦皆依序拷贝至目的地；-f 表示force，若目的地已经有相同档名的档案存在，则在复制前先予以

iOS开发笔记 0喜欢 / 0评论 2014-03-04

PY => Python好用深度技能工具介绍

也许这两行，你们当时疑惑过，并且现在也都知道了，当然重点并不在这里。。我无聊的时候想过，为什么单元素元祖要这样设计 -> (1,)?这是我个人原创理解的一个微不足道的知识点，但是印象却特别深刻。因为我反向推测出设计者为什么会设计出这种语法。后来有一

dangyang 0喜欢 / 0评论 2019-11-19

JavaScript中的浅拷贝与深拷贝

为什么会有浅拷贝与深拷贝什么是浅拷贝与深拷贝如何实现浅拷贝与深拷贝好了，问题出来了，那么下面就让我们带着这几个问题去探究一下吧！对于深拷贝的对象，改变源对象不会对得到的对象有影响。只是在拷贝的过程中源对象的方法丢失了，这是因为在序列化 JavaScript

bangrenzhuce 0喜欢 / 0评论 2019-11-19

我是这样学习Python列表的

不同于 C++ 和 Java，在 Python 中，没有在标准库中内置数组类型，而是通常利用列表来表示数组，同时它也比数组的使用要灵活得太多。列表是 Python 中最基本的数据结构，列表中的元素的存储是有序的，所以我们可以直接利用索引去访问列表中的值。对

youandme 0喜欢 / 0评论 2019-11-17

shell脚本-数组-拷贝

2、shell读取文件中的内容，并将其存入到变量中

RobinLiew 0喜欢 / 0评论 2015-01-23

《Linux内核设计与实现》读书札记

--[endif]-->处理器活动范围为：。运行于用户空间，执行用户进程。--[endif]-->单内核与微内核。Windows NT和Mac OS X的Mach都是微内核，Linux是单内核，但是吸取了微内核的精华：模块化设计，抢占式内核，支

xiyoukeke 0喜欢 / 0评论 2010-08-15

【编程语言】Python 的参数传递、返回值、浅拷贝、深拷贝

Python的参数传递，无法控制引用传递还是值传递。对于不可变对象的参数，更类似值传递；对于可变对象，更类似引用传递。l = [5,6,7,8,9] # l在修改后，指向的地址和main函数中l指向的地址仍相同，此时main函数中l的值也会改变。str2

zhglinux 0喜欢 / 0评论 2019-11-16

Windows与Linux系统拷贝文件之pscp的使用分享

forfiles /p D:\backup /m *.zip -d -30 /c "cmd /c del /f @path"

GeorgeTH 0喜欢 / 0评论 2019-11-08

很牛的vim使用技巧

部分技巧在vi上也可以使用，但是现在基本上都是用vim了。熟练使用vim的人自然不必细读，如果能留下您的宝贵意见，本人将感激不尽。

hengrjgc 0喜欢 / 0评论 2011-02-03