TimelessFaith 2009-12-16
mmap()及其相关系统调用
mmap()系统调用使得进程之间通过映射同一个普通文件实现共享内存。普通文件被映射到进程地址空间后,进程可以向访问普通内存一样对文件进行访问,不必再调用read(),write()等操作。
注:实际上,mmap()系统调用并不是完全为了用于共享内存而设计的。它本身提供了不同于一般对普通文件的访问方式,进程可以像读写内存一样对普通文件的操作。而Posix或系统V的共享内存IPC则纯粹用于共享目的,当然mmap()实现共享内存也是其主要应用之一。
1、mmap()系统调用形式如下:
void*mmap(void*addr,size_tlen,intprot,intflags,intfd,off_toffset)
参数fd为即将映射到进程空间的文件描述字,一般由open()返回,同时,fd可以指定为-1,此时须指定flags参数中的MAP_ANON,表明进行的是匿名映射(不涉及具体的文件名,避免了文件的创建及打开,很显然只能用于具有亲缘关系的进程间通信)。len是映射到调用进程地址空间的字节数,它从被映射文件开头offset个字节开始算起。prot参数指定共享内存的访问权限。可取如下几个值的或:PROT_READ(可读),PROT_WRITE(可写),PROT_EXEC(可执行),PROT_NONE(不可访问)。flags由以下几个常值指定:MAP_SHARED,MAP_PRIVATE,MAP_FIXED,其中,MAP_SHARED,MAP_PRIVATE必选其一,而MAP_FIXED则不推荐使用。offset参数一般设为0,表示从文件头开始映射。参数addr指定文件应被映射到进程空间的起始地址,一般被指定一个空指针,此时选择起始地址的任务留给内核来完成。函数的返回值为最后文件映射到进程空间的地址,进程可直接操作起始地址为该值的有效地址。这里不再详细介绍mmap()的参数,读者可参考mmap()手册页获得进一步的信息。
2、系统调用mmap()用于共享内存的两种方式:
(1)使用普通文件提供的内存映射:适用于任何进程之间;此时,需要打开或创建一个文件,然后再调用mmap();典型调用代码如下:
fd=open(name,flag,mode);
if(fd<0)
...
ptr=mmap(NULL,len,PROT_READ|PROT_WRITE,MAP_SHARED,fd,0);通过mmap()实现共享内存的通信方式有许多特点和要注意的地方,我们将在范例中进行具体说明。
(2)使用特殊文件提供匿名内存映射:适用于具有亲缘关系的进程之间;由于父子进程特殊的亲缘关系,在父进程中先调用mmap(),然后调用fork()。那么在调用fork()之后,子进程继承父进程匿名映射后的地址空间,同样也继承mmap()返回的地址,这样,父子进程就可以通过映射区域进行通信了。注意,这里不是一般的继承关系。一般来说,子进程单独维护从父进程继承下来的一些变量。而mmap()返回的地址,却由父子进程共同维护。
对于具有亲缘关系的进程实现共享内存最好的方式应该是采用匿名内存映射的方式。此时,不必指定具体的文件,只要设置相应的标志即可,参见范例2。
3、系统调用munmap()
intmunmap(void*addr,size_tlen)
该调用在进程地址空间中解除一个映射关系,addr是调用mmap()时返回的地址,len是映射区的大小。当映射关系解除后,对原来映射地址的访问将导致段错误发生。
4、系统调用msync()
intmsync(void*addr,size_tlen,intflags)
一般说来,进程在映射空间的对共享内容的改变并不直接写回到磁盘文件中,往往在调用munmap()后才执行该操作。可以通过调用msync()实现磁盘上文件内容与共享内存区的内容一致。
三、mmap()范例
下面将给出使用mmap()的两个范例:范例1给出两个进程通过映射普通文件实现共享内存通信;范例2给出父子进程通过匿名映射实现共享内存。系统调用mmap()有许多有趣的地方,下面是通过mmap()映射普通文件实现进程间的通信的范例,我们通过该范例来说明mmap()实现共享内存的特点及注意事项。
范例1:两个进程通过映射普通文件实现共享内存通信
范例1包含两个子程序:map_normalfile1.c及map_normalfile2.c。编译两个程序,可执行文件分别为map_normalfile1及map_normalfile2。两个程序通过命令行参数指定同一个文件来实现共享内存方式的进程间通信。map_normalfile2试图打开命令行参数指定的一个普通文件,把该文件映射到进程的地址空间,并对映射后的地址空间进行写操作。map_normalfile1把命令行参数指定的文件映射到进程地址空间,然后对映射后的地址空间执行读操作。这样,两个进程通过命令行参数指定同一个文件来实现共享内存方式的进程间通信。
下面是两个程序代码:
C代码
1./*-------------map_normalfile1.c-----------*/
2.#include<sys/mman.h>
3.#include<sys/types.h>
4.#include<fcntl.h>
5.#include<unistd.h>
6.typedefstruct{
7.charname[4];
8.intage;
9.}people;
10.main(intargc,char**argv)//mapanormalfileassharedmem:
11.{
12.intfd,i;
13.people*p_map;
14.chartemp;
15.
16.fd=open(argv[1],O_CREAT|O_RDWR|O_TRUNC,00777);
17.lseek(fd,sizeof(people)*5-1,SEEK_SET);
18.write(fd,"",1);
19.
20.p_map=(people*)mmap(NULL,sizeof(people)*10,PROT_READ|PROT_WRITE,MAP_SHARED,fd,0);
21.close(fd);
22.temp='a';
23.for(i=0;i<10;i++)
24.{
25.temp+=1;
26.memcpy((*(p_map+i)).name,&temp,2);
27.(*(p_map+i)).age=20+i;
28.}
29.printf("initializeover\n");
30.sleep(10);
31.munmap(p_map,sizeof(people)*10);
32.printf("umapok\n");
33.}
34./*-------------map_normalfile2.c-----------*/
35.#include<sys/mman.h>
36.#include<sys/types.h>
37.#include<fcntl.h>
38.#include<unistd.h>
39.typedefstruct{
40.charname[4];
41.intage;
42.}people;
43.main(intargc,char**argv)//mapanormalfileassharedmem:
44.{
45.intfd,i;
46.people*p_map;
47.fd=open(argv[1],O_CREAT|O_RDWR,00777);
48.p_map=(people*)mmap(NULL,sizeof(people)*10,PROT_READ|PROT_WRITE,MAP_SHARED,fd,0);
49.for(i=0;i<10;i++)
50.{
51.printf("name:%sage%d;\n",(*(p_map+i)).name,(*(p_map+i)).age);
52.}
53.munmap(p_map,sizeof(people)*10);
54.}
/*-------------map_normalfile1.c-----------*/
#include<sys/mman.h>
#include<sys/types.h>
#include<fcntl.h>
#include<unistd.h>
typedefstruct{
charname[4];
intage;
}people;
main(intargc,char**argv)//mapanormalfileassharedmem:
{
intfd,i;
people*p_map;
chartemp;
fd=open(argv[1],O_CREAT|O_RDWR|O_TRUNC,00777);
lseek(fd,sizeof(people)*5-1,SEEK_SET);
write(fd,"",1);
p_map=(people*)mmap(NULL,sizeof(people)*10,PROT_READ|PROT_WRITE,MAP_SHARED,fd,0);
close(fd);
temp='a';
for(i=0;i<10;i++)
{
temp+=1;
memcpy((*(p_map+i)).name,&temp,2);
(*(p_map+i)).age=20+i;
}
printf("initializeover\n");
sleep(10);
munmap(p_map,sizeof(people)*10);
printf("umapok\n");
}
/*-------------map_normalfile2.c-----------*/
#include<sys/mman.h>
#include<sys/types.h>
#include<fcntl.h>
#include<unistd.h>
typedefstruct{
charname[4];
intage;
}people;
main(intargc,char**argv)//mapanormalfileassharedmem:
{
intfd,i;
people*p_map;
fd=open(argv[1],O_CREAT|O_RDWR,00777);
p_map=(people*)mmap(NULL,sizeof(people)*10,PROT_READ|PROT_WRITE,MAP_SHARED,fd,0);
for(i=0;i<10;i++)
{
printf("name:%sage%d;\n",(*(p_map+i)).name,(*(p_map+i)).age);
}
munmap(p_map,sizeof(people)*10);
}
map_normalfile1.c首先定义了一个people数据结构,(在这里采用数据结构的方式是因为,共享内存区的数据往往是有固定格式的,这由通信的各个进程决定,采用结构的方式有普遍代表性)。map_normfile1首先打开或创建一个文件,并把文件的长度设置为5个people结构大小。然后从mmap()的返回地址开始,设置了10个people结构。然后,进程睡眠10秒钟,等待其他进程映射同一个文件,最后解除映射。
map_normfile2.c只是简单的映射一个文件,并以people数据结构的格式从mmap()返回的地址处读取10个people结构,并输出读取的值,然后解除映射。
分别把两个程序编译成可执行文件map_normalfile1和map_normalfile2后,在一个终端上先运行./map_normalfile2/tmp/test_shm,程序输出结果如下:
initializeover
umapok
在map_normalfile1输出initializeover之后,输出umapok之前,在另一个终端上运行map_normalfile2/tmp/test_shm,将会产生如下输出(为了节省空间,输出结果为稍作整理后的结果):
name:bage20;name:cage21;name:dage22;name:eage23;name:fage24;
name:gage25;name:hage26;name:Iage27;name:jage28;name:kage29;
在map_normalfile1输出umapok后,运行map_normalfile2则输出如下结果:
name:bage20;name:cage21;name:dage22;name:eage23;name:fage24;
name:age0;name:age0;name:age0;name:age0;name:age0;
从程序的运行结果中可以得出的结论
1、最终被映射文件的内容的长度不会超过文件本身的初始大小,即映射不能改变文件的大小;
2、可以用于进程通信的有效地址空间大小大体上受限于被映射文件的大小,但不完全受限于文件大小。打开文件被截短为5个people结构大小,而在map_normalfile1中初始化了10个people数据结构,在恰当时候(map_normalfile1输出initializeover之后,输出umapok之前)调用map_normalfile2会发现map_normalfile2将输出全部10个people结构的值,后面将给出详细讨论。
注:在linux中,内存的保护是以页为基本单位的,即使被映射文件只有一个字节大小,内核也会为映射分配一个页面大小的内存。当被映射文件小于一个页面大小时,进程可以对从mmap()返回地址开始的一个页面大小进行访问,而不会出错;但是,如果对一个页面以外的地址空间进行访问,则导致错误发生,后面将进一步描述。因此,可用于进程间通信的有效地址空间大小不会超过文件大小及一个页面大小的和。
3、文件一旦被映射后,调用mmap()的进程对返回地址的访问是对某一内存区域的访问,暂时脱离了磁盘上文件的影响。所有对mmap()返回地址空间的操作只在内存中有意义,只有在调用了munmap()后或者msync()时,才把内存中的相应内容写回磁盘文件,所写内容仍然不能超过文件的大小。
范例2:父子进程通过匿名映射实现共享内存
C代码
1.#include<sys/mman.h>
2.#include<sys/types.h>
3.#include<fcntl.h>
4.#include<unistd.h>
5.typedefstruct{
6.charname[4];
7.intage;
8.}people;
9.main(intargc,char**argv)
10.{
11.inti;
12.people*p_map;
13.chartemp;
14.p_map=(people*)mmap(NULL,sizeof(people)*10,PROT_READ|PROT_WRITE,MAP_SHARED|MAP_ANONYMOUS,-1,0);
15.if(fork()==0)
16.{
17.sleep(2);
18.for(i=0;i<5;i++)
19.printf("childread:the%dpeople'sageis%d\n",i+1,(*(p_map+i)).age);
20.(*p_map).age=100;
21.munmap(p_map,sizeof(people)*10);//实际上,进程终止时,会自动解除映射。
22.exit();
23.}
24.temp='a';
25.for(i=0;i<5;i++)
26.{
27.temp+=1;
28.memcpy((*(p_map+i)).name,&temp,2);
29.(*(p_map+i)).age=20+i;
30.}
31.sleep(5);
32.printf("parentread:thefirstpeople,sageis%d\n",(*p_map).age);
33.printf("umap\n");
34.munmap(p_map,sizeof(people)*10);
35.printf("umapok\n");
36.}
#include<sys/mman.h>
#include<sys/types.h>
#include<fcntl.h>
#include<unistd.h>
typedefstruct{
charname[4];
intage;
}people;
main(intargc,char**argv)
{
inti;
people*p_map;
chartemp;
p_map=(people*)mmap(NULL,sizeof(people)*10,PROT_READ|PROT_WRITE,MAP_SHARED|MAP_ANONYMOUS,-1,0);
if(fork()==0)
{
sleep(2);
for(i=0;i<5;i++)
printf("childread:the%dpeople'sageis%d\n",i+1,(*(p_map+i)).age);
(*p_map).age=100;
munmap(p_map,sizeof(people)*10);//实际上,进程终止时,会自动解除映射。
exit();
}
temp='a';
for(i=0;i<5;i++)
{
temp+=1;
memcpy((*(p_map+i)).name,&temp,2);
(*(p_map+i)).age=20+i;
}
sleep(5);
printf("parentread:thefirstpeople,sageis%d\n",(*p_map).age);
printf("umap\n");
munmap(p_map,sizeof(people)*10);
printf("umapok\n");
}
考察程序的输出结果,体会父子进程匿名共享内存:
childread:the1people'sageis20
childread:the2people'sageis21
childread:the3people'sageis22
childread:the4people'sageis23
childread:the5people'sageis24
parentread:thefirstpeople,sageis100
umap
umapok