boante 2012-09-25
今天测试udp服务器进程时发现log中记录了当进程收到一个请求后,会有多条失败处理记录,同时有一条成功处理记录。服务器进程使用sellect模式,通过fork四个子进程来监听同一个socket。
发现问题后初步怀疑是出现了惊群现象。但是,听说现代内核已经解决了惊群问题,程序也可以确定也没有问题,就奇怪问题发生在哪里了。
后来在网上一搜才知道,原来linux内核开发人员通过锁机制解决了accept的惊群现象,但是对于sellect和epoll惊群问题并没有解决,所以这种情形下惊群还会出现,也就是当多个进程通过sellect方式监听同一个socket的可读状态时,当该socket变为可读,所有的监听进程都会被唤醒并进行处理,但是对于udp服务器,其中第一个socket会一次性将数据读完,导致其他进程再读socket都返回了失败。
网友给的解释是对于select,数据是不互斥的,也就是需要多个进程来读取资源。
因此,有使用fork+select搭建socket服务器时要注意这个问题,很影响性能的。