很多的时候,在应用层中会做一些文件的cache ,那么绕开linux vfs提高读写文件的性能就显的比较重要,由于Direct IO 中操作文件有buffer地址和大小页对齐,那么在copy file 的时候,用direct IO,就会碰到如果文件大小不是页的整数倍的时候,最后一块 block是无法copy的,系统返回-EINVAL。
主要是在文件 direct_io.c 中的函数__blockdev_direct_IO()
if ((addr & blocksize_mask) || (size & blocksize_mask)) {
if (bdev)
blkbits = bdev_blkbits;
blocksize_mask = (1 << blkbits) - 1;
if ((addr & blocksize_mask) || (size & blocksize_mask))
goto out;
}
如何解决这样的问题呢?
一种方法就是把最后一个长度不是和bocksize_mask对齐的buffer直接append到文件的末尾,由于文件的指针刚好在文件的最后,所以可以直接append,但绕不开page cache,会产生页碎片的问题。
还有一种方法,就是不需要direct IO 复制文件,只要在copy结束的时候调用
fdatasync(file);
posix_fadvise(file, 0, 0, POSIX_FADV_DONTNEED);
清除page cache,但有性能影响,不过你当然可以异步去清除page cache。