网络人 > 服务器技术 > 使用rsync删除海量文件

使用rsync删除海量文件

先建一个空白的目录:

mkdir /tmp/empty

然后使用下面的命令:

rsync --delete-before -d /tmp/empty/ /要删除的目录地址/

不要忘记后面要/结尾。

参数说明:

–delete-before 接收者在传输之前进行删除操作

–progress 在传输时显示传输过程

-a 归档模式,表示以递归方式传输文件,并保持所有文件属性

-H 保持硬连接的文件

-v 详细输出模式

–stats 给出某些文件的传输状态

为什么rsync能够快速删除大文件?

1)rm命令大量调用了lstat64和unlink,可以推测删除每个文件前都从文件系统中做过一次lstat操作。过程:正式删除工作的第一阶段,需要通过getdirentries64调用,分批读取目录(每次大约为4K),在内存中建立rm的文件列表;第二阶段,lstat64确定所有文件的状态;第三阶段,通过unlink执行实际删除。这三个阶段都有比较多的系统调用和文件系统操作。

2)rsync所做的系统调用很少:没有针对单个文件做lstat和unlink操作。命令执行前期,rsync开启了一片共享内存,通过mmap方式加载目录信息。只做目录同步,不需要针对单个文件做unlink。另外,在其他人的评测里,rm的上下文切换比较多,会造成System CPU占用较多——对于文件系统的操作,简单增加并发数并不总能提升操作速度。 总结:频繁做减法不如直接从头来过把文件系统的目录与书籍的目录做类比,rm删除内容时,将目录的每一个条目逐个删除(unlink),需要循环重复操作很多次;rsync删除内容时,建立好新的空目录,替换掉老目录,基本没开销。

除非注明,网络人的文章均为原创,转载请以链接形式标明本文地址:http://www.neter8.com/server/43.html

下一篇 »:解决Redis由于连接过多导致的Uncaught RedisException: Cannot assign requeste问题«上一篇:解决浏览器跨域出现403 Access to Font at https错误

《使用rsync删除海量文件》的网友评论(0)

感谢打赏!