【背景】

本程序遍历 ftp 目录,列出单个文件大小,统计目录个数、文件个数、文件总大小。目的是在批量下载 FTP 文件时,不严格的验证下载结果的正确性。
【环境】
Windows10 下 Python 3.6.5,第三方包 ftputil 3.4。
【ftp_stat】
# encoding: utf-8
# author: walker
# date: 2018-10-12
# summary: 遍历 ftp 目录,列出单个文件大小,统计目录个数、文件个数、文件总大小。
import time
import ftputil
FtpHost = r'ftp.ncbi.nlm.nih.gov' # FTP 主机
SubDir = r'/pubmed/baseline/' # 最后的斜线有无不影响,根目录用单斜线即可
FtpUser = r'anonymous'
FtpPwd = r''
FtpEncoding = r'utf-8'
def Main():
r"""
遍历 ftp 目录,列出单个文件大小,统计目录个数、文件个数、文件总大小。
"""
fileCnt = 0
fileSize = 0
dirCnt = 0
with ftputil.FTPHost(host=FtpHost, user=FtpUser, passwd=FtpPwd) as host:
for parent, dirnames, filenames in host.walk(SubDir):
for filename in filenames:
fileCnt += 1
pathfile = host.path.join(parent, filename)
singleFileSize = host.path.getsize(pathfile)
fileSize += singleFileSize
print('\tfile: %s, %d bytes' %
(pathfile.encode('latin-1').decode(FtpEncoding), singleFileSize))
for dirname in dirnames:
dirCnt += 1
pathdir = host.path.join(parent, dirname)
print('\tdir: %s' % pathdir.encode(
'latin-1').decode(FtpEncoding))
print('fileCnt: %d, fileSize: %d B/%.2f KB/%.2f MB/%.2f GB, dirCnt: %d'
% (fileCnt, fileSize, fileSize/1024, fileSize/1024/1024, fileSize/1024/1024/1024, dirCnt))
print('fileCnt: %d, fileSize: %d B/%.2f KB/%.2f MB/%.2f GB, dirCnt: %d'
% (fileCnt, fileSize, fileSize/1024, fileSize/1024/1024, fileSize/1024/1024/1024, dirCnt))
if __name__ == '__main__':
Main()
print('current time: %s\n'
% time.strftime('%Y-%m-%d %H:%M:%S', time.localtime()))【相关阅读】
Python3 备份 MySQL/MariaDB(本地+FTP)
FTP 服务端:pyftpdlib
FTP 同步: pyftpsync
最好的 FTP 客户端软件: FileZilla
*** walker ***
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。