问题反馈可发送邮件到stubbornhuang@qq.com
本站由于前段时间遭受到大量临时和国外邮箱注册，所以对可注册的邮箱类型进行了限制！
如果觉得本站的内容有帮助，可以考虑打赏博主哦！
计算机图形学与计算几何经典必备书单整理，下载链接可参考：https://www.stubbornhuang.com/1256/
在本站开通年度VIP，无限制下载本站资源和阅读本站文章
本站会放置Google广告用于维持域名以及网站服务器费用。
感谢大家访问本站，希望本站的内容可以帮助到大家！
抖音，TikTok，Youtube高清无水印视频下载网站：https://www.videograbber.pro
欢迎大家交换友链，可在https://www.stubbornhuang.com/申请友情链接进行友链交换申请！
工资「喂饱肚子」，副业「养活灵魂」！

解决Python爬虫在爬资源过程中使用urlretrieve函数下载文件不完全且避免下载时长过长陷入死循环，并在下载文件的过程中显示下载进度

StubbornHuang Python 发布于2019-10-24 阅读 6,755次 0次评论 0次点赞本文共610个字，阅读需要2分钟。

import urllib
from urllib.request import urlretrieve
#解决urlretrieve下载文件不完全的问题且避免下载时长过长陷入死循环
def auto_down(url,filename):
    try:
        urlretrieve(url,filename,jindu)
    except socket.timeout:
        count = 1
        while count <= 15:
            try:
                urlretrieve(url, filename,jindu)
                break
            except socket.timeout:
                err_info = 'Reloading for %d time' % count if count == 1 else 'Reloading for %d times' % count
                print(err_info)
                count += 1
        if count > 15:
            print("下载失败")

#urlretrieve()的回调函数，显示当前的下载进度
#a为已经下载的数据块
#b为数据块大小
#c为远程文件的大小
global myper
def jindu(a,b,c):
    if not a:
        print("连接打开")
    if c<0:
        print("要下载的文件大小为0")
    else:
        global myper
        per=100*a*b/c

        if per>100:
           per=100
        myper=per
        print("当前下载进度为：" + '%.2f%%' % per)
    if per==100:
            return True

本文作者：StubbornHuang

原文标题：解决Python爬虫在爬资源过程中使用urlretrieve函数下载文件不完全且避免下载时长过长陷入死循环，并在下载文件的过程中显示下载进度

原文链接：https://www.stubbornhuang.com/33/

发布于：2019年10月24日 22:31:00

修改于：2019年11月14日 22:55:01

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

关键字：

文章末尾

盗墓笔记到底讲了什么故事？？？-带你领会终极和它

杂谈

简单粗暴：使用pycharm安装对应的Python版本第三方包

Python

发表评论点击这里取消回复。

您必须 [ 登录 ] 才能发表留言！

联系我

资助我们

随机推荐

资源分享 – 8i Voxelized Full Bodies – A Voxelized Point Cloud Dataset下载

计算几何 – 二维几何变换，二维平移、旋转、缩放、仿射变换

资源分享 – Mathematics for Computer Graphics , Fourth Edition 英文PDF下载

Pytorch – torch.topk参数详解与使用

深度学习 – 语音识别框架中wenet最大动态chunk大小为什么取值为25？

WordPress – 通过Server酱发送微信通知给微信

最新评论

解决Python爬虫在爬资源过程中使用urlretrieve函数下载文件不完全且避免下载时长过长陷入死循环，并在下载文件的过程中显示下载进度

发表评论点击这里取消回复。

联系我

资助我们

随机推荐

资源分享 – 8i Voxelized Full Bodies – A Voxelized Point Cloud Dataset下载

计算几何 – 二维几何变换，二维平移、旋转、缩放、仿射变换

资源分享 – Mathematics for Computer Graphics , Fourth Edition 英文PDF下载

Pytorch – torch.topk参数详解与使用

深度学习 – 语音识别框架中wenet最大动态chunk大小为什么取值为25？

WordPress – 通过Server酱发送微信通知给微信

最新评论

解决Python爬虫在爬资源过程中使用urlretrieve函数下载文件不完全且避免下载时长过长陷入死循环，并在下载文件的过程中显示下载进度

发表评论 点击这里取消回复。

大家都在搜

关注我们的公众号

发表评论点击这里取消回复。