网络爬虫——urllib（1）

2024-02-15 19:30:24 分类：后端热度：44 评论： 0

前言🍭

❤️❤️❤️网络爬虫专栏更新中，各位大佬觉得写得不错，支持一下，感谢了！❤️❤️❤️

前篇简单介绍了什么是网络爬虫及相关概念，这篇开始讲解爬虫中的第一个库——urllib。

urllib🍭

urllib是python标准库中的一个模块，提供了一些用于处理URL的功能。

使用urllib可以进行URL的解析、发送HTTP请求、文件下载等操作。

1、urllib的基本使用🍉

使用urIlib来获取百度首页的源码🍓

# 使用urI1ib来获取百度首页的源码
import urllib.request
# (1)定义一个urI 赢是你要访问的地址
url = 'http://www.cssjc.com/1b423a8a92dd4282bda064a676263d86.png" width="462"> 
# 使用urI1ib来获取百度首页的源码
import urllib.request
# (1)定义一个urI 赢是你要访问的地址
url = 'http://www.cssjc.com/77a8eb44bb574834b8c9565609405c2e.png" width="836"> 
2、一个类型六个方法🍉 
一个类型🍓 
为什么要讲一个类型呢？因为后面要讲的一个库叫request库，request库也有相对应的响应，但是它的类型不一样，为了进行一个对比，才进行这样的一个讲解。 
import urllib.request

url = "http://www.cssjc.com/e94594d9c85a4f1aa9a6bac2d22bfa0a.png" width="557"> 
 
下载图片🍓 
import urllib.request

# 下载图片
url_img="https://profile-avatar.csdnimg.cn/82351d3cb9754fda97cb85258d7e74a0_m0_63951142.jpg!1"
urllib.request.urlretrieve(url_img, filename="tx.jpg") 
把我的头像链接输入，下载下来：  
 
下载视频🍓 
 
再找到里面的src 
 
这就是我们的视频地址  
import urllib.request

# 下载网页
# url_page = "http://www.cssjc.com/6ce1395e7f4d45a597d3d7bd96384f61.png" width="267"> 
下载好了之后我们在pycharm是打不开的，得去本地文件中找： 
 
点击就可以看了：


                                        
                                                                                
                                                                                        爬虫
                                                                                        python
                                                                                    
                                                                                转载请说明出处内容投诉

CSS教程_站长资源网 » 网络爬虫——urllib（1）
                                        
                                                                                
                                            
                                                
                                                                                                        
                                                                                                    
                                                
                                                    Dx
                                                
                                            
                                            
                                                分享到：


                                                                
                                    
                                        上一篇
Rust 语言常见的一些概念（上）                                        下一篇
【腾讯云 TDSQL-C Serverless 产品体验】基于TDSQL-C 存储爬取的QQ音乐歌单数据                                    
                                
                                                                                                
                                     相关推荐
                                    
                                                                                
                                            
                                                Flink 客户端操作命令及可视化工具
                                            
                                        
                                                                                
                                            
                                                【爬虫实战】使用Python获取花粉俱乐部中Mate60系列的用户发帖数据
                                            
                                        
                                                                                
                                            
                                                【python】flask服务端响应与重定向处理
                                            
                                        
                                                                                
                                            
                                                python中的类与对象
                                            
                                        
                                                                                
                                            
                                                如何把本地flask项目（框架）上传到服务器（Linux），并后台持续运行（包括requirements文件生成，python项目与域名绑定，保姆级教程）
                                            
                                        
                                                                                
                                            
                                                Python爬虫超详细讲解（零基础入门，老年人都看的懂）
                                            
                                        
                                                                                
                                            
                                                爬虫理论篇更①
                                            
                                        
                                                                                
                                            
                                                使用 Python 编写网络爬虫：从入门到实战
                                            
                                        
                                                                                
                                            
                                                第1章 认识Flask
                                            
                                        
                                                                                
                                            
                                                Flask中的Blueprints：模块化和组织大型Web应用【第142篇—Web应用】
                                            
                                        
                                                                            
                                
                                                                

    
                
            
                                                
            
        
        

    发表评论 
    
                
            欢迎 访客 发表评论
        
        
            
        
    	
    	
                    
                
                    昵称*
                    
                
                
                    E-mail
                    
                
                
                    网站
                    
                
            
            
            
            
            
                
            
        
            
 验证码(*)


                                        

    
                        
        
                        
                
                    广告位招租
                    每月x元
                    立即查看
                
            
        
                                                                    
        
            热门文章
            
                                    

    
        
            
                                  
                            
        
    
    企业网站CSS3网页模板
                                    

    
        
            
                                  
                            
        
    
    WordPress全新爱导航网址网站展现主题风格网站模板响应式移动端
                                    

    
        
            
                                  
                            
        
    
    小旋风万能蜘蛛池Pro新版本升级补丁文件（最新pro2.8）
                                    

    
        
            
                                  
                            
        
    
    IT网络建站公司企业站群泛目录源码pbootcms模板 互联网营销企业网站源码
                                    

    
        
            
                                  
                            
        
    
    微信小程序开发代理展示销售企业分站站群泛目录pbootcms网站源码模板
                                    

    
        
            
                                  
                            
        
    
    HTML5响应式品牌创新设计类站群泛目录网站pbootcms模板营销策划公司网站源码下载
                                    

    
        
            
                                  
                            
        
    
    整站站群泛目录电脑操作系统软件下载类网站pbootcms模板
                                    

    
        
            
                                  
                            
        
    
    响应式网站建设软件城市站群泛目录源码小程序开发类网站pbootcms模板
                                    

    
        
            
                                  
                            
        
    
    幽默笑话站群泛目录整站源码模板搞笑趣图pbootcms（自适应站群源码）
                                    

    
        
            
                                  
                            
        
    
    站群泛目录整站响应式SEO优化网站站群建设优化排名公司pbootcms模板源码
                            
        
                                                
        
            相关内容
            
                                                                

    
        
            
                                  
                            
        
    
    Python网络基础爬虫-python基本语法
                                                                

    
        
            
                                  
                            
        
    
    Python网络爬虫实战：从入门到进阶
                                                                

    
        
            
                                  
                            
        
    
    基于Selenium+Python的web自动化测试框架（附框架源码+项目实战）
                                                                

    
        
            
                                  
                            
        
    
    Rust 编写新一代 Web 框架 Teo，同时支持 Node 和 Python，速度惊人！
                                                                

    
        
            
                                  
                            
        
    
    python 出现 更新库失败 A new release of pip is available: 23.0.1 -＞ 23.3
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            
        
                                        
            随机标签
            
                品牌运营总监wordpress数据库dedecms漏洞办公桌椅网站源码交通传媒广告网站模板phpcms建筑设计pbootcms模板家政电商活动运营discuz数据库zencart门窗网站源码pbootcms单页面帝国 cms科研pbootcms安装模板品牌运营管理易优cms做app帝国cms 标签运营管理基础帝国cms 教程电子科技设备网站app运营推广办公家具产品网站模板婚庆电子科技网站模板电路板网站源码智能门禁网站模板IT培训电商运营电子科技产品网站源码基dedecms 安装市政园林网站模板APP应用下载网站模板瓷砖网站模板pbootcms主题智能家居pbootcms问答discuz手机版帝国cms下载亚克力板材网站源码建材帝国cms模板下载设计家居什么是社群运营美容创意设计公司网站源码
            
        
                                
            友情链接
            
                Z-Blog on Github
CF辅助
神奇的工作室
cf黑号
cf透视
GPU云桌面
流程挖掘


        
                
            
            
                一个令你着迷的主题！
 查看演示
 官网购买            
        
                
            
                
                    
                        
                            
                                
                                    
                                
                                
                            
                        
                        
                        
                            
                                 本站导航
                            
                            
                                
                                    关于我们
充值说明
下载说明
                                
                            
                        
                        
                        
                            
                                 更多介绍
                            
                            
                                
                                    隐私协议
权限说明
账户中心
                                
                            
                        
                        
                        
                            
                                 快速搜索
                            
                            
                                
                                    
                                    
                                
                                
                            
                        
                    
                
            
                        ICP备案号：蜀ICP备2023023382号


Powered By Z-BlogPHP 1.7.3