Python3.4编程实现简单抓取爬虫功能示例
发布时间 - 2026-01-11 03:15:03 点击率:次本文实例讲述了Python3.4编程实现简单抓取爬虫功能。分享给大家供大家参考,具体如下:
import urllib.request
import urllib.parse
import re
import urllib.request,urllib.parse,http.cookiejar
import time
def getHtml(url):
cj=http.cookiejar.CookieJar()
opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36'),('Cookie','4564564564564564565646540')]
urllib.request.install_opener(opener)
page = urllib.request.urlopen(url)
html = page.read()
return html
#print ( html)
#html = getHtml("http://weibo.com/")
def getimg(html):
html = html.decode('utf-8')
reg='"screen_name":"(.*?)"'
imgre = re.compile(reg)
src=re.findall(imgre,html)
return src
#print ("",getimg(html))
uid=['2808675432','3888405676','2628551531','2808587400']
for a in list(uid):
print (getimg(getHtml("http://weibo.com/"+a)))
time.sleep(1)
更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》
希望本文所述对大家Python程序设计有所帮助。
# Python3.4
# 抓取
# 爬虫
# Python爬虫实例爬取网站搞笑段子
# Python网络爬虫与信息提取(实例讲解)
# python利用urllib实现爬取京东网站商品图片的爬虫实例
# python制作小说爬虫实录
# python爬虫实战之最简单的网页爬虫教程
# Python 爬虫之超链接 url中含有中文出错及解决办法
# Python实现的爬虫功能代码
# 基于python爬虫数据处理(详解)
# python爬虫入门教程--HTML文本的解析库BeautifulSoup(四)
# Python爬虫之模拟知乎登录的方法教程
# python爬虫入门教程--优雅的HTTP库requests(二)
# Python爬虫实现(伪)球迷速成
# 进阶
# 操作技巧
# 相关内容
# 数据结构
# 给大家
# 更多关于
# 所述
# 程序设计
# 使用技巧
# 编程技巧
# 讲述了
# addheaders
# HTTPCookieProcessor
# Agent
# User
# CookieJar
# cj
# build_opener
# opener
# AppleWebKit
相关栏目:
【
网站优化151355 】
【
网络推广146373 】
【
网络技术251813 】
【
AI营销90571 】
相关推荐:
新三国志曹操传主线渭水交兵攻略
Laravel如何实现用户注册和登录?(Auth脚手架指南)
如何用AI一键生成爆款短视频文案?小红书AI文案写作指令【教程】
简单实现jsp分页
Thinkphp 中 distinct 的用法解析
Laravel如何使用withoutEvents方法临时禁用模型事件
Win11怎么关闭专注助手 Win11关闭免打扰模式设置【操作】
Python制作简易注册登录系统
Java垃圾回收器的方法和原理总结
如何用wdcp快速搭建高效网站?
油猴 教程,油猴搜脚本为什么会网页无法显示?
php静态变量怎么调试_php静态变量作用域调试技巧【解答】
html5怎么画眼睛_HT5用Canvas或SVG画眼球瞳孔加JS控制动态【绘制】
C#如何调用原生C++ COM对象详解
javascript事件捕获机制【深入分析IE和DOM中的事件模型】
Laravel如何与Inertia.js和Vue/React构建现代单页应用
Laravel Artisan命令怎么自定义_创建自己的Laravel命令行工具完全指南
Swift开发中switch语句值绑定模式
laravel怎么用DB facade执行原生SQL查询_laravel DB facade原生SQL执行方法
iOS中将个别页面强制横屏其他页面竖屏
bing浏览器学术搜索入口_bing学术文献检索地址
电视网站制作tvbox接口,云海电视怎样自定义添加电视源?
JavaScript如何操作视频_媒体API怎么控制播放
如何在Ubuntu系统下快速搭建WordPress个人网站?
edge浏览器无法安装扩展 edge浏览器插件安装失败【解决方法】
国美网站制作流程,国美电器蒸汽鍋怎么用官方网站?
高防服务器如何保障网站安全无虞?
LinuxShell函数封装方法_脚本复用设计思路【教程】
教学论文网站制作软件有哪些,写论文用什么软件
?
Laravel如何使用Gate和Policy进行权限控制_Laravel权限判定与策略规则配置
如何快速生成ASP一键建站模板并优化安全性?
Laravel事件和监听器如何实现_Laravel Events & Listeners解耦应用的实战教程
如何快速搭建高效可靠的建站解决方案?
如何在腾讯云服务器上快速搭建个人网站?
Laravel如何实现密码重置功能_Laravel密码找回与重置流程
装修招标网站设计制作流程,装修招标流程?
高防服务器租用首荐平台,企业级优惠套餐快速部署
Linux系统运维自动化项目教程_Ansible批量管理实战
Laravel怎么实现前端Toast弹窗提示_Laravel Session闪存数据Flash传递给前端【方法】
HTML5建模怎么导出为FBX格式_FBX格式兼容性及导出步骤【指南】
详解vue.js组件化开发实践
Laravel数据库迁移怎么用_Laravel Migration管理数据库结构的正确姿势
焦点电影公司作品,电影焦点结局是什么?
如何正确下载安装西数主机建站助手?
如何在阿里云部署织梦网站?
Laravel怎么实现模型属性转换Casting_Laravel自动将JSON字段转为数组【技巧】
如何挑选最适合建站的高性能VPS主机?
Laravel如何使用Contracts(契约)进行编程_Laravel契约接口与依赖反转
Python文件操作最佳实践_稳定性说明【指导】
Laravel如何发送系统通知?(Notification渠道示例)

