Python3.4编程实现简单抓取爬虫功能示例

发布时间 - 2026-01-11 03:15:03    点击率:

本文实例讲述了Python3.4编程实现简单抓取爬虫功能。分享给大家供大家参考,具体如下:

import urllib.request
import urllib.parse
import re
import urllib.request,urllib.parse,http.cookiejar
import time
def getHtml(url):
  cj=http.cookiejar.CookieJar()
  opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
  opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36'),('Cookie','4564564564564564565646540')]
  urllib.request.install_opener(opener)
  page = urllib.request.urlopen(url)
  html = page.read()
  return html
#print ( html)
#html = getHtml("http://weibo.com/")
def getimg(html):
  html = html.decode('utf-8')
  reg='"screen_name":"(.*?)"'
  imgre = re.compile(reg)
  src=re.findall(imgre,html)
  return src
#print ("",getimg(html))
uid=['2808675432','3888405676','2628551531','2808587400']
for a in list(uid):
  print (getimg(getHtml("http://weibo.com/"+a)))
  time.sleep(1)

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。


# Python3.4  # 抓取  # 爬虫  # Python爬虫实例爬取网站搞笑段子  # Python网络爬虫与信息提取(实例讲解)  # python利用urllib实现爬取京东网站商品图片的爬虫实例  # python制作小说爬虫实录  # python爬虫实战之最简单的网页爬虫教程  # Python 爬虫之超链接 url中含有中文出错及解决办法  # Python实现的爬虫功能代码  # 基于python爬虫数据处理(详解)  # python爬虫入门教程--HTML文本的解析库BeautifulSoup(四)  # Python爬虫之模拟知乎登录的方法教程  # python爬虫入门教程--优雅的HTTP库requests(二)  # Python爬虫实现(伪)球迷速成  # 进阶  # 操作技巧  # 相关内容  # 数据结构  # 给大家  # 更多关于  # 所述  # 程序设计  # 使用技巧  # 编程技巧  # 讲述了  # addheaders  # HTTPCookieProcessor  # Agent  # User  # CookieJar  # cj  # build_opener  # opener  # AppleWebKit 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: 新三国志曹操传主线渭水交兵攻略  Laravel如何实现用户注册和登录?(Auth脚手架指南)  如何用AI一键生成爆款短视频文案?小红书AI文案写作指令【教程】  简单实现jsp分页  Thinkphp 中 distinct 的用法解析  Laravel如何使用withoutEvents方法临时禁用模型事件  Win11怎么关闭专注助手 Win11关闭免打扰模式设置【操作】  Python制作简易注册登录系统  Java垃圾回收器的方法和原理总结  如何用wdcp快速搭建高效网站?  油猴 教程,油猴搜脚本为什么会网页无法显示?  php静态变量怎么调试_php静态变量作用域调试技巧【解答】  html5怎么画眼睛_HT5用Canvas或SVG画眼球瞳孔加JS控制动态【绘制】  C#如何调用原生C++ COM对象详解  javascript事件捕获机制【深入分析IE和DOM中的事件模型】  Laravel如何与Inertia.js和Vue/React构建现代单页应用  Laravel Artisan命令怎么自定义_创建自己的Laravel命令行工具完全指南  Swift开发中switch语句值绑定模式  laravel怎么用DB facade执行原生SQL查询_laravel DB facade原生SQL执行方法  iOS中将个别页面强制横屏其他页面竖屏  bing浏览器学术搜索入口_bing学术文献检索地址  电视网站制作tvbox接口,云海电视怎样自定义添加电视源?  JavaScript如何操作视频_媒体API怎么控制播放  如何在Ubuntu系统下快速搭建WordPress个人网站?  edge浏览器无法安装扩展 edge浏览器插件安装失败【解决方法】  国美网站制作流程,国美电器蒸汽鍋怎么用官方网站?  高防服务器如何保障网站安全无虞?  LinuxShell函数封装方法_脚本复用设计思路【教程】  教学论文网站制作软件有哪些,写论文用什么软件 ?  Laravel如何使用Gate和Policy进行权限控制_Laravel权限判定与策略规则配置  如何快速生成ASP一键建站模板并优化安全性?  Laravel事件和监听器如何实现_Laravel Events & Listeners解耦应用的实战教程  如何快速搭建高效可靠的建站解决方案?  如何在腾讯云服务器上快速搭建个人网站?  Laravel如何实现密码重置功能_Laravel密码找回与重置流程  装修招标网站设计制作流程,装修招标流程?  高防服务器租用首荐平台,企业级优惠套餐快速部署  Linux系统运维自动化项目教程_Ansible批量管理实战  Laravel怎么实现前端Toast弹窗提示_Laravel Session闪存数据Flash传递给前端【方法】  HTML5建模怎么导出为FBX格式_FBX格式兼容性及导出步骤【指南】  详解vue.js组件化开发实践  Laravel数据库迁移怎么用_Laravel Migration管理数据库结构的正确姿势  焦点电影公司作品,电影焦点结局是什么?  如何正确下载安装西数主机建站助手?  如何在阿里云部署织梦网站?  Laravel怎么实现模型属性转换Casting_Laravel自动将JSON字段转为数组【技巧】  如何挑选最适合建站的高性能VPS主机?  Laravel如何使用Contracts(契约)进行编程_Laravel契约接口与依赖反转  Python文件操作最佳实践_稳定性说明【指导】  Laravel如何发送系统通知?(Notification渠道示例)