C#多线程爬虫抓取免费代理IP的示例代码
发布时间 - 2026-01-11 02:59:14 点击率:次这里用到一个HTML解析辅助类:HtmlAgilityPack,如果没有网上找一个增加到库里,这个插件有很多版本,如果你开发环境是使用VS2005就2.0的类库,VS2010就使用4.0,以此类推..........然后直接创建一个控制台应用,将我下面的代码COPY替换就可以运行,下面就来讲讲我两年前做爬虫经历,当时是给一家公司做,也是用的C#,不过当时遇到一个头痛的问题就是抓的图片有病毒,然后系统挂了几次。所以抓网站图片要注意安全,虽然我这里没涉及到图片,但是还是提醒下看文章的朋友。
class Program
{
//存放所有抓取的代理
public static List<proxy> masterPorxyList = new List<proxy>();
//代理IP类
public class proxy
{
public string ip;
public string port;
public int speed;
public proxy(string pip,string pport,int pspeed)
{
this.ip = pip;
this.port = pport;
this.speed = pspeed;
}
}
//抓去处理方法
static void getProxyList(object pageIndex)
{
string urlCombin = "http://www.xicidaili.com/wt/" + pageIndex.ToString();
string catchHtml = catchProxIpMethord(urlCombin, "UTF8");
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(catchHtml);
HtmlNode table = doc.DocumentNode.SelectSingleNode("//div[@id='wrapper']//div[@id='body']/table[1]");
HtmlNodeCollection collectiontrs = table.SelectNodes("./tr");
for (int i = 0; i < collectiontrs.Count; i++)
{
HtmlAgilityPack.HtmlNode itemtr = collectiontrs[i];
HtmlNodeCollection collectiontds = itemtr.ChildNodes;
//table中第一个是能用的代理标题,所以这里从第二行TR开始取值
if (i>0)
{
HtmlNode itemtdip = (HtmlNode)collectiontds[3];
HtmlNode itemtdport = (HtmlNode)collectiontds[5];
HtmlNode itemtdspeed = (HtmlNode)collectiontds[13];
string ip = itemtdip.InnerText.Trim();
string port = itemtdport.InnerText.Trim();
string speed = itemtdspeed.InnerHtml;
int beginIndex = speed.IndexOf(":", 0, speed.Length);
int endIndex = speed.IndexOf("%", 0, speed.Length);
int subSpeed = int.Parse(speed.Substring(beginIndex + 1, endIndex - beginIndex - 1));
//如果速度展示条的值大于90,表示这个代理速度快。
if (subSpeed > 90)
{
proxy temp = new proxy(ip, port, subSpeed);
masterPorxyList.Add(temp);
Console.WriteLine("当前是第:" + masterPorxyList.Count.ToString() + "个代理IP");
}
}
}
}
//抓网页方法
static string catchProxIpMethord(string url,string encoding )
{
string htmlStr = "";
try
{
if (!String.IsNullOrEmpty(url))
{
WebRequest request = WebRequest.Create(url);
WebResponse response = request.GetResponse();
Stream datastream = response.GetResponseStream();
Encoding ec = Encoding.Default;
if (encoding == "UTF8")
{
ec = Encoding.UTF8;
}
else if (encoding == "Default")
{
ec = Encoding.Default;
}
StreamReader reader = new StreamReader(datastream, ec);
htmlStr = reader.ReadToEnd();
reader.Close();
datastream.Close();
response.Close();
}
}
catch { }
return htmlStr;
}
static void Main(string[] args)
{
//多线程同时抓15页
for (int i = 1; i <= 15; i++)
{
ThreadPool.QueueUserWorkItem(getProxyList, i);
}
Console.Read();
}
}
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
# C#爬虫抓取代理IP
# C#
# 多线程爬虫
# c# Selenium爬取数据时防止webdriver封爬虫的方法
# C# 爬虫简单教程
# 用C#做网络爬虫的步骤教学
# c#爬虫爬取京东的商品信息
# C#程序如何调用C++ dll详细教程
# C# 利用代理爬虫网页的实现方法
# 利用C#实现最基本的小说爬虫示例代码
# C#简单爬虫案例分享
# C#制作多线程处理强化版网络爬虫
# 利用C#实现网络爬虫
# c# 基于Titanium爬取微信公众号历史文章列表
# 如果你
# 第一个
# 有很多
# 几次
# 以此类推
# 要注意
# 如果没有
# 将我
# 找一个
# 就来
# 涉及到
# 速度快
# 挂了
# 两年前
# 创建一个
# 多线程
# 大家多多
# 就可以
# 抓去
# 库里
相关栏目:
【
网站优化151355 】
【
网络推广146373 】
【
网络技术251813 】
【
AI营销90571 】
相关推荐:
香港服务器建站指南:免备案优势与SEO优化技巧全解析
Win10如何卸载预装Edge扩展_Win10卸载Edge扩展教程【方法】
标题:Vue + Vuex 项目中正确使用 JWT 进行身份认证的实践指南
网站制作企业,网站的banner和导航栏是指什么?
动图在线制作网站有哪些,滑动动图图集怎么做?
Claude怎样写约束型提示词_Claude约束提示词写法【教程】
Laravel如何理解并使用服务容器(Service Container)_Laravel依赖注入与容器绑定说明
Laravel怎么导出Excel文件_Laravel Excel插件使用教程
Win11怎么设置默认图片查看器_Windows11照片应用关联设置
如何续费美橙建站之星域名及服务?
微信小程序 input输入框控件详解及实例(多种示例)
Laravel storage目录权限问题_Laravel文件写入权限设置
Laravel如何安装使用Debugbar工具栏_Laravel性能调试与SQL监控插件【步骤】
如何用AWS免费套餐快速搭建高效网站?
zabbix利用python脚本发送报警邮件的方法
Laravel怎么清理缓存_Laravel optimize clear命令详解
如何在企业微信快速生成手机电脑官网?
如何解决hover在ie6中的兼容性问题
EditPlus中的正则表达式 实战(1)
香港服务器部署网站为何提示未备案?
Swift开发中switch语句值绑定模式
瓜子二手车官方网站在线入口 瓜子二手车网页版官网通道入口
Laravel怎么配置自定义表前缀_Laravel数据库迁移与Eloquent表名映射【步骤】
Claude怎样写结构化提示词_Claude结构化提示词写法【教程】
如何撰写建站申请书?关键要点有哪些?
Laravel API资源类怎么用_Laravel API Resource数据转换
HTML5空格和nbsp有啥关系_nbsp的作用及使用场景【说明】
长沙企业网站制作哪家好,长沙水业集团官方网站?
专业型网站制作公司有哪些,我设计专业的,谁给推荐几个设计师兼职类的网站?
Python文件流缓冲机制_IO性能解析【教程】
使用PHP下载CSS文件中的所有图片【几行代码即可实现】
JavaScript如何实现类型判断_typeof和instanceof有什么区别
Android okhttputils现在进度显示实例代码
如何用腾讯建站主机快速创建免费网站?
悟空识字怎么关闭自动续费_悟空识字取消会员自动扣费步骤
如何在不使用负向后查找的情况下匹配特定条件前的换行符
百度浏览器如何管理插件 百度浏览器插件管理方法
Laravel用户认证怎么做_Laravel Breeze脚手架快速实现登录注册功能
移动端手机网站制作软件,掌上时代,移动端网站的谷歌SEO该如何做?
在centOS 7安装mysql 5.7的详细教程
Laravel如何配置和使用缓存?(Redis代码示例)
Laravel如何实现数据库事务?(DB Facade示例)
Laravel如何实现全文搜索_Laravel Scout集成Algolia或Meilisearch教程
Laravel路由怎么定义_Laravel核心路由系统完全入门指南
高防服务器:AI智能防御DDoS攻击与数据安全保障
DeepSeek是免费使用的吗 DeepSeek收费模式与Pro版本功能详解
北京专业网站制作设计师招聘,北京白云观官方网站?
Laravel如何使用查询构建器?(Query Builder高级用法)
如何在HTML表单中获取用户输入并结合JavaScript动态控制复利计算循环
Laravel如何生成API文档?(Swagger/OpenAPI教程)

