node.js 抓取代理ip实例代码

发布时间 - 2026-01-11 00:54:24    点击率:

node.js实现抓取代理ip

主要文件:index.js

/*
* 支持:node.js v7.9.0
*/
const cheerio=require('cheerio');
const fetch =require('node-fetch');
const Promise=require('bluebird');
let mongoose=require('mongoose');

Promise.promisifyAll(mongoose);
let Schema=mongoose.Schema;
mongoose.connect('mongodb://localhost:27017/ipproxypool');
let IPpool=new Schema({
  ip:{type:String,unique:true}
})
let Ipproxy=mongoose.model('IP',IPpool);

function fetchUrl(url){
  fetch(url,{
    method:'get',
    headers:{
    }
  })
  .then(res=>res.text())
  .then(body=>{
    let $=cheerio.load(body);
    let length=$('#list table tbody').find('tr').length;
    for (let i=0;i<length;i++){
    let ipaddress= $('#list table tbody').find('tr').eq(i).find('td').eq(0).text() ;
    let port = $('#list table tbody').find('tr').eq(i).find('td').eq(1).text();
    console.log(`IP:${ipaddress}:${port}`);
    let ip=`${ipaddress}:${port}`
    let ippool=new Ipproxy({
      ip:ip
    })
    ippool.save();
    }
  })
}

var sleep = function (time) {
  return new Promise(function (resolve, reject) {
    setTimeout(function () {
      resolve('ok');
    }, time);
  })
};
const pageNumber=10;
var start = async function(){
  for(let j=1;j<pageNumber;j++){
     console.log(`当前是第${j}次等待..`);
    fetchUrl(`http://www.kuaidaili.com/free/inha/${j}/`);
    await sleep(1500);
  }
}
start();

包支持 : package.json

{
 "name": "demo-4-ipproxypool",
 "version": "1.0.0",
 "description": "",
 "main": "index.js",
 "scripts": {
  "test": "echo \"Error: no test specified\" && exit 1"
 },
 "author": "false-l",
 "license": "",
 "devDependencies": {
  "babel-preset-es2015": "^6.24.1",
  "babel-preset-react": "^6.24.1",
  "babel-preset-stage-3": "^6.24.1"
 },
 "dependencies": {
  "babel-core": "^6.24.1",
  "bluebird": "^3.5.0",
  "cheerio": "^0.22.0",
  "koa": "^2.2.0",
  "koa-router": "^7.1.1",
  "mongoose": "^4.9.6",
  "node-fetch": "^1.6.3"
 }
}

本地需要安装mongodb数据库,用于存储抓取到的ip,目前还未实现ip验证。写这个主要是处于好奇。

上面的代码就可以实现抓取ip代理网站的ip并存到mongodb数据库中。

下面在放出一个基于koa2的api接口的简易服务器实现

server

const Promise=require('bluebird');
let mongoose=require('mongoose');
const koa=require('koa');
const app=new koa();
var router = require('koa-router')();
Promise.promisifyAll(mongoose);
let Schema=mongoose.Schema;
mongoose.connect('mongodb://localhost:27017/ipproxypool');
let IPpool=new Schema({
  ip:{type:String,unique:true}
})
let Ipproxy=mongoose.model('IP',IPpool);

app.use(async (ctx, next) => {
 await next();
 var data=await Ipproxy.find({},function(err,ips){
  var ipmap=[];
   ips.forEach(function(ip){
     ipmap[ip._id]=ip;
     //console.log(ip)
   });
 })
 var map=data.map(ip=>ip.ip);
 ctx.response.type = 'text/json';
 ctx.response.body = map;
});
app.listen(3000);
console.log('server listen:3000')

至于为什么既有promise又有async,是因为对异步语法还不是很熟,怎么会怎么写了。

使用方式:

 根据package.json

npm install   // 安装支持

node index.js  //获取代理 ip

node server.js  //运行简易ip接口

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!


# node.js  # 抓取代理ip  # 抓取代理ip详解及实例  # 在Node.js中使用Javascript Generators详解  # Node.js站点使用Nginx作反向代理时配置GZip压缩的教程  # Node.js项目中调用JavaScript的EJS模板库的方法  # Node.js中JavaScript操作MySQL的常用方法整理  # Node.js和PHP根据ip获取地理位置的方法  # JavaScript 用Node.js写Shell脚本[译]  # 是因为  # 又有  # 希望能  # 还未  # 写了  # 谢谢大家  # 数据库中  # 就可以  # 很熟  # 主要是  # length  # load  # table  # list  # body  # url  # method  # function  # fetchUrl  # gt 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: 1688铺货到淘宝怎么操作 1688一键铺货到自己店铺详细步骤  Laravel如何自定义分页视图?(Pagination示例)  Laravel如何操作JSON类型的数据库字段?(Eloquent示例)  如何在Tomcat中配置并部署网站项目?  如何在宝塔面板创建新站点?  MySQL查询结果复制到新表的方法(更新、插入)  长沙做网站要多少钱,长沙国安网络怎么样?  高端企业智能建站程序:SEO优化与响应式模板定制开发  利用JavaScript实现拖拽改变元素大小  详解jQuery停止动画——stop()方法的使用  Laravel如何实现文件上传和存储?(本地与S3配置)  Laravel怎么创建控制器Controller_Laravel路由绑定与控制器逻辑编写【指南】  独立制作一个网站多少钱,建立网站需要花多少钱?  如何在IIS中新建站点并配置端口与物理路径?  Swift中switch语句区间和元组模式匹配  Laravel怎么使用Session存储数据_Laravel会话管理与自定义驱动配置【详解】  Linux系统运维自动化项目教程_Ansible批量管理实战  如何在Windows 2008云服务器安全搭建网站?  做企业网站制作流程,企业网站制作基本流程有哪些?  韩国代理服务器如何选?解析IP设置技巧与跨境访问优化指南  大型企业网站制作流程,做网站需要注册公司吗?  详解Android——蓝牙技术 带你实现终端间数据传输  如何基于PHP生成高效IDC网络公司建站源码?  如何快速生成橙子建站落地页链接?  如何快速启动建站代理加盟业务?  Laravel怎么进行浏览器测试_Laravel Dusk自动化浏览器测试入门  Laravel Eloquent:优雅地将关联模型字段扁平化到主模型中  如何续费美橙建站之星域名及服务?  无锡营销型网站制作公司,无锡网选车牌流程?  网站制作大概多少钱一个,做一个平台网站大概多少钱?  如何用y主机助手快速搭建网站?  青岛网站建设如何选择本地服务器?  linux top下的 minerd 木马清除方法  软银砸40亿美元收购DigitalBridge 强化AI资料中心布局  高配服务器限时抢购:企业级配置与回收服务一站式优惠方案  linux写shell需要注意的问题(必看)  Laravel如何使用Vite进行前端资源打包?(配置示例)  Laravel怎么实现API接口鉴权_Laravel Sanctum令牌生成与请求验证【教程】  mc皮肤壁纸制作器,苹果平板怎么设置自己想要的壁纸我的世界?  HTML5段落标签p和br怎么选_文本排版常用标签对比【解答】  ChatGPT 4.0官网入口地址 ChatGPT在线体验官网  如何确认建站备案号应放置的具体位置?  高防网站服务器:DDoS防御与BGP线路的AI智能防护方案  如何在香港免费服务器上快速搭建网站?  C++时间戳转换成日期时间的步骤和示例代码  黑客如何利用漏洞与弱口令入侵网站服务器?  Win11怎么开启自动HDR画质_Windows11显示设置HDR选项  JS实现鼠标移上去显示图片或微信二维码  详解CentOS6.5 安装 MySQL5.1.71的方法  Laravel如何发送系统通知_Laravel Notifications实现多渠道消息通知