前嗅(www.forenose.com)是国内领先的深度大数据专家,我们拥有从数据采集、分析、处理、管理、应用到营销,完 全独立知识产权的一整套大数据产品。前嗅致力于以深厚的技术功底和海量的数据资源打造国内第一家深度大数据平台!
分类: 数据库开发技术
2019-03-15 09:14:58
array 类为数组类。
一.类成员: 二.成员方法: 三.脚本应用如果在导航栏的采集预览中找到多个栏目,我们需要的个别栏目在爬虫的链接过滤中很难得到的时候。那就可以在网页源码中找到需要的链接和栏目标题,用如下脚本
示例array city; //定义一个数组city = [{name:"北京",url:"/zhaopin/diqu/beijing/"},{name:"天津",url:"/zhaopin/diqu/tianjin/"},{name:"河北",url:"/zhaopin/diqu/huabei/"}]; for(int i = 0;i < city.length; i++){url u;u.title = city[i].name; //需要输出的栏目标题u.urlname = "http://www.gaoxiaojob.com"+city[i].url; //拼接出需要的栏目链接u.tmplid = 2; //指定处理模板?u.entryid = CHANN.id; RESULT.AddLink(u); //输出}
脚本的输出结果
【输出结果】
hash 类为键值对类。
一.类成员:二.成员方法:
Iter遍历hash样例:hash hs;hs.aa = 1;hs.bb = 2;hs.Iter(function(n,v){echo(n+":" + v +"
");});
file 类为文件操作类。
一.类成员:二.成员方法:
field 类为数据字段操作类。
一.类成员: 二.成员方法: