问题一
# do you want to follow external links
noExternalLinks
这段设置 如果 #noExternalLinks 是不是 就可以爬所有外网 连接
问题二
是不是 如果larbin 中途 停止(关机) 再运行就从头 开始采集
问题三
我想把保存的文件 扩展名变成 .html 是否可以
问题四
我想用 GDB 一步一步跟踪 LARBIN 不知道 怎么下手
|
Blog作者的回复: 回答一、不设置此项,限定范围可以看本博客里面的一篇文章; 回答二、不是,在options.h中设置reload可以从上次停止的地方开始运行。 以上两个问题建议仔细看文档。 回答三、可以,在saveuseroutput.cc中做些修改就可以。 回答四、用make debug编译,调试可以看gdb的帮助。 |