源起
早上读了一篇Intel大会的报告,报告中给出了一个大会演讲文稿的下载列表。由于无法批量下载,只能一个一个的右键另存为。。。所以想批量下载之。
现在想来,有两个可行方案。
方案一
工具:word+迅雷
方法:
1. 在邮件中右键查看邮件的源文件,如下图
2. 此时会自动打开一个文档编辑器,一般是记事本,里边的代码已经达到乱码级别,如下图
3. 若将这些字符都粘贴到迅雷的新建框中,会显示没有找到有效的URL,因为下载地址都在HTML标签内部
4. 这就告诉我们下一步工作的方向,对,就是把标签删掉,只留下下载地址。此时开始使用强大的WORD,将源码粘贴到word中,如下图
5. 为了加快处理速度,我们无妨手工删除一些头文件,减少批处理的次数,加快效率。此时,我把HTML头文件、邮件头文件以及尾部无关紧要的东西都删除了。
6. 剩下的文档看上去就很规律了,要处理的文档可以被分为一个一个的小模块,此时就可以使用批处理工具了。如下图
7. 一说到批处理工具,大家首先想到的可能是宏,但我要告诉大家,实际上,有个更快捷的工具,那就是“替换”,继续解决问题,我们需要替换掉HTML的标签,于是打开ctrl+H键,需要替换的项目依次是
源文档中内容
|
替换为
|
|
^p
|
|
^p
|
这边的内容是随机的,你可以按照你想要替换的内容修改,也可以一步一步的进行替换
|
这边为标准占位符的默认符号 ^p是硬回车,就是我们常见的换行符
^t是制表符,码农很熟,不做赘述,^l注意是L的小写,此处是软回车,想知道啥是软回车
请问度娘。
|
由此一套技能下来,原来乱糟糟的一堆字符,现在就变成如下状态了
8. 全选以后,复制,在迅雷中新建任务,将刚才全选的内容粘贴进去(有的系统配置了迅雷,复制完成后自动跳出新建任务,那就更轻松了)如下图:
9. 然后就可以下载啦。完工。
方案二
整理上述文档的时候,忽然想起迅雷有个NB的功能叫做下载本页全部链接。
当然你的浏览器必须得被迅雷支持才好。具体怎么设置,请查看迅雷帮助文档。
在邮件网页中右键选定这个NB的功能,而后选择要下载的文档,当然此处为.PDF格式。
一招即可。。。高技术秒杀低级码工。。。
小结
在实验上述过程中,还尝试过使用HTML编辑工具格式化网页代码,随后发现走了远路。LP的自然语言处理课中正在用WORD所以想到使用这个工具
最近在读侯捷老师的《WORD的排版艺术》受益颇深,相比各种代码工具,这些东西学起来还是很轻松的。
阅读(2471) | 评论(0) | 转发(0) |