范德萨发而为
全部博文(392)
分类: LINUX
2012-07-27 17:04:47
http://blog.csdn.net/scottxp/article/details/4323936
众所周知,Htmlparser本身有一些小bug,而且也有三年没更新了。所以现在基于java的信息抽取多转向NekoHtml。不过Htmlparser本身还是有不少优点,主要是扩展性强,其利用的设计模式值得学习。由于时间的关系,现在项目还是使用Htmlparser,以后有时间会对nekohtml进行研究。
今天遇到的bug来自于对。
解决的办法很简单 ,只需将参数改为:
当参数为true时,该方法会自动考虑引号的问题。