Chinaunix首页 | 论坛 | 博客
  • 博客访问: 180418
  • 博文数量: 29
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 601
  • 用 户 组: 普通用户
  • 注册时间: 2013-07-03 18:51
个人简介

大数据算法,分布式技术,spark技术爱好者

文章分类

全部博文(29)

文章存档

2015年(4)

2014年(3)

2013年(22)

发布时间:2013-10-09 17:37:43

最近项目需要,研究了很久的jsoup。做个小小的总结:首先说一下jsoup是非常强大的。最常用的select(xxx[xxx~=regx])可以选择内容是某种格式的属性的某种标签。这里可以用正则表达式的。还有一个用的很少的,而且说明文档不清楚的::eq(n),:lt(n),:gt(n)这三个伪命令。n为位置序号,当前ele的下属的第一个位置的序号是0,.........【阅读全文】

阅读(2467) | 评论(0) | 转发(0)

发布时间:2013-10-09 17:17:31

regx = "#|(//s*)"这个正则表达式匹配的是所有满足#或者 任意长度空白的子字符串。但是下面这个:regx= "(//s*)|#"匹配的却是所有空白子字符串。解析的时候并不会解析|#,原因是//s*是贪婪匹配,是无限种匹配方式,如果是用有限自动机来理解,就是这个匹配要达到的状态在自循环时只有达到字符串结尾才终止。所以不会匹配.........【阅读全文】

阅读(1936) | 评论(0) | 转发(0)

发布时间:2013-09-18 09:42:25

现在公司写算法都用JAVA了。每天被面向对象熏陶,渐渐的也有点小感悟。过去一直觉得java,c++都是面向对象的经典语言,而面向对象的思想应该已经可以完全的被他们实现。但现在我认为其实不然。在java中,类是概念,对象是实例,对实例的方法调用是对对象发送消息。发送消息的方式为A a = new A(); a.method();这些大.........【阅读全文】

阅读(2135) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册