Chinaunix首页 | 论坛 | 博客
  • 博客访问: 22651
  • 博文数量: 32
  • 博客积分: 1850
  • 博客等级: 上尉
  • 技术积分: 480
  • 用 户 组: 普通用户
  • 注册时间: 2011-06-06 21:29
文章分类
文章存档

2011年(32)

我的朋友

分类: Mysql/postgreSQL

2011-07-23 07:52:46

文章来源:千万间房产搜索引擎

房产垂直类搜索引擎的共同特点是专业性和垂直性,区别于Google、Baidu等通用搜索引擎。同时收录了上面提到的房产行业垂直网站,和分类信息网站的房源信息,对网页信息进行了结构化信息抽取;之后,由行业专家和顾问,提供专业的分类、去重处理;最后分词、索引,再以语义搜索的方式,满足用户的个性化需求。这样不仅可以让用户同时搜索多家专业网站,同时还降低了用户在搜索后的筛选有效搜索结果的时间和精力,节约了成本。

2011年,全新的房产搜索业务平台——房产垂直搜索引擎“千万间”正式运营上线,它一经推出便引来业界人士的高度关注和广大网友的广泛热评。首先,它的所有业务功能都是由各个领域的专家及技术团队人员共同研究开发;其次,它几乎收录了目前国内相关业务的所有海量数据,并能做到及时更新;最后,它通过对业务数据相应元素标签化、语义化的二次处理,力求以专业、丰富、多样的展现形式向广大用户提供优质服务。

“千万间”所提供的

“千万间”针对房产这一特定领域,对网页资源按内容定向分字段进行抽取并依靠其所拥有的业界最大最全的专业词库、语义规则库进行净化、分类、聚类、挖掘等多次处理,最终为用户提供丰富有效专业且个性化的信息内容,形成一个信息聚合平台。

相较百度、谷歌等通用搜索而言,它通过高效的信息组织方式减少信息无序,增加信息深度和时间维度以保证信息的时效性,提供给用户的是更专业,更系统,更深入,更及时的结构化房产信息;相较各房产网站及各房产栏目而言,它是对信息提供方式的一次简化性整合,提供了更全面,更多样,更权威的数据以及信息搜索成本最小化的知识获取方式。

强大的数据基础

为了保证数据广度,“千万间”通过对目前上百家房产网站的分析调研最终确定第一期收录国内近 70个专业网站(如搜房、安居客、焦点、新浪乐居等),20多个分类信息网站(如58同城、赶集、百姓网等)及多家房产经纪公司网站(如链家、我爱我家、满堂红等)的信息,这个数字还在与日俱增。另外,它收录了主流论坛网站上的房源信息,如天涯、西祠胡同、各个门户网站的论坛等。目前数据覆盖率已达94个城市上千家房地产经纪公司的近80万经纪人,日均新增房源数据量已经达到620,000条,日均更新量达到1,600,000条,房源总数量高达130,000,000条。

为了保证数据深度,“千万间”通过数据挖掘用户行为分析等多种方式力求更好的整合房产行业资源,更深的挖掘信息价值:在判断房源由中介还是个人发布时,“千万间”除了采用普通网站通过该房源详情页查找相关特征或对其电话进行甄别的通用做法,还通过定期训练中介房源信息样本,从而总结出经纪人房源发布的规律和特征标识,建立起经纪人房源信息发布特征库, 进而提高对房源来源识别的准确性。

为了保证信息反馈的灵敏度,搜索后台通过排序技术、热点词高速缓存等技术使搜索结果以0.01秒为计量单位。

为了保证信息的及时性,“千万间”对各家网站最新数据力争做到及时收录,通过经纪人工作行为分析在其发布房源的高峰时期调整抓取频率和密度,个别网站则通过部署专门监控模块进行实施跟踪检查,力求做到数据与原网站的同步。

快捷方便的圈地找房

为了满足网民日渐多元化的需求,“千万间”力求在与用户交互互动的过程中产生了更多的应用与需求,以提高用户粘性和用户体验。 “圈地找房”功能,可以在地图上任意画出自己的找房区域,更快捷,更方便。

结语

阅读(334) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~