Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2552291
  • 博文数量: 709
  • 博客积分: 12251
  • 博客等级: 上将
  • 技术积分: 7905
  • 用 户 组: 普通用户
  • 注册时间: 2005-07-17 00:00
个人简介

实现有价值的IT服务

文章存档

2012年(7)

2011年(147)

2009年(3)

2008年(5)

2007年(74)

2006年(431)

2005年(42)

分类: IT职场

2007-02-13 11:27:43

全套垂直搜索引擎技术
一、互联网信息采集与处理检索系统
1.         新闻搜索引擎SPIDER
2.         网页搜索引擎SPIDER
3.         定向专业搜索SPIDER
4.         基于视觉的正文智能提取模块(自动正文提取)
5.         智能摘要提取模块
6.         去重模块
7.         智能分类模块
8.         检索前端类聚模块
9.         分词模块
10.     索引模块
11. 最大可支持10TB以上数据容量,可分层建索引库、分布索引、分布检索、分布采集处理。
二、WEB结构化信息抽取技术(格式化数据抽取)
应用于垂直搜索引擎的重要技术,抽取出结构化数据。
三、自然语言的结构化信息抽取技术
应用于垂直搜索引擎,情报分析处理(科研产品)
阅读(2806) | 评论(1) | 转发(0) |
给主人留下些什么吧!~~