Chinaunix首页 | 论坛 | 博客
  • 博客访问: 44500
  • 博文数量: 9
  • 博客积分: 10
  • 博客等级: 民兵
  • 技术积分: 130
  • 用 户 组: 普通用户
  • 注册时间: 2012-08-03 07:58
文章分类

全部博文(9)

文章存档

2014年(4)

2013年(5)

我的朋友

发布时间:2014-07-10 22:30:31

因为项目中要做个句子相似度的判断,思考着试试用语义依存的角度来解决。先后用了stanford parser, 哈工大nlp,结论是,对结构正规的句子,判断结果还行;句子稍微不正规一点,结果就匪夷所思。汉语的语义依存的判断的准确率,目前还是有待提高。.........【阅读全文】

阅读(809) | 评论(0) | 转发(0)

发布时间:2014-07-10 22:15:14

作用:TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。理论基础:一个词的重要程度与词在文中的词频有关,以及与词在其他文档中被包含的程度有关。TF: Term Frequency 词频以上式子中  是该词在文件中的出现次数,而分母则是在文件中所有.........【阅读全文】

阅读(1015) | 评论(0) | 转发(0)

发布时间:2014-07-10 22:12:09

n-gram......【阅读全文】

阅读(1178) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册