Chinaunix首页 | 论坛 | 博客
  • 博客访问: 100464
  • 博文数量: 10
  • 博客积分: 1400
  • 博客等级: 上尉
  • 技术积分: 90
  • 用 户 组: 普通用户
  • 注册时间: 2008-07-02 21:49
文章分类

全部博文(10)

文章存档

2011年(1)

2009年(2)

2008年(7)

我的朋友

分类:

2008-07-02 23:04:03

True Positive (真正, TP)被模型预测为正的正样本;

True Negative(真负 , TN)被模型预测为负的负样本 ;

False Positive (假正, FP)被模型预测为正的负样本;

False Negative(假负 , FN)被模型预测为负的正样本;

True Positive Rate(真正率 , TPR)或灵敏度(sensitivity) 
   TPR = TP /(TP + FN) 
   正样本预测结果数 / 正样本实际数

True Negative Rate(真负率 , TNR)或特指度(specificity) 
   TNR = TN /(TN + FP) 
   负样本预测结果数 / 负样本实际数 

False Positive Rate (假正率, FPR) 
   FPR = FP /(FP + TN) 
   被预测为正的负样本结果数 /负样本实际数 

False Negative Rate(假负率 , FNR) 
   FNR = FN /(TP + FN) 
   被预测为负的正样本结果数 / 正样本实际数

召回率和精度:

- 系统检索到的相关文档(A)

       - 系统检索到的不相关文档(B)

       - 相关但是系统没有检索到的文档(C)

       - 不相关但是被系统检索到的文档(D)

 

 

直观的说,一个好的检索系统检索到的相关文档越多越好,不相关文档越少越好.

召回率和精度是衡量信息检索系统性能最重要的参数.

召回率R:用检索到相关文档数作为分子,所有相关文档总数作为分母,即 R=A/(A+C)

精度P 用检索到相关文档数作为分子,所有检索到的文档总数作为分母.即  P=A/(A+B).

 

检索到

A

B

未检索到

C

D

阅读(16929) | 评论(1) | 转发(0) |
给主人留下些什么吧!~~

yd12212008-07-06 21:15:20

hē hē ,zhī chí ,xiè xiè lóu zhǔ fēn xiǎng ,zhēn de bù cuò ,dǐng !!! 呵 呵 ,支 持 ,谢 谢 楼 主 分  享 , 真 的 不 错 , 顶 !!!  — 快典网( http://kdd.cc/ )自动注音