Chinaunix首页 | 论坛 | 博客
  • 博客访问: 77080
  • 博文数量: 36
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 10
  • 用 户 组: 普通用户
  • 注册时间: 2015-10-08 13:58
文章分类
文章存档

2015年(36)

我的朋友

分类: Python/Ruby

2015-10-08 22:17:02

     大家可能都使用过matlab自带的xcorr函数,作为一个自相关库函数,可以对输入求其自相关序列,配合使用plot函数还可以画出图像。但是不足之处是如果想获得自相关图像中某个点的值,使用matlab是比较困难的,虽然在图像上有鼠标工具,但是如何使用程序自动实现求图像上任意一个点的值呢?一种思路是可以在相应的横坐标上画一条垂直的直线,然后求直线与图像的交点。但是这个方法对于matlab外行的自己来说,并非那么浅显明白,另外,完全封闭的xcorr函数也让自己感觉面对的是一个“黑盒子”,于是自己萌发了写一个自己使用的自相关函数的想法。由于自相关函数在不同的领域有不同的定义,我们这里实现的是一个统计学上的通用定义,即:

     这里自己使用Python来实现,需要注意,如果想针对一个文件输入求其相关性,正好适应Python将字节作为操作单位的特性,具体的代码如下:

点击(此处)折叠或打开

  1. # -*- coding: cp936 -*-
  2. """
  3. This is a Simple Code for compute the specific value of autocorrelation function
  4. Compute Fomular: R(k) = E[(Xi - e)(X(i+k) - e)] / V, as E is Expection function,
  5. e is Expection Value and V is Variance
  6. e = E(Xi) = sum(Xi) / n, i = 1, 2,3 ...n
  7. V = E[(Xi - e)^2]
  8. The Line-Function of Two-point is y = Y0 + k(X - X0), k = (Y1 - Y0)/(X1 - X0)
  9. """

  10. #Autorized by GY, date 2014-08-05
  11. """
  12. 本函数的作用是通过求解自相关函数在0和1处的函数值,构造其直线图像获取0附件的值,比如R(0.001)
  13. """
  14. import sys
  15. class File:
  16.     def __init__(self):
  17.         #open a file to read
  18.         FileName = raw_input('Please input the FileName: ')
  19.         self.fs = open(FileName, 'rb') #All attribute must be self-*
  20.     
  21.     def FRead(self):
  22.         global buff
  23.         buff = self.fs.read()
  24.         #返回文件大小
  25.         global size
  26.         size = self.fs.tell()
  27.         print 'size is ', size
  28.         self.fs.close()
  29.         return size

  30. class AR:
  31.     #计算期望
  32.     def Expe(self, buff):
  33.         print 'Compute the Expection...'
  34.         esum = 0.0
  35.         for i in range(size):
  36.             esum = esum + ord(buff[i])
  37.         self.E = esum / size
  38.         print 'The Expection is ', self.E
  39.         return self.E
  40.     #计算方差
  41.     def Vari(self, buff):
  42.         print 'Compute the Variance...'
  43.         vsum = 0.0
  44.         for e in buff:
  45.             vsum = vsum + pow((ord(e) - self.E), 2)
  46.         self.V = vsum / size
  47.         print 'The Variance is ', self.V
  48.         return self.V
  49.     #计算坐标1点的AR值,因为根据自相关函数性质AR(0) = 1
  50.     def AR_P(self):
  51.         print 'compute the AR-Value...'
  52.         self.tsum = 0.0
  53.         for i in range(size - 1):
  54.             self.tsum += (ord(buff[i])- self.E)*(ord(buff[i+1]) - self.E)
  55.         print 'self.tsum is ', self.tsum
  56.         self.ar = self.tsum / ((size - 1)* self.V )
  57.         print 'self.ar is :', self.ar
  58.         return self.ar
  59.     #已知两点计算直线某点的y值
  60.     def lineP(self, x):
  61.         print 'compute the y value...'
  62.         self.value = self.ar + (self.ar - 1)*(x - 1)
  63.         print 'AR(',x,') is ', self.value
  64.         return self.value

  65. print 'This tool is to return AutoFunction(point)...'
  66. fs = File()
  67. if fs.FRead() <= 0:
  68.     print 'File Read Error!'
  69.     sys.exit()
  70. print 'Now we begin build the AF value...'
  71. ar = AR()
  72. ar.Expe(buff)
  73. print ''
  74. ar.Vari(buff)
  75. ar.AR_P()
  76. x = input("Please input the wanted x value...")
  77. print 'The AR() value is '
  78. ar.lineP(x)
  79. raw_input('Enter for Exit...')
      程序其实也不长,因为毕竟只是实现了一个比较简单的自相关函数定义,下面具体来解释分析一下。
1. 第十六行到第三十行定义了一个文件类,因为这里程序的“对象”只有两个:文件输入和自相关算法,因此我们首先定义实现一个文件类,用于获得要计算相关性的文件,并且建立缓冲区存储这些输入数据;第十七行定义了一个构造函数,用于提示用户输入指定的文件名,并打开该文件获取内容;第二十二行定义了Read方法,读入内容,并且记录下文件大小(字节数),这些都会作为数据输入提供给下面的算法类,注意这里使用了全局变量global使得算法类也可以访问文件大小和输入缓冲区;
2. 第三十二行到第六十六行定义实现我们的算法类AR(AutoRelation),根据公式,我们需要分别实现期望Expe、方差Vari、AR(1)值以及直线方程四个方法。期望和方差是计算自相关函数所必须的,而直线方程式由于自相关函数是关于整数点延迟的函数,因此如果想获得0.1处的坐标只能利用直线进行估计,而这也是matlab使用的方法;
3. 第三十四行到第四十一行实现了期望函数,这里需要主要的是使用了for循环,将读入的文件的每一个字节转换成其ascii码值,利用这个值做十进制的运算加法后取平均值,为了使得结果更加精确,我们在运算中定义了浮点数;
4. 第四十二行到第五十行实现了方差函数,这里的关键是使用pow函数表示平方,然后去平均数即可;
5. 第五十二行到第六十行来计算AR(1)的值,主要思路是将x=1带入上面的公式,延迟为1即可;
6. 第六十一到第六十六行实现了直线方程,利用两点式来获取其他点的坐标,但是这不是一个好方法,对于0-1之间的点式适用的,不适用与1之后的点,那时可能需要AR(2)的值;
7. 第六十八行到第八十二行主要是程序的执行流程,并且输出一些调试信息,显示程序的运行结果;
     好了,现在来看看程序运行的结果,我们找了一个示例文件进行测试:


【PS:本节要点
1. Python按照字节为单位操作数据,非常适合字符编程;
2. 字节的ascii码值可以使用ord获得,而一个ascii码值对应的字符可以使用chr获得;
3. 面向对象的“对象”指的主体和算法;
4. 类的属性默认为局部的,即如果单独定义,则为类的所有实例共享;如果想变成全局的,必须使用global标签;
5. 引用自身的属性必须使用self前缀;
阅读(2965) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~