Chinaunix首页 | 论坛 | 博客
  • 博客访问: 199902
  • 博文数量: 99
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 1045
  • 用 户 组: 普通用户
  • 注册时间: 2014-07-15 14:24
文章分类
文章存档

2015年(9)

2014年(90)

我的朋友

分类: PHP

2014-08-13 16:00:57

这个问题看似简单,做起来却有些麻烦,我用一种不太聪明的方式实现:
把已有的关键字链接替换成文字
把关键字从长至短排列
从长至短替换关键字为链接,替换的同时查找有没有包含其他关键字,如果有,把其中子关键字替换成{
子关键字的md5值}
把{子关键字的md5值}替换回来
代码如下:

点击(此处)折叠或打开

  1. <?php
  2. /**
  3.  * 按长度排序(降序)
  4.  */
  5. function _sortDesc($a, $b) {
  6.   return (strlen($a[0]) < strlen($b[0])) ? 1 : -1;
  7. }


  8. $linkDefs = array(
  9.  '茶叶,111.htm',
  10.  '中国茶叶大观,222.htm',
  11. );
  12. $linkMap = array();
  13. foreach($linkDefs as $row) {
  14.   $linkMap[] = explode(',', $row);
  15. }
  16. $str = '
  17. 这儿是茶叶的链接。

  18. 这儿是中国茶叶大观的链接。

  19. 这儿是茶叶的现有链接。

  20. 这儿是中国茶叶大观的现有链接。

  21. ';
  22. //把原有的链接替换成文字
  23. foreach($linkMap as $row) {
  24.   $str = preg_replace('/(\s*)('.$row[0].')(\s*<\/a>)/sui', '${2}', $str);
  25. }
  26. //关键字从长至短排序
  27. usort($linkMap, '_sortDesc');
  28. $tmpKwds = array(); //存放暂时被替换的子关键字
  29. foreach($linkMap as $i=>$row) {
  30.   list($kwd, $url) = $row;
  31.   for($j=$i+1; $j<count($linkMap); $j++) {
  32.     $subKwd = $linkMap[$j][0];
  33.     //如果包含其他关键字,暂时替换成其他字符串
  34.     if(strpos($kwd, $subKwd) !== false) {
  35.       $tmpKwd = '{'.md5($subKwd).'}';
  36.       $kwd = str_replace($subKwd, $tmpKwd, $kwd);
  37.       $tmpKwds[$tmpKwd] = $subKwd;
  38.     }
  39.   }
  40.   //把文字替换成链接
  41.   $str = preg_replace('/('.$row[0].')/sui', '.$row[1].'">'.$kwd.'', $str, 5);
  42. // 最多替换5次
  43. }
  44. foreach($tmpKwds as $tmp=>$kwd) {
  45.   $str = str_replace($tmp, $kwd, $str);
  46. }
  47. echo $str;
  48. ?>
程序输出:
这儿是金元宝微店的链接。

这儿是免费微信开店的链接。

这儿是个人微信开店的现有链接。

这儿是金元宝微店官网的现有链接。

阅读(500) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~