Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1649471
  • 博文数量: 1481
  • 博客积分: 26784
  • 博客等级: 上将
  • 技术积分: 17045
  • 用 户 组: 普通用户
  • 注册时间: 2011-07-12 09:22
文章分类

全部博文(1481)

文章存档

2014年(10)

2013年(353)

2012年(700)

2011年(418)

分类: 系统运维

2012-08-03 09:24:19

  1. function insert($href='',$pattern='',$novel='',$author='')
  2. {
  3. $href = "";
  4. $hrefb = strrev($href);
  5. $hrefb = strstr($hrefb,'/');
  6. $hrefb = strrev($hrefb);
  7. $pattern = '/\(.+?)\<\/a\>/i';
  8. $url = curl_init($href);
  9. curl_setopt($url,CURLOPT_RETURNTRANSFER,true);
  10. try{
  11. $pdo = New PDO('mysql:location=localhost;dbname=test','testuser','mytest');
  12. $pdo->query('set names utf8');
  13. }catch( PDOException $e ){
  14. echo $e->getMessage();
  15. }
  16. $string = curl_exec($url);
  17. $string = iconv('gbk', 'utf-8', $string);
  18. preg_match_all( $pattern, $string, $array );
  19. $stmt = $pdo->prepare("insert into novel (`novelName`,`author`,`chapterName`,`chapterinfo`,`chapterLink`) values(?,?,?,?,?) ;");
  20. $j = count($array[1]);
  21. echo '';
  22. $novel = '异界全职业大师';
  23. $author = '庄毕凡';
  24. for ($i = 0; $i < $j; $i++) {
  25. $link = $hrefb.$array[1][$i];
  26. $info = $array[2][$i];
  27. $title = $array[3][$i];
  28. $stmt->bindParam(1, $novel) ;
  29. $stmt->bindParam(2, $author);
  30. $stmt->bindParam(3, $title);
  31. $stmt->bindParam(4, $info);
  32. $stmt->bindParam(5, $link);
  33. $rst = $stmt->execute();
  34. $color = $rst ? 'green' : 'red';
  35. echo '
  36. ';
  37. if (strstr($title,'大结局')!==false) {
  38. break;
  39. }
  40. }
  41. echo '
  42. ';
  43. echo '';
  44. echo $link;
  45. echo '';
  46. echo '
  47. ';
  48. echo '';
  49. echo $info;
  50. echo '';
  51. echo '
  52. ';
  53. echo '';
  54. echo $title;
  55. echo '';
  56. echo '
  57. ';
  58. curl_close($url);
  59. }
  60. insert();



看到CURL采集就写了个采集某站的小说列表的函数,带插入数据库
应该还行,结合Linux再扩展一下就可以做个类似的booksky.org那样的站了

视频地址:

阅读(330) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~