Template::Extract-gamester88_cu-ChinaUnix博客

gamester88

首页　| 　博文目录　| 　关于我

gamester88_cu

博客访问： 187182
博文数量： 159
博客积分： 7007
博客等级：准将
技术积分： 1750
用户组：普通用户
注册时间： 2008-06-17 15:05

文章分类

全部博文（159）

ssh（4）
管理（49）
ftp（1）
svn（6）
samba（3）
mail（1）
http（35）
fedora（8）
mysql（11）
perl（17）
shell（18）
lfs（4）
未分配的博文（2）

文章存档

2010年（39）

2009年（106）

2008年（14）

我的朋友

Template::Extract

by Fayland Lam

由☻ 唐鳳 ☺ 所编写，可以使用 TT2 表达式从某个数据里提取东西，而无须使用正则表达式。

一般来说，得到一个 HTML 内容之后，可以使用正则，或者类如之类的模块来提取数据。本文介绍的模块能同样使 job 完成，并且更加优雅。

以我们当前的举例，得到所有的 link 和对应的编号。

   1 use strict;
   2 use warnings;
   3 use LWP::Simple 'get';
   4 use Template::Extract;
   5 use Data::Dumper::Perltidy; # or just Data::Dumper
   6 
   7 my $html = get('');
   8 my $rule = <;
   9 [% FOREACH link IN links %]
  10 
[% link.num %]
  11 [% END %]
  12 RULE
  13 
  14 my $extract = Template::Extract->new();
  15 my $data = $extract->extract($rule, $html);
  16 print Dumper(\$data);

运行一下：

$VAR1 = \{
    'links' => [
        {
            'link' => {
                'num' => '1',
                'url' => '2009/local_lib.html'
            }
        },
        {
            'link' => {
                'num' => '2',
                'url' => '2009/PerlDevENV.html'
            }
        },
        {
            'link' => {
                'num' => '3',
                'url' => '2009/EndScope.html'
            }
        },
        {
            'link' => {
                'num' => '4',
                'url' => '2009/autodie.html'
            }
        },
        {
            'link' => {
                'num' => '5',
                'url' => '2009/SSHBatch.html'
            }
        },
...

代码简单可靠。:) Enjoy

谢谢。

阅读(395) | 评论(0) | 转发(0) |

上一篇：LWP与WEB的基本使用

下一篇：利用perl发送天气预报

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6