Chinaunix首页 | 论坛 | 博客
  • 博客访问: 12894
  • 博文数量: 5
  • 博客积分: 1400
  • 博客等级: 上尉
  • 技术积分: 55
  • 用 户 组: 普通用户
  • 注册时间: 2009-12-09 18:58
文章分类
文章存档

2009年(5)

我的朋友
最近访客

分类:

2009-12-24 12:55:08

[2009-12-24 11:38:55:868:599] [mainprocess.cpp:10985:PackResultData2Local] $ 落地的DocList : 9218598863850818364 12642.849609 12642.849609  5546050955041359477 511.675568 511.675568  11803770523653401990 519423.656250 519423.656250  5274597000632028453 2068.414551 2068.414551  7114789561259462102 5050.057129 5050.057129  7248898334381793473 1032.552612 1032.552612  15008222441090642213 15225.987305 15225.987305  16134233511594619014 11800.368164 11800.368164  3715907582871717314 1518.908447 1518.908447  16570866903827890578 2810.354736 2810.354736  15951043706988166634 6744.435059 6744.435059  5909752158009205374 6708.128418 6708.128418  14637783891549681408 1737.599731 1737.599731  15552800875528533002 815.343994 815.343994  6978550036350635506 5777.873535 5777.873535  14889261453221930743 5593.194824 5593.194824  16408028696811674899 2324.647705 2324.647705  2317125993314531406 5004.994141 5004.994141  1779793217269303514 4541.425293 4541.425293  9763045105757868506 4373.065430 4373.065430  381477380495744
[2009-12-24 11:38:55:868:716] [mainprocess.cpp:10985:PackResultData2Local] $ 落地的DocList : 14570793113323374841 3890.028320 3890.028320  12891775145662364206 3798.601807 3798.601807  11540396362078977654 3741.765381 3741.765381  5916967144471194986 3097.072754 3097.072754  4895512855189448281 2982.062500 2982.062500  7360920398020228824 2934.438721 2934.438721  7306360232992504100 2816.813232 2816.813232  4758044369287353660 2787.860840 2787.860840  1652643668971330371 2625.844238 2625.844238  1425232757917700583 2622.801270 2622.801270  14730536190607863794 2534.431885 2534.431885  17143502756012960712 2510.922852 2510.922852  8300600343979960684 2476.282959 2476.282959  338952768481480844 2466.789307 2466.789307  12192170421409765024 457.570251 457.570251  9215955567978884558 2415.853516 2415.853516  486794792544298783 2323.522217 2323.522217  5549113367957697728 2228.060547 2228.060547  9451672993889673558 2183.018555 2183.018555  13045731443856996260 2183.006592 2183.006592  3321360956855899819 2132.36
[2009-12-24 11:38:55:868:832] [mainprocess.cpp:10985:PackResultData2Local] $ 落地的DocList : 4694351797830170973 2066.342285 2066.342285  6762765146546748683 2044.650146 2044.650146  2351436630902914167 2020.660767 2020.660767  8101261816532513481 1985.055908 1985.055908  17105534965944498521 1932.409790 1932.409790  3391168278622502677 2181.715820 2181.715820  6175765914053288335 1878.688599 1878.688599  2088913455405668744 1875.684082 1875.684082  17697881968347317582 1872.609253 1872.609253  14742272965276101965 1826.436401 1826.436401  5428604473941920455 1818.857422 1818.857422  7822879513032909340 1799.208984 1799.208984  904387084680841715 1755.600220 1755.600220  15416396893409042129 1751.256714 1751.256714  763637370552730247 1730.686035 1730.686035  15693261611376005682 1700.795166 1700.795166  17487365417518604177 1699.094238 1699.094238  1299520310825294732 1698.935913 1698.935913  7820832921606309242 1694.946045 1694.946045  9484590058230593534 1690.061523 1690.061523  8876601865160412073 1663.8
[2009-12-24 11:38:55:868:948] [mainprocess.cpp:10985:PackResultData2Local] $ 落地的DocList : 14096062238589349135 1620.578369 1620.578369  2021015765963027474 1600.080444 1600.080444  458386189928657606 1590.737305 1590.737305  8135294478469405203 1588.786987 1588.786987  5258579119031589080 1575.458130 1575.458130  5037226208861298936 1571.851318 1571.851318  12534082829438235315 1561.341309 1561.341309  3846618992087728009 1557.581055 1557.581055  18385799494021035164 1556.256958 1556.256958  3206535427331016480 1529.907227 1529.907227  6261385702083539926 1505.808105 1505.808105  15924391653694545271 1505.110718 1505.110718  2721989031947601087 1498.245361 1498.245361  15494656974441520440 1493.361206 1493.361206  10968370524922769481 1455.584351 1455.584351  13361372426302697838 1453.732422 1453.732422  2468801306433268085 1449.929321 1449.929321  8497019939984414948 1439.458008 1439.458008  1090634700658560509 1435.526001 1435.526001  1044322793849962720 1416.616333 1416.616333  4501713076555444672 1415
[2009-12-24 11:38:55:869:000] [mainprocess.cpp:10998:PackResultData2Local] $ 落地的DocList : 14238579246765197460 1389.447754 1389.447754  3685271439297321388 1363.127441 1363.127441  3976533716792191577 1360.503052 1360.503052  12559522598089883117 1353.678101 1353.678101  6874190653436003669 1348.873047 1348.873047  11857010908093997579 1336.914307 1336.914307  4349513690930413855 1332.404297 1332.404297  11360624285740642864 1319.743042 1319.743042  12503540782597296781 1296.999023 1296.999023  6121192571996214450 1295.103516 1295.103516  2412791615308093846 1284.907593 1284.907593  
 
需要抽取出上面的docid和权重,可以用到shell的贪婪匹配,表达式如下:
grep "落地的DocList" 下载的logtracetxt文件名 | sed 's/<\/div>
//g' | sed 's/\[[^$]*//g' | sed 's/$[^:]*//g' | sed 's/://g'
阅读(842) | 评论(2) | 转发(0) |
0

上一篇:perl中函数参数的传递接收

下一篇:没有了

给主人留下些什么吧!~~

lassiewang2009-12-24 14:10:01

在sed中 ()表示普通字符() \(\)表示引用 []表示字符集合 \[\]表示变通字符[]

lassiewang2009-12-24 14:09:21

对于 sed 中的贪婪性问题,暂时没有一个通用的解决办法。但有一些可以借鉴的经验: 1、如果你的 .*、.+ 的右边界可以用一个字符来界定,比如“>”,那就把 .*、.+ 改成形如 [^>]* 或 [^>]+ 的形式 2、如果右边界不能用单个字符界定,那只能使用 sed 的多个命令组合来实现了,比较麻烦,还不如用其它程序处理来得方便。