Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1538403
  • 博文数量: 416
  • 博客积分: 10061
  • 博客等级: 上将
  • 技术积分: 3287
  • 用 户 组: 普通用户
  • 注册时间: 2006-12-05 11:12
个人简介

技术在于专研

文章分类

全部博文(416)

文章存档

2021年(3)

2015年(34)

2013年(2)

2012年(1)

2011年(2)

2010年(5)

2007年(344)

2006年(25)

分类: LINUX

2007-09-24 14:56:12

用tcpdump分析协议后用C语言自己编写一个BBS发贴机器人

                                       

大家可能经常上各种论坛发贴,但每次都要打开论坛、登录、输入贴子主题、贴子内容,然后点提交才可以完成。
如果你发贴比较少,可能不算什么,但如果你经常发,在很多网站发贴,可不容易哦,发贴可能花你好多时间。
鉴于这种苦恼,我自己想了一个简单方法,那就是分析一下网络协议,找到每次发贴内容变化的部分,再用C语言来写一个小程序,以后每次只要写好主题和贴子内容,运行那个小程序就可以完成发贴了。
当然,可以把程序的配置文件做齐全一点,就可以实现一次输入同时向N个论坛发贴了。呵,肯定有人想到了把这个程序设成定时运行的,那么就可以每隔一定时间往某个版发一次了。各位版主可要想好防止策略啊,我不能保证大家都正常使用我的代码。

1、tcpdump
首先,如果要实现机器自动发贴,你得人工分析一下要发贴的论坛,这里得用一个工具tcpdump。
tcpdump是个tcp流分析工具,通常我用来调试网络故障,因为从这上面比较容易看到网络通讯过程,可以大致分析到通讯两端谁出了问题。
基本用法是:
tcpdump -X -s0 host x.y.z.c port p
这里x.y.z.c是你要跟踪的主机的IP地址,p是端口号。
一个网站的IP地址比较容易获得,一种方法是通过DNS查询,另一种简单方法就是你打开浏览器,只打开那一个网站,同时用netstat -anp|grep ESTABLISHED命令就可以看到对方的IP了,通常端口是80的就是了。

但上面这种命令格式并不很方便,比如我对跟踪结果如下:

tcpdump -X -s0 host 220.181.28.42
Password:
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on eth0, link-type EN10MB (Ethernet), capture size 65535 bytes
21:13:14.585191 IP 172.16.100.218.37028 > 220.181.28.42.www: S 823660970:823660970(0) win 5840
        0x0000:  4500 003c caac 4000 4006 6645 ac10 64da  E..<.
        0x0010:  dcb5 1c2a 90a4 0050 3118 11aa 0000 0000  ...*...P1.......
        0x0020:  a002 16d0 7804 0000 0204 05b4 0402 080a  ....x...........
        0x0030:  00a9 db06 0000 0000 0103 0302            ............
21:13:15.042840 IP 220.181.28.42.www > 172.16.100.218.37028: S 2097205944:2097205944(0) ack 823660971 win 5792
        0x0000:  4500 003c 0000 4000 3406 3cf2 dcb5 1c2a  E..<.<....*
        0x0010:  ac10 64da 0050 90a4 7d00 d2b8 3118 11ab  ..d..P..}...1...
        0x0020:  a012 16a0 ecca 0000 0204 05b4 0402 080a  ................
        0x0030:  81b3 b9e6 00a9 db06 0103 0307            ............
21:13:15.042887 IP 172.16.100.218.37028 > 220.181.28.42.www: . ack 1 win 1460
        0x0000:  4500 0034 caad 4000 4006 664c ac10 64da  .
        0x0010:  dcb5 1c2a 90a4 0050 3118 11ab 7d00 d2b9  ...*...P1...}...
        0x0020:  8010 05b4 2c10 0000 0101 080a 00a9 db79  ....,..........y
        0x0030:  81b3 b9e6                                ....
21:13:15.043037 IP 172.16.100.218.37028 > 220.181.28.42.www: P 1:700(699) ack 1 win 1460
        0x0000:  4500 02ef caae 4000 4006 6390 ac10 64da  .
        0x0010:  dcb5 1c2a 90a4 0050 3118 11ab 7d00 d2b9  ...*...P1...}...
        0x0020:  8018 05b4 e97c 0000 0101 080a 00a9 db79  .....|.........y
        0x0030:  81b3 b9e6 4745 5420 2f20 4854 5450 2f31  ....GET./.HTTP/1
        0x0040:  2e31 0d0a 486f 7374 3a20 7777 772e 3136  .1..Host:.
        0x0050:  332e 636f 6d0d 0a55 7365 722d 4167 656e  3.com..User-Agen
        0x0060:  743a 204d 6f7a 696c 6c61 2f35 2e30 2028  t:.Mozilla/5.0.(
        0x0070:  5831 313b 2055 3b20 4c69 6e75 7820 6936  X11;.U;.Linux.i6
        0x0080:  3836 3b20 7a68 2d43 4e3b 2072 763a 312e  86;.zh-CN;.rv:1.
        0x0090:  382e 302e 3429 2047 6563 6b6f 2f32 3030  8.0.4).Gecko/200
        0x00a0:  3630 3631 3120 5562 756e 7475 2f75 6e73  60611.Ubuntu/uns
        0x00b0:  7461 626c 6520 4669 7265 666f 782f 312e  table.Firefox/1.
        0x00c0:  352e 302e 340d 0a41 6363 6570 743a 2074  5.0.4..Accept:.t
        0x00d0:  6578 742f 786d 6c2c 6170 706c 6963 6174  ext/xml,applicat
        0x00e0:  696f 6e2f 786d 6c2c 6170 706c 6963 6174  ion/xml,applicat
        0x00f0:  696f 6e2f 7868 746d 6c2b 786d 6c2c 7465  ion/xhtml+xml,te
        0x0100:  7874 2f68 746d 6c3b 713d 302e 392c 7465  xt/html;q=0.9,te
        0x0110:  7874 2f70 6c61 696e 3b71 3d30 2e38 2c69  xt/plain;q=0.8,i
        0x0120:  6d61 6765 2f70 6e67 2c2a 2f2a 3b71 3d30  mage/png,*/*;q=0
        0x0130:  2e35 0d0a 4163 6365 7074 2d4c 616e 6775  .5..Accept-Langu
        0x0140:  6167 653a 207a 682d 636e 2c7a 683b 713d  age:.zh-cn,zh;q=
        0x0150:  302e 350d 0a41 6363 6570 742d 456e 636f  0.5..Accept-Enco
        0x0160:  6469 6e67 3a20 677a 6970 2c64 6566 6c61  ding:.gzip,defla
        0x0170:  7465 0d0a 4163 6365 7074 2d43 6861 7273  te..Accept-Chars
        0x0180:  6574 3a20 6762 3233 3132 2c75 7466 2d38  et:.gb2312,utf-8
        0x0190:  3b71 3d30 2e37 2c2a 3b71 3d30 2e37 0d0a  ;q=0.7,*;q=0.7..
        0x01a0:  4b65 6570 2d41 6c69 7665 3a20 3330 300d  Keep-Alive:.300.
        0x01b0:  0a43 6f6e 6e65 6374 696f 6e3a 206b 6565  .Connection:.kee
        0x01c0:  702d 616c 6976 650d 0a43 6f6f 6b69 653a  p-alive..Cookie:
        0x01d0:  2050 726f 7669 6e63 653d 3032 303b 204d  .Province=020;.M
        0x01e0:  4149 4c31 3633 5f53 534e 3d67 646c 6374  AIL163_SSN=gdlct
        0x01f0:  6573 743b 205f 6e74 6573 5f6e 6e73 6974  est;._ntes_nnsit
        0x0200:  3d7c 7777 777c 6375 6c74 7572 657c 6865  =|www|culture|he
        0x0210:  616c 7468 7c73 746f 636b 7c75 7273 7c74  alth|stock|urs|t
        0x0220:  7261 7665 6c7c 3b20 5f6e 7465 735f 6e76  ravel|;._ntes_nv
        0x0230:  746d 3d31 323b 204e 4554 4541 5345 5f53  tm=12;.NETEASE_S
        0x0240:  534e 3d67 646c 6366 6f72 6d65 3b20 7468  SN=gdlcforme;.th
        0x0250:  6561 6464 723d b9e3 b6ab 3b20 7171 6d61  eaddr=....;.qqma
        0x0260:  696c 3d67 646c 6366 6f72 6d65 4031 3633 
        0x0270:  2e63 6f6d 3b20 4e45 5445 4153 455f 4144  .com;.NETEASE_AD
        0x0280:  563d 3131 2632 353b 2043 6974 793d 3032  V=11&25;.City=02
        0x0290:  300d 0a49 662d 4d6f 6469 6669 6564 2d53  0..If-Modified-S
        0x02a0:  696e 6365 3a20 4d6f 6e2c 2032 3420 4a75  ince:.Mon,.24.Ju
        0x02b0:  6c20 3230 3036 2031 333a 3132 3a30 3020  l.2006.13:12:00.
        0x02c0:  474d 540d 0a49 662d 4e6f 6e65 2d4d 6174  GMT..If-None-Mat
        0x02d0:  6368 3a20 2231 6162 3265 312d 3133 6264  ch:."1ab2e1-13bd
        0x02e0:  382d 3937 3638 3038 3030 220d 0a0d 0a    8-97680800"....
21:13:15.556849 IP 220.181.28.42.www > 172.16.100.218.37028: . ack 700 win 57
        0x0000:  4500 0034 6eb9 4000 3406 ce40 dcb5 1c2a  ..@...*
        0x0010:  ac10 64da 0050 90a4 7d00 d2b9 3118 1466  ..d..P..}...1..f
        0x0020:  8010 0039 2ca8 0000 0101 080a 81b3 bc0e  ...9,...........
        0x0030:  00a9 db79                                ...y
21:13:15.558577 IP 220.181.28.42.www > 172.16.100.218.37028: P 1:184(183) ack 700 win 57
        0x0000:  4500 00eb 6ebb 4000 3406 cd87 dcb5 1c2a  ......*
        0x0010:  ac10 64da 0050 90a4 7d00 d2b9 3118 1466  ..d..P..}...1..f
        0x0020:  8018 0039 38af 0000 0101 080a 81b3 bc0f  ...98...........
        0x0030:  00a9 db79 4854 5450 2f31 2e30 2033 3034  ...yHTTP/1.0.304
        0x0040:  204e 6f74 204d 6f64 6966 6965 640d 0a44  .Not.Modified..D
        0x0050:  6174 653a 204d 6f6e 2c20 3234 204a 756c  ate:.Mon,.24.Jul
        0x0060:  2032 3030 3620 3133 3a31 333a 3133 2047  .2006.13:13:13.G
        0x0070:  4d54 0d0a 5365 7276 6572 3a20 4170 6163  MT..Server:.Apac
        0x0080:  6865 2f32 2e30 2e35 3220 2855 6e69 7829  he/2.0.52.(Unix)
        0x0090:  0d0a 4554 6167 3a20 2231 6162 3265 312d  ..ETag:."1ab2e1-
        0x00a0:  3133 6264 382d 3937 3638 3038 3030 220d  13bd8-97680800".
        0x00b0:  0a58 2d43 6163 6865 3a20 4d49 5353 2066  .X-Cache:.MISS.f
        0x00c0:  726f 6d20 7777 772e 3136 332e 636f 6d0d  rom.3.com.
        0x00d0:  0a43 6f6e 6e65 6374 696f 6e3a 206b 6565  .Connection:.kee
        0x00e0:  702d 616c 6976 650d 0a0d 0a              p-alive....
21:13:15.558601 IP 172.16.100.218.37028 > 220.181.28.42.www: . ack 184 win 1728
        0x0000:  4500 0034 caaf 4000 4006 664a ac10 64da  .
        0x0010:  dcb5 1c2a 90a4 0050 3118 1466 7d00 d370  ...*...P1..f}..p
        0x0020:  8010 06c0 24e8 0000 0101 080a 00a9 dbfa  ....$...........
        0x0030:  81b3 bc0f                                ....
2、tcpdump专门针对http协议的分析
tcpdump有个专门用来分析http协议的参数A,使用起来就是这样的:

tcpdump -A -s0 host 220.181.28.42
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on eth0, link-type EN10MB (Ethernet), capture size 65535 bytes
21:16:25.130387 IP 172.16.100.218.48508 > 220.181.28.42.www: S 1030084898:1030084898(0) win 5840
E..<.........
............
21:16:25.705703 IP 220.181.28.42.www > 172.16.100.218.48508: S 915774756:915774756(0) ack 1030084899 win 5792
E..<.#...............
.<..........
21:16:25.705759 IP 172.16.100.218.48508 > 220.181.28.42.www: . ack 1 win 1460
...........
.....<..
21:16:25.705895 IP 172.16.100.218.48508 > 220.181.28.42.www: P 1:700(699) ack 1 win 1460
...........
.....<..GET / HTTP/1.1
Host:
User-Agent: Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.8.0.4) Gecko/20060611 Ubuntu/unstable Firefox/1.5.0.4
Accept: text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
Accept-Language: zh-cn,zh;q=0.5
Accept-Encoding: gzip,deflate
Accept-Charset: gb2312,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive
Cookie: Province=020; MAIL163_SSN=gdlctest; _ntes_nnsit=|www|culture|health|stock|urs|travel|; _ntes_nvtm=12; NETEASE_SSN=gdlcforme; theaddr=....; ; NETEASE_ADV=11&25; City=020
If-Modified-Since: Mon, 24 Jul 2006 13:12:00 GMT
If-None-Match: "1ab2e1-13bd8-97680800"


21:16:26.288904 IP 220.181.28.42.www > 172.16.100.218.48508: . ack 700 win 57
.......
.<......
21:16:26.299749 IP 220.181.28.42.www > 172.16.100.218.48508: P 1:1448(1447) ack 700 win 57
;.....
.<......HTTP/1.0 200 OK
Date: Mon, 24 Jul 2006 13:16:24 GMT
Server: Apache/2.0.52 (Unix)
Last-Modified: Mon, 24 Jul 2006 13:15:01 GMT
ETag: "1ab2e6-13bd8-a231df40"
Accept-Ranges: bytes
Vary: Accept-Encoding,User-Agent
Content-Encoding: gzip
Content-Length: 22079
Content-Type: text/html; charset=GB2312
X-Cache: MISS from
Connection: keep-alive

.............w...0.9.+.q..bK3......CB....p_..X.."........7.....$&.&o.ny.7y....B ...
%V3..P.^A...D\.....].+q...`).e..n_....#LYZ.8...........:...p..g.Y.t.7.K.H./...u.....:..[D.}.H.......F.
.....r...G.."..:.....]......~.c.nOS....mT.../b...b.?.b..M...8....y6.v;..O...ryX..E.Hq..(A..+`..N...,y.$.J       ...........<6.q.X.(S..G..
u$......q.1D......J..
.WqO..LH....>.W........?.W........}..pCQ........_.........._.q.<.T..D.>+Y..2..%.EJ.H.E).J.
........ ..S..htp`H...5.. Pi..J(Hd".+..[..b..[.B...X..3..... 3#.&\...eq$..*P.=.,u.../."...b.u
w..)....S..
...zi..z.0.o.......~....l....".<.f21:16:26.299775 IP 172.16.100.218.48508 > 220.181.28.42.www: . ack 1448 win 2184
..............
...<.<..

这样就很清楚地看到你的主机和对方通信的过程如下:
首先,你的主机和对方TCP三次握手建立连接,
然后,你的主机向对方发了一个http请求:

GET / HTTP/1.1
Host:
User-Agent: Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.8.0.4) Gecko/20060611 Ubuntu/unstable Firefox/1.5.0.4
Accept: text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
Accept-Language: zh-cn,zh;q=0.5
Accept-Encoding: gzip,deflate
Accept-Charset: gb2312,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive
Cookie: Province=020; MAIL163_SSN=gdlctest; _ntes_nnsit=|www|culture|health|stock|urs|travel|; _ntes_nvtm=12; NETEASE_SSN=gdlcforme; theaddr=....; ; NETEASE_ADV=11&25; City=020
If-Modified-Since: Mon, 24 Jul 2006 13:12:00 GMT
If-None-Match: "1ab2e1-13bd8-97680800"
最后,对方回复了一个http请求:
HTTP/1.0 200 OK
Date: Mon, 24 Jul 2006 13:16:24 GMT
Server: Apache/2.0.52 (Unix)
Last-Modified: Mon, 24 Jul 2006 13:15:01 GMT
ETag: "1ab2e6-13bd8-a231df40"
Accept-Ranges: bytes
Vary: Accept-Encoding,User-Agent
Content-Encoding: gzip
Content-Length: 22079
Content-Type: text/html; charset=GB2312
X-Cache: MISS from
Connection: keep-alive

后面就是22079字节的网页内容,这里省去没有显示啦。

3、自己用C语言来写一个这样的程序吧
现在假设我要去这个论坛去发贴,发贴步骤是这样的:
Step.1、打开论坛首页
Step.2、输入用户名和密码登录
Step.3、点击某个版
Step.4、点击发表新贴
Step.5、输入自己的内容,点击提交
C语言源代码如下:

/* ****** 用tcpdump分析协议后用C语言自己编写一个BBS发贴机器人 bbsrobot.c 开始 *********** */
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include

/* some global variable */
#ifdefine OS_LINUX
  #define USER_AGENT "Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.8.0.4) Gecko/20060611 Ubuntu/unstable Firefox/1.5.0.4"
#else
  #define USER_AGENT "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"
#endif

#define SERVER_HOST ""
#define CLIENT_ACCEPT "text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5"
#define CLIENT_LANGUAGE "zh-cn,zh;q=0.5"
#define CLIENT_CHARSET "gb2312,utf-8;q=0.7,*;q=0.7"
#define BORDID 52

struct sockaddr_in server_addr;
int portnumber = 0, sockfd = 0, dsend = 0, totalsend = 0, nbytes = 0, reqn = 0, i = 0, j = 0, ret = 0;
struct hostent *host;
char request[1024] = "", buffer[1024] = "", httpheader[1024] = "";

/* some functions */
void ConnectWeb(void) { /* 连接网站 */
  /* create a socket descriptor */
  if((sockfd=socket(AF_INET,SOCK_STREAM,0))==-1)
  {
    fprintf(stderr,"Socket Error:%s\a\n",strerror(errno));
    exit(1);
  }

  /* bind address */
  bzero(&server_addr,sizeof(server_addr));
  server_addr.sin_family=AF_INET;
  server_addr.sin_port=htons(portnumber);
  server_addr.sin_addr=*((struct in_addr *)host->h_addr);

  /* connect to the server */
  if(connect(sockfd,(struct sockaddr *)(&server_addr),sizeof(struct sockaddr))==-1)
  {
    fprintf(stderr,"Connect Error:%s\a\n",strerror(errno));
    exit(1);
  }
}

/************关于本文档********************************************
*filename:用tcpdump分析协议后用C语言自己编写一个BBS发贴机器人
*purpose:自己编写的一个http协议网络客户端程序,可以用来定时往网站发贴
*wrote by: zhoulifa() 周立发()
Linux爱好者 Linux知识传播者 SOHO族 开发者 最擅长C语言编程
*date time:2006-07-24 21:00:00
*Note: 任何人可以任意复制代码并运用这些文档,当然包括你的商业用途
* 但请遵循GPL。
*Hope:希望越来越多的人贡献自己的力量,为科学技术发展出力
*********************************************************************/



语言入门经典教程--C语言使用者必须收藏的精华教程.doc
阅读(2637) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~