GDB几个知识实例
来源:chinaunix 作者:wxmtwfx 发布日期:20080716 14:14:00
所属类别:Linux
作者:wxmtwfx
发布日期:20080716 14:14:00
//++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ 例如,下面的命令将在debugme程序的第38行设置一个条件断点。当程序运行到该行时,如果count的值等于3,就将暂时停止执行:break 38 if count==3 想知道变量的类型,可以使用“whatis”命令,示例如下(gdb) whatis strtype = char *//++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ 首先, gdb到代码的出错处;然后, bt(backtrace)看函数堆栈, 确定问题出在那条语句。 p(print) 打印变量的值,找原因 up 进入上一层堆栈,追溯问题出在哪里。awatch:awatch用来为一个表达式设置观察点,在表达式的值发生改变时,或者当表达式的值被读取的时候,程序停止执行。 break:用于在程序中设置断点 break + 要设置断点的行号clear:用于清除断点 clear + 要清除断点的行号commands:用于为遇到断点之后执行特定的指令而设置的 command + 断点号如果commands 之后没有断点号, gdb会将最后一个设置的断点编号作为默认值。condition:在满足一定的条件时才在指定的行上设置断点 condition 断点编号条件表达式delete: 用于清除断点和自动显示的表达式的命令。与clear的不同之处:clear要给出断点的行号, delete要给出断点的编号。用clear命令清除断点时gdb会给出提示,而用delete清除断点时gdb不会给出任何提示disable:让所设断点暂时失效。如果要让多个编号处的断点失效可将编号之间用空格隔开enable:与disable 相对ignore:这条命令在一定范围内忽略用户设定的断点 ignore N CONTtbreak:用于设置临时断点,所谓临时断点就是断点只在设置之后起作用一次。watch:与awatch类似关于数据的命令:display:该命令用于显示表达式的值,使用了该命令后,每当程序运行到断点处都会显示表达式的值。 display 表达式如:display 5*jinfo display:用于显示当前所有要显示值的表达式的有关情况delete display:用于删除一个要显示值的表达式,调用这个命令删除一个表达式后,被删除的表达式将不被显示。 delete display 1disable display:使一个要显示的表达式暂时无效。可有enable重新使之有效enable display:反操作disable diplayundisplay:用于结束某个表达式值的显示。同delete display功能相似whatis:显示某个表达式的数据类型如:whatis jprint:用于打印表达式的值。可以打印内存中从某个变量开始的一段区域的内容。$表示给定序号的前一个序号, $$表示给定序号的向前第2个序号。例如给定序号是 5,那么$代表4,$$代表3.如果是print $表示 print 1 print还可用于对变量赋值如print j=8; print打印内存中从某个部分开始的一块连续空间的内容。如print 开始表达式@要打印的连续空间的大小ptype:用于给出类型的定义。疑问ptype与whatis的区别?set:set variable 用于为变量赋值 类似print set variable j=9 print j=9关于文件的命令add-shared-symbol-files:该命令用于从动态的连接映射的共享目标文件中装入符号表。add-symbol- file:该命令用于从已经动态装入的文件中装入负号表。使用格式是:add-symbol-file FILE ADDR 其中FILE给出的是动态装入的文件的名称,ADDR是文件中正文的起始地址。cd:改变当前工作目录。core-file:使某个文件成为core dumpdirectory:用来向源文件搜索目录中添加一个目录file:用来装入待调试程序的命令。list:list的非空系数的几种形式: LINENUM:当前文件的LINENUM行 FILE:LINENUM: 指定文件的LINENUM行 FUNCTION:当前文件的FUNCTION函数 FILE:FUNCTION *ADDRESS列出包含该地址的文件 list 起始行号截止行号forward:用来从列表当前行开始向后查找第一个匹配某个字符串的程序行 forward 匹配的字符串load:该命令用于动态的向正在调试的程序中装入文件,并记录它的符号表,准备联接path:该命令用于向目标文件的搜索路径中增加目录的,可以使用当前目录的$cwdpwd:显示当前工作路径reverse-search:从列表当前行开始向前查找第一个匹配的字符串,查找到的行号保存在$_中search:同forward关于程序运行的命令:cont:使程序继续执行handle:对信号设置处理函数。如:handle 信号信号处理 信号可以是符号,也可以是数字。如果用all来作参数,则意味着调试器接受除了(信号SIGTRAP和信号SIGINT)之外的所有信号处理函数:stop:如果信号发生重新进入调试器,并打印出提示信息;print:如果信号发生就打印一条提示信息pass:让程序能看到这个信号发生jump:指定程序开始调试的指令和地址 jump 行号或是指令地址kill:结束当前程序的调试。next:继续程序的运行,越过子程序调用nexti:用于单步执行一条语句中的一条指令,它会跟踪到子程序的内部,next用于单步执行一条语句,而nexti用于单步执行一条指令,一条语句可能有几条指令构成。step:用于执行一条语句的,也不越过子过程的调用stepi:用于执行一条指令的,它不越过子程序的调用,而是跟踪到子过程的内部backtrace:用来打印栈侦指针的。backtrace 要打印的栈侦指针的个数frame:该命令用于打印栈侦的。frame 要打印的编号select-frame:指定要选择的栈侦的编号。一般与info frame连用。info reg:查看寄存器使用情况。info stack:查看栈。where:查看当前位置。up:跳到上一层函数。down:与up相对。attach <进程号>:把当前高度的程序粘在某个进程上,用于调试运行中的进程。ptype <变量or数据类型>:查看变量或数据类型的定义。 //++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ 我们调试的程序往往有参数,那个著名传呢?一开始我也以为是在gdb 程序名 参数,结果不对,网上一查,原来这样的gdb 程序名 run 参数1 参数2 。。。。。。。。 //++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ /****************************************************/用GDB调试程序GDB概述 2使用GDB 5GDB中运行UNIX的shell程序 8在GDB中运行程序 8调试已运行的程序 两种方法: 9暂停 / 恢复程序运行 9一、设置断点(BreakPoint) 9二、设置观察点(WatchPoint) 10三、设置捕捉点(CatchPoint) 10四、维护停止点 11五、停止条件维护 12六、为停止点设定运行命令 12七、断点菜单 13八、恢复程序运行和单步调试 13九、信号(Signals) 14十、线程(Thread Stops) 15查看栈信息 16查看源程序 18一、显示源代码 18二、搜索源代码 19三、指定源文件的路径 19四、源代码的内存 20查看运行时数据 21一、表达式 21二、程序变量 21三、数组 22四、输出格式 23五、查看内存 23六、自动显示 24七、设置显示选项 25GDB中关于显示的选项比较多,这里我只例举大多数常用的选项。 25八、历史记录 27九、GDB环境变量 28十、查看寄存器 28改变程序的执行 29一、修改变量值 29二、跳转执行 29三、产生信号量 30四、强制函数返回 30五、强制调用函数 30在不同语言中使用GDB 31后记 32GDB概述GDB 是GNU开源组织发布的一个强大的UNIX下的程序调试工具。或许,各位比较喜欢那种图形界面方式的,像VC、BCB等IDE的调试,但如果你是在 UNIX平台下做软件,你会发现GDB这个调试工具有比VC、BCB的图形化调试器更强大的功能。所谓“寸有所长,尺有所短”就是这个道理。一般来说,GDB主要帮忙你完成下面四个方面的功能:1、启动你的程序,可以按照你的自定义的要求随心所欲的运行程序。2、可让被调试的程序在你所指定的调置的断点处停住。(断点可以是条件表达式)3、当程序被停住时,可以检查此时你的程序中所发生的事。4、动态的改变你程序的执行环境。从上面看来,GDB和一般的调试工具没有什么两样,基本上也是完成这些功能,不过在细节上,你会发现GDB这个调试工具的强大,大家可能比较习惯了图形化的调试工具,但有时候,命令行的调试工具却有着图形化工具所不能完成的功能。让我们一一看来。一个调试示例——————源程序:tst.c1 #include 23 int func(int n)4 {5 int sum=0,i;6 for(i=0; i cc -g tst.c -o tst使用GDB调试:hchen/test> gdb tst <---------- 启动GDBGNU gdb 5.1.1Copyright 2002 Free Software Foundation, Inc.GDB is free software, covered by the GNU General Public License, and you arewelcome to change it and/or distribute copies of it under certain conditions.Type "show copying" to see the conditions.There is absolutely no warranty for GDB. Type "show warranty" for details.This GDB was configured as "i386-suse-linux"...(gdb) l <-------------------- l命令相当于list,从第一行开始例出原码。1 #include 23 int func(int n)4 {5 int sum=0,i;6 for(i=0; i好了,有了以上的感性认识,还是让我们来系统地认识一下gdb吧。使用GDB一般来说GDB主要调试的是C/C++的程序。要调试C/C++的程序,首先在编译时,我们必须要把调试信息加到可执行文件中。使用编译器(cc/gcc/g++)的 -g 参数可以做到这一点。如:> cc -g hello.c -o hello> g++ -g hello.cpp -o hello如果没有-g,你将看不见程序的函数名、变量名,所代替的全是运行时的内存地址。当你用-g把调试信息加入之后,并成功编译目标代码以后,让我们来看看如何用gdb来调试他。启动GDB的方法有以下几种:1、gdb program也就是你的执行文件,一般在当然目录下。2、gdb core用gdb同时调试一个运行程序和core文件,core是程序非法执行后core dump后产生的文件。3、gdb 如果你的程序是一个服务程序,那么你可以指定这个服务程序运行时的进程ID。gdb会自动attach上去,并调试他。program应该在PATH环境变量中搜索得到。GDB启动时,可以加上一些GDB的启动开关,详细的开关可以用gdb -help查看。我在下面只例举一些比较常用的参数:-symbols -s 从指定文件中读取符号表。-se file从指定文件中读取符号表信息,并把他用在可执行文件中。-core -c 调试时core dump的core文件。-directory -d 加入一个源文件的搜索路径。默认搜索路径是环境变量中PATH所定义的路径。启动gdb后,就你被带入gdb的调试环境中,就可以使用gdb的命令开始调试程序了,gdb的命令可以使用help命令来查看,如下所示:/home/hchen> gdbGNU gdb 5.1.1Copyright 2002 Free Software Foundation, Inc.GDB is free software, covered by the GNU General Public License, and you arewelcome to change it and/or distribute copies of it under certain conditions.Type "show copying" to see the conditions.There is absolutely no warranty for GDB. Type "show warranty" for details.This GDB was configured as "i386-suse-linux".(gdb) helpList of classes of commands:aliases -- Aliases of other commandsbreakpoints -- Making program stop at certain pointsdata -- Examining datafiles -- Specifying and examining filesinternals -- Maintenance commandsobscure -- Obscure featuresrunning -- Running the programstack -- Examining the stackstatus -- Status inquiriessupport -- Support facilitiestracepoints -- Tracing of program execution without stopping the programuser-defined -- User-defined commandsType "help" followed by a class name for a list of commands in that class.Type "help" followed by command name for full documentation.Command name abbreviations are allowed if unambiguous.(gdb)gdb 的命令很多,gdb把之分成许多个种类。help命令只是例出gdb的命令种类,如果要看种类中的命令,可以使用help < class> 命令,如:help breakpoints,查看设置断点的所有命令。也可以直接help 来查看命令的帮助。gdb中,输入命令时,可以不用打全命令,只用打命令的前几个字符就可以了,当然,命令的前几个字符应该要标志着一个唯一的命令,在 Linux下,你可以敲击两次TAB键来补齐命令的全称,如果有重复的,那么gdb会把其例出来。示例一:在进入函数func时,设置一个断点。可以敲入 break func,或是直接就是b func(gdb) b funcBreakpoint 1 at 0x8048458: file hello.c, line 10.示例二:敲入b按两次TAB键,你会看到所有b打头的命令:(gdb) bbacktrace break bt(gdb)示例三:只记得函数的前缀,可以这样:(gdb) b make_ <按TAB键>(再按下一次TAB键,你会看到:)make_a_section_from_file make_environmake_abs_section make_function_typemake_blockvector make_pointer_typemake_cleanup make_reference_typemake_command make_symbol_completion_list(gdb) b make_GDB把所有make开头的函数全部例出来给你查看。示例四:调试C++的程序时,有可以函数名一样。如:(gdb) b 'bubble( M-?bubble(double,double) bubble(int,int)(gdb) b 'bubble(你可以查看到C++中的所有的重载函数及参数。(注:M-?和“按两次TAB键”是一个意思)要退出gdb时,只用发quit或命令简称 q就行了。GDB中运行UNIX的shell程序在gdb环境中,你可以执行UNIX的shell的命令,使用gdb的shell命令来完成:shell 调 用UNIX的shell来执行,环境变量SHELL中定义的UNIX的shell将会被用来执行< command string>,如果SHELL没有定义,那就使用UNIX的标准shell:/bin/sh。(在 Windows中使用 Command.com或cmd.exe)还有一个gdb命令是make:make 可以在gdb中执行make命令来重新build自己的程序。这个命令等价于“shell make ”。在GDB中运行程序当以gdb 方式启动gdb后,gdb会在PATH路径和当前目录中搜索的源文件。如要确认gdb是否读到源文件,可使用l或list命令,看看gdb是否能列出源代码。在gdb中,运行程序使用r或是run命令。程序的运行,你有可能需要设置下面四方面的事。1、程序运行参数。set args 可指定运行时参数。(如:set args 10 20 30 40 50)show args 命令可以查看设置好的运行参数。2、运行环境。path 可设定程序的运行路径。show paths 查看程序的运行路径。set environment varname [=value] 设置环境变量。如:set env USER=hchenshow environment [varname] 查看环境变量。3、工作目录。cd 相当于shell的cd命令。pwd 显示当前的所在目录。4、程序的输入输出。info terminal 显示你程序用到的终端的模式。使用重定向控制程序输出。如:run > outfiletty命令可以指写输入输出的终端设备。如:tty /dev/ttyb调试已运行的程序两种方法:1、在UNIX下用ps查看正在运行的程序的PID(进程ID),然后用gdb PID格式挂接正在运行的程序。2、先用gdb 关联上源代码,并进行gdb,在gdb中用attach命令来挂接进程的PID。并用detach来取消挂接的进程。暂停 / 恢复程序运行调试程序中,暂停程序运行是必须的,GDB可以方便地暂停程序的运行。你可以设置程序的在哪行停住,在什么条件下停住,在收到什么信号时停往等等。以便于你查看运行时的变量,以及运行时的流程。当进程被gdb停住时,你可以使用info program 来查看程序的是否在运行,进程号,被暂停的原因。在gdb 中,我们可以有以下几种暂停方式:断点(BreakPoint)、观察点(WatchPoint)、捕捉点(CatchPoint)、信号(Signals)、线程停止(Thread Stops)。如果要恢复程序运行,可以使用c或是continue命令。一、设置断点(BreakPoint)我们用break命令来设置断点。正面有几点设置断点的方法:break 在进入指定函数时停住。C++中可以使用class::function或function(type,type)格式来指定函数名。break 在指定行号停住。break +offsetbreak -offset在当前行号的前面或后面的offset行停住。offiset为自然数。break filename:linenum在源文件filename的linenum行处停住。break filename:function在源文件filename的function函数的入口处停住。break *address在程序运行的内存地址处停住。breakbreak命令没有参数时,表示在下一条指令处停住。break ... if ...可以是上述的参数,condition表示条件,在条件成立时停住。比如在循环境体中,可以设置break if i=100,表示当i为100时停住程序。查看断点时,可使用info命令,如下所示:(注:n表示断点号)info breakpoints [n]info break [n]二、设置观察点(WatchPoint)观察点一般来观察某个表达式(变量也是一种表达式)的值是否有变化了,如果有变化,马上停住程序。我们有下面的几种方法来设置观察点:watch 为表达式(变量)expr设置一个观察点。一量表达式值有变化时,马上停住程序。rwatch 当表达式(变量)expr被读时,停住程序。awatch 当表达式(变量)的值被读或被写时,停住程序。info watchpoints列出当前所设置了的所有观察点。三、设置捕捉点(CatchPoint)你可设置捕捉点来补捉程序运行时的一些事件。如:载入共享库(动态链接库)或是C++的异常。设置捕捉点的格式为:catch 当event发生时,停住程序。event可以是下面的内容:1、throw 一个C++抛出的异常。(throw为关键字)2、catch 一个C++捕捉到的异常。(catch为关键字)3、exec 调用系统调用exec时。(exec为关键字,目前此功能只在HP-UX下有用)4、fork 调用系统调用fork时。(fork为关键字,目前此功能只在HP-UX下有用)5、vfork 调用系统调用vfork时。(vfork为关键字,目前此功能只在HP-UX下有用)6、load 或 load 载入共享库(动态链接库)时。(load为关键字,目前此功能只在HP-UX下有用)7、unload 或 unload 卸载共享库(动态链接库)时。(unload为关键字,目前此功能只在HP-UX下有用)tcatch 只设置一次捕捉点,当程序停住以后,应点被自动删除。四、维护停止点上面说了如何设置程序的停止点,GDB中的停止点也就是上述的三类。在GDB中,如果你觉得已定义好的停止点没有用了,你可以使用delete、clear、disable、enable这几个命令来进行维护。clear清除所有的已定义的停止点。clear clear 清除所有设置在函数上的停止点。clear clear 清除所有设置在指定行上的停止点。delete [breakpoints] [range...]删除指定的断点,breakpoints为断点号。如果不指定断点号,则表示删除所有的断点。range 表示断点号的范围(如:3-7)。其简写命令为d。比删除更好的一种方法是disable停止点,disable了的停止点,GDB不会删除,当你还需要时,enable即可,就好像回收站一样。disable [breakpoints] [range...]disable所指定的停止点,breakpoints为停止点号。如果什么都不指定,表示disable所有的停止点。简写命令是 dis.enable [breakpoints] [range...]enable所指定的停止点,breakpoints为停止点号。enable [breakpoints] once range...enable所指定的停止点一次,当程序停止后,该停止点马上被GDB自动disable。enable [breakpoints] delete range...enable所指定的停止点一次,当程序停止后,该停止点马上被GDB自动删除。五、停止条件维护前面在说到设置断点时,我们提到过可以设置一个条件,当条件成立时,程序自动停止,这是一个非常强大的功能,这里,我想专门说说这个条件的相关维护命令。一般来说,为断点设置一个条件,我们使用if关键词,后面跟其断点条件。并且,条件设置好后,我们可以用condition命令来修改断点的条件。(只有 break和watch命令支持if,catch目前暂不支持if)condition 修改断点号为bnum的停止条件为expression。condition 清除断点号为bnum的停止条件。还有一个比较特殊的维护命令ignore,你可以指定程序运行时,忽略停止条件几次。ignore 表示忽略断点号为bnum的停止条件count次。六、为停止点设定运行命令我们可以使用GDB提供的command命令来设置停止点的运行命令。也就是说,当运行的程序在被停止住时,我们可以让其自动运行一些别的命令,这很有利行自动化调试。对基于GDB的自动化调试是一个强大的支持。commands [bnum]... command-list ...end为断点号bnum指写一个命令列表。当程序被该断点停住时,gdb会依次运行命令列表中的命令。例如:break foo if x>0commandsprintf "x is %d\n",xcontinueend断点设置在函数foo中,断点条件是x>0,如果程序被断住后,也就是,一旦x的值在foo函数中大于 0,GDB会自动打印出x的值,并继续运行程序。如果你要清除断点上的命令序列,那么只要简单的执行一下commands命令,并直接在打个end就行了。七、断点菜单在 C ++中,可能会重复出现同一个名字的函数若干次(函数重载),在这种情况下,break 不能告诉GDB要停在哪个函数的入口。当然,你可以使用break 也就是把函数的参数类型告诉GDB,以指定一个函数。否则的话, GDB会给你列出一个断点菜单供你选择你所需要的断点。你只要输入你菜单列表中的编号就可以了。如:(gdb) b String::after[0] cancel[1] all[2] file:String.cc; line number:867[3] file:String.cc; line number:860[4] file:String.cc; line number:875[5] file:String.cc; line number:853[6] file:String.cc; line number:846[7] file:String.cc; line number:735> 2 4 6Breakpoint 1 at 0xb26c: file String.cc, line 867.Breakpoint 2 at 0xb344: file String.cc, line 875.Breakpoint 3 at 0xafcc: file String.cc, line 846.Multiple breakpoints were set.Use the "delete" command to delete unwantedbreakpoints.(gdb)可见,GDB列出了所有after的重载函数,你可以选一下列表编号就行了。0表示放弃设置断点,1 表示所有函数都设置断点。八、恢复程序运行和单步调试当程序被停住了,你可以用continue命令恢复程序的运行直到程序结束,或下一个断点到来。也可以使用step或next命令单步跟踪程序。continue [ignore-count]c [ignore-count]fg [ignore-count]恢复程序运行,直到程序结束,或是下一个断点到来。ignore-count表示忽略其后的断点次数。 continue,c,fg三个命令都是一样的意思。step 单步跟踪,如果有函数调用,他会进入该函数。进入函数的前提是,此函数被编译有debug信息。很像VC等工具中的step in。后面可以加count也可以不加,不加表示一条条地执行,加表示执行后面的count条指令,然后再停住。next 同样单步跟踪,如果有函数调用,他不会进入该函数。很像VC等工具中的step over。后面可以加count也可以不加,不加表示一条条地执行,加表示执行后面的count条指令,然后再停住。set step-modeset step-mode on打开step-mode模式,于是,在进行单步跟踪时,程序不会因为没有debug信息而不停住。这个参数有很利于查看机器码。set step-mod off关闭step-mode模式。finish运行程序,直到当前函数完成返回。并打印函数返回时的堆栈地址和返回值及参数值等信息。until 或 u当你厌倦了在一个循环体内单步跟踪时,这个命令可以运行程序直到退出循环体。stepi 或 sinexti 或 ni单步跟踪一条机器指令!一条程序代码有可能由数条机器指令完成,stepi和nexti可以单步执行机器指令。与之一样有相同功能的命令是 “display/i $pc” ,当运行完这个命令后,单步跟踪会在打出程序代码的同时打出机器指令(也就是汇编代码)九、信号(Signals)信号是一种软中断,是一种处理异步事件的方法。一般来说,操作系统都支持许多信号。尤其是UNIX,比较重要应用程序一般都会处理信号。UNIX 定义了许多信号,比如SIGINT表示中断字符信号,也就是Ctrl+C的信号,SIGBUS表示硬件故障的信号;SIGCHLD表示子进程状态改变信号; SIGKILL表示终止程序运行的信号,等等。信号量编程是UNIX下非常重要的一种技术。GDB有能力在你调试程序的时候处理任何一种信号,你可以告诉 GDB需要处理哪一种信号。你可以要求GDB收到你所指定的信号时,马上停住正在运行的程序,以供你进行调试。你可以用GDB的handle命令来完成这一功能。handle 在GDB 中定义一个信号处理。信号可以以SIG开头或不以SIG开头,可以用定义一个要处理信号的范围(如:SIGIO- SIGKILL,表示处理从SIGIO信号到SIGKILL的信号,其中包括SIGIO,SIGIOT,SIGKILL三个信号),也可以使用关键字 all来标明要处理所有的信号。一旦被调试的程序接收到信号,运行程序马上会被GDB停住,以供调试。其< keywords>可以是以下几种关键字的一个或多个。nostop当被调试的程序收到信号时,GDB不会停住程序的运行,但会打出消息告诉你收到这种信号。stop当被调试的程序收到信号时,GDB会停住你的程序。print当被调试的程序收到信号时,GDB会显示出一条信息。noprint当被调试的程序收到信号时,GDB不会告诉你收到信号的信息。passnoignore当被调试的程序收到信号时,GDB不处理信号。这表示,GDB会把这个信号交给被调试程序会处理。nopassignore当被调试的程序收到信号时,GDB不会让被调试程序来处理这个信号。info signalsinfo handle查看有哪些信号在被GDB检测中。十、线程(Thread Stops)如果你程序是多线程的话,你可以定义你的断点是否在所有的线程上,或是在某个特定的线程。GDB很容易帮你完成这一工作。break thread break thread if ...linespec 指定了断点设置在的源程序的行号。threadno指定了线程的ID,注意,这个ID是GDB分配的,你可以通过“info threads”命令来查看正在运行程序中的线程信息。如果你不指定thread 则表示你的断点设在所有线程上面。你还可以为某线程指定断点条件。如:(gdb) break frik.c:13 thread 28 if bartab > lim当你的程序被GDB停住时,所有的运行线程都会被停住。这方便你你查看运行程序的总体情况。而在你恢复程序运行时,所有的线程也会被恢复运行。那怕是主进程在被单步调试时。查看栈信息当程序被停住了,你需要做的第一件事就是查看程序是在哪里停住的。当你的程序调用了一个函数,函数的地址,函数参数,函数内的局部变量都会被压入“栈”(Stack)中。你可以用GDB命令来查看当前的栈中的信息。下面是一些查看函数调用栈信息的GDB命令:backtracebt打印当前的函数调用栈的所有信息。如:(gdb) bt#0 func (n=250) at tst.c:6#1 0x08048524 in main (argc=1, argv=0xbffff674) at tst.c:30#2 0x400409ed in __libc_start_main () from /lib/libc.so.6从上可以看出函数的调用栈信息:__libc_start_main --> main() --> func()backtrace bt n是一个正整数,表示只打印栈顶上n层的栈信息。backtrace <-n>bt <-n>-n表一个负整数,表示只打印栈底下n层的栈信息。如果你要查看某一层的信息,你需要在切换当前的栈,一般来说,程序停止时,最顶层的栈就是当前栈,如果你要查看栈下面层的详细信息,首先要做的是切换当前栈。frame f n是一个从0开始的整数,是栈中的层编号。比如:frame 0,表示栈顶,frame 1,表示栈的第二层。up 表示向栈的上面移动n层,可以不打n,表示向上移动一层。down 表示向栈的下面移动n层,可以不打n,表示向下移动一层。上面的命令,都会打印出移动到的栈层的信息。如果你不想让其打出信息。你可以使用这三个命令:select-frame 对应于 frame 命令。up-silently 对应于 up 命令。down-silently 对应于 down 命令。查看当前栈层的信息,你可以用以下GDB命令:frame 或 f会打印出这些信息:栈的层编号,当前的函数名,函数参数值,函数所在文件及行号,函数执行到的语句。info frameinfo f这个命令会打印出更为详细的当前栈层的信息,只不过,大多数都是运行时的内内地址。比如:函数地址,调用函数的地址,被调用函数的地址,目前的函数是由什么样的程序语言写成的、函数参数地址及值、局部变量的地址等等。如:(gdb) info fStack level 0, frame at 0xbffff5d4:eip = 0x804845d in func (tst.c:6); saved eip 0x8048524called by frame at 0xbffff60csource language c.Arglist at 0xbffff5d4, args: n=250Locals at 0xbffff5d4, Previous frame's sp is 0x0Saved registers:ebp at 0xbffff5d4, eip at 0xbffff5d8info args打印出当前函数的参数名及其值。info locals打印出当前函数中所有局部变量及其值。info catch打印出当前的函数中的异常处理信息。查看源程序一、显示源代码GDB 可以打印出所调试程序的源代码,当然,在程序编译时一定要加上-g的参数,把源程序信息编译到执行文件中。不然就看不到源程序了。当程序停下来以后, GDB会报告程序停在了那个文件的第几行上。你可以用list命令来打印程序的源代码。还是来看一看查看源代码的GDB命令吧。list 显示程序第linenum行的周围的源程序。list 显示函数名为function的函数的源程序。list显示当前行后面的源程序。list -显示当前行前面的源程序。一般是打印当前行的上5行和下5行,如果显示函数是是上2行下8行,默认是10行,当然,你也可以定制显示的范围,使用下面命令可以设置一次显示源程序的行数。set listsize 设置一次显示源代码的行数。show listsize查看当前listsize的设置。list命令还有下面的用法:list , 显示从first行到last行之间的源代码。list , 显示从当前行到last行之间的源代码。list +往后显示源代码。一般来说在list后面可以跟以下这们的参数:行号。<+offset> 当前行号的正偏移量。<-offset> 当前行号的负偏移量。 哪个文件的哪一行。 函数名。哪个文件中的哪个函数。<*address> 程序运行时的语句在内存中的地址。二、搜索源代码不仅如此,GDB还提供了源代码搜索的命令:forward-search search 向前面搜索。reverse-search 全部搜索。其中,就是正则表达式,也主一个字符串的匹配模式,关于正则表达式,我就不在这里讲了,还请各位查看相关资料。三、指定源文件的路径某些时候,用-g编译过后的执行程序中只是包括了源文件的名字,没有路径名。GDB提供了可以让你指定源文件的路径的命令,以便GDB进行搜索。directory dir 加一个源文件路径到当前路径的前面。如果你要指定多个路径,UNIX下你可以使用“:”,Windows下你可以使用“;”。directory清除所有的自定义的源文件搜索路径信息。show directories显示定义了的源文件搜索路径。四、源代码的内存你可以使用info line命令来查看源代码在内存中的地址。info line后面可以跟“行号”,“函数名”,“文件名:行号”,“文件名:函数名”,这个命令会打印出所指定的源码在运行时的内存地址,如:(gdb) info line tst.c:funcLine 5 of "tst.c" starts at address 0x8048456 and ends at 0x804845d .还有一个命令(disassemble)你可以查看源程序的当前执行时的机器码,这个命令会把目前内存中的指令dump出来。如下面的示例表示查看函数 func的汇编代码。(gdb) disassemble funcDump of assembler code for function func:0x8048450 : push %ebp0x8048451 : mov %esp,%ebp0x8048453 : sub $0x18,%esp0x8048456 : movl $0x0,0xfffffffc(%ebp)0x804845d : movl $0x1,0xfffffff8(%ebp)0x8048464 : mov 0xfffffff8(%ebp),%eax0x8048467 : cmp 0x8(%ebp),%eax0x804846a : jle 0x8048470 0x804846c : jmp 0x8048480 0x804846e : mov %esi,%esi0x8048470 : mov 0xfffffff8(%ebp),%eax0x8048473 : add %eax,0xfffffffc(%ebp)0x8048476 : incl 0xfffffff8(%ebp)0x8048479 : jmp 0x8048464 0x804847b : nop0x804847c : lea 0x0(%esi,1),%esi0x8048480 : mov 0xfffffffc(%ebp),%edx0x8048483 : mov %edx,%eax0x8048485 : jmp 0x8048487 0x8048487 : mov %ebp,%esp0x8048489 : pop %ebp0x804848a : retEnd of assembler dump.查看运行时数据在你调试程序时,当程序被停住时,你可以使用print命令(简写命令为p),或是同义命令inspect来查看当前程序的运行数据。print命令的格式是:print print / 是表达式,是你所调试的程序的语言的表达式(GDB可以调试多种编程语言),是输出的格式,比如,如果要把表达式按16进制的格式输出,那么就是/x。一、表达式print和许多GDB的命令一样,可以接受一个表达式,GDB会根据当前的程序运行的数据来计算这个表达式,既然是表达式,那么就可以是当前程序运行中的const常量、变量、函数等内容。可惜的是GDB不能使用你在程序中所定义的宏。表达式的语法应该是当前所调试的语言的语法,由于 C/C++是一种大众型的语言,所以,本文中的例子都是关于C/C++的。(而关于用GDB调试其它语言的章节,我将在后面介绍)在表达式中,有几种 GDB所支持的操作符,它们可以用在任何一种语言中。@是一个和数组有关的操作符,在后面会有更详细的说明。::指定一个在文件或是一个函数中的变量。{} 表示一个指向内存地址的类型为type的一个对象。二、程序变量在GDB中,你可以随时查看以下三种变量的值:1、全局变量(所有文件可见的)2、静态全局变量(当前文件可见的)3、局部变量(当前Scope可见的)如果你的局部变量和全局变量发生冲突(也就是重名),一般情况下是局部变量会隐藏全局变量,也就是说,如果一个全局变量和一个函数中的局部变量同名时,如果当前停止点在函数中,用print显示出的变量的值会是函数中的局部变量的值。如果此时你想查看全局变量的值时,你可以使用“::”操作符:file::variablefunction::variable可以通过这种形式指定你所想查看的变量,是哪个文件中的或是哪个函数中的。例如,查看文件f2.c中的全局变量x的值:gdb) p 'f2.c'::x当然,“::”操作符会和C++中的发生冲突,GDB能自动识别“::” 是否C++的操作符,所以你不必担心在调试C++程序时会出现异常。另外,需要注意的是,如果你的程序编译时开启了优化选项,那么在用GDB调试被优化过的程序时,可能会发生某些变量不能访问,或是取值错误码的情况。这个是很正常的,因为优化程序会删改你的程序,整理你程序的语句顺序,剔除一些无意义的变量等,所以在GDB调试这种程序时,运行时的指令和你所编写指令就有不一样,也就会出现你所想象不到的结果。对付这种情况时,需要在编译程序时关闭编译优化。一般来说,几乎所有的编译器都支持编译优化的开关,例如,GNU的 C/C++编译器GCC,你可以使用“-gstabs”选项来解决这个问题。关于编译器的参数,还请查看编译器的使用说明文档。三、数组有时候,你需要查看一段连续的内存空间的值。比如数组的一段,或是动态分配的数据的大小。你可以使用GDB的“@”操作符,“@”的左边是第一个内存的地址的值,“@”的右边则你你想查看内存的长度。例如,你的程序中有这样的语句:int *array = (int *) malloc (len * sizeof (int));于是,在GDB调试过程中,你可以以如下命令显示出这个动态数组的取值:p *array@len@的左边是数组的首地址的值,也就是变量array所指向的内容,右边则是数据的长度,其保存在变量len中,其输出结果,大约是下面这个样子的:(gdb) p *array@len$1 = {2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40}如果是静态数组的话,可以直接用print数组名,就可以显示数组中所有数据的内容了。四、输出格式一般来说,GDB会根据变量的类型输出变量的值。但你也可以自定义GDB的输出的格式。例如,你想输出一个整数的十六进制,或是二进制来查看这个整型变量的中的位的情况。要做到这样,你可以使用 GDB的数据显示格式:x 按十六进制格式显示变量。d 按十进制格式显示变量。u 按十六进制格式显示无符号整型。o 按八进制格式显示变量。t 按二进制格式显示变量。a 按十六进制格式显示变量。c 按字符格式显示变量。f 按浮点数格式显示变量。(gdb) p i$21 = 101(gdb) p/a i$22 = 0x65(gdb) p/c i$23 = 101 'e'(gdb) p/f i$24 = 1.41531145e-43(gdb) p/x i$25 = 0x65(gdb) p/t i$26 = 1100101五、查看内存你可以使用examine命令(简写是x)来查看内存地址中的值。x命令的语法如下所示:x/ n、f、u是可选的参数。n 是一个正整数,表示显示内存的长度,也就是说从当前地址向后显示几个地址的内容。f 表示显示的格式,参见上面。如果地址所指的是字符串,那么格式可以是s,如果地十是指令地址,那么格式可以是i。u 表示从当前地址往后请求的字节数,如果不指定的话,GDB默认是4个bytes。u参数可以用下面的字符来代替,b表示单字节,h表示双字节,w表示四字节,g表示八字节。当我们指定了字节长度后,GDB会从指内存定的内存地址开始,读写指定字节,并把其当作一个值取出来。表示一个内存地址。n/f/u三个参数可以一起使用。例如:命令:x/3uh 0x54320 表示,从内存地址0x54320读取内容,h表示以双字节为一个单位,3表示三个单位,u表示按十六进制显示。六、自动显示你可以设置一些自动显示的变量,当程序停住时,或是在你单步跟踪时,这些变量会自动显示。相关的GDB命令是display。display display/ display/ expr是一个表达式,fmt表示显示的格式,addr表示内存地址,当你用display设定好了一个或多个表达式后,只要你的程序被停下来,GDB会自动显示你所设置的这些表达式的值。格式i和s同样被display支持,一个非常有用的命令是:display/i $pc$pc是GDB的环境变量,表示着指令的地址,/i则表示输出格式为机器指令码,也就是汇编。于是当程序停下后,就会出现源代码和机器指令码相对应的情形,这是一个很有意思的功能。下面是一些和display相关的GDB命令:undisplay delete display 删除自动显示,dnums意为所设置好了的自动显式的编号。如果要同时删除几个,编号可以用空格分隔,如果要删除一个范围内的编号,可以用减号表示(如:2-5)disable display enable display disable和enalbe不删除自动显示的设置,而只是让其失效和恢复。info display查看display设置的自动显示的信息。GDB会打出一张表格,向你报告当然调试中设置了多少个自动显示设置,其中包括,设置的编号,表达式,是否enable。七、设置显示选项GDB中关于显示的选项比较多,这里我只例举大多数常用的选项。set print addressset print address on打开地址输出,当程序显示函数信息时,GDB会显出函数的参数地址。系统默认为打开的,如:(gdb) f#0 set_quotes (lq=0x34c78 "<<", rq=0x34c88 ">>")at input.c:530530 if (lquote != def_lquote)set print address off关闭函数的参数地址显示,如:(gdb) set print addr off(gdb) f#0 set_quotes (lq="<<", rq=">>") at input.c:530530 if (lquote != def_lquote)show print address查看当前地址显示选项是否打开。set print arrayset print array on打开数组显示,打开后当数组显示时,每个元素占一行,如果不打开的话,每个元素则以逗号分隔。这个选项默认是关闭的。与之相关的两个命令如下,我就不再多说了。set print array offshow print arrayset print elements 这个选项主要是设置数组的,如果你的数组太大了,那么就可以指定一个来指定数据显示的最大长度,当到达这个长度时,GDB就不再往下显示了。如果设置为 0,则表示不限制。show print elements查看print elements的选项信息。set print null-stop 如果打开了这个选项,那么当显示字符串时,遇到结束符则停止显示。这个选项默认为off。set print pretty on如果打开printf pretty这个选项,那么当GDB显示结构体时会比较漂亮。如:$1 = {next = 0x0,flags = {sweet = 1,sour = 1},meat = 0x54 "Pork"}set print pretty off关闭printf pretty这个选项,GDB显示结构体时会如下显示:$1 = {next = 0x0, flags = {sweet = 1, sour = 1}, meat = 0x54 "Pork"}show print pretty查看GDB是如何显示结构体的。set print sevenbit-strings 设置字符显示,是否按“\nnn”的格式显示,如果打开,则字符串或字符数据按\nnn显示,如“\065”。show print sevenbit-strings查看字符显示开关是否打开。set print union 设置显示结构体时,是否显式其内的联合体数据。例如有以下数据结构:typedef enum {Tree, Bug} Species;typedef enum {Big_tree, Acorn, Seedling} Tree_forms;typedef enum {Caterpillar, Cocoon, Butterfly}Bug_forms;struct thing {Species it;union {Tree_forms tree;Bug_forms bug;} form;};struct thing foo = {Tree, {Acorn}};当打开这个开关时,执行 p foo 命令后,会如下显示:$1 = {it = Tree, form = {tree = Acorn, bug = Cocoon}}当关闭这个开关时,执行 p foo 命令后,会如下显示:$1 = {it = Tree, form = {...}}show print union查看联合体数据的显示方式set print object 在C++中,如果一个对象指针指向其派生类,如果打开这个选项,GDB会自动按照虚方法调用的规则显示输出,如果关闭这个选项的话,GDB就不管虚函数表了。这个选项默认是off。show print object查看对象选项的设置。set print static-members 这个选项表示,当显示一个C++对象中的内容是,是否显示其中的静态数据成员。默认是on。show print static-members查看静态数据成员选项设置。set print vtbl 当此选项打开时,GDB将用比较规整的格式来显示虚函数表时。其默认是关闭的。show print vtbl查看虚函数显示格式的选项。八、历史记录当你用GDB的print查看程序运行时的数据时,你每一个print都会被GDB记录下来。GDB会以$1, $2, $3 .....这样的方式为你每一个print命令编上号。于是,你可以使用这个编号访问以前的表达式,如$1。这个功能所带来的好处是,如果你先前输入了一个比较长的表达式,如果你还想查看这个表达式的值,你可以使用历史记录来访问,省去了重复输入。九、GDB环境变量你可以在GDB的调试环境中定义自己的变量,用来保存一些调试程序中的运行数据。要定义一个GDB的变量很简单只需。使用GDB的set命令。GDB的环境变量和UNIX一样,也是以$起头。如:set $foo = *object_ptr使用环境变量时,GDB会在你第一次使用时创建这个变量,而在以后的使用中,则直接对其賦值。环境变量没有类型,你可以给环境变量定义任一的类型。包括结构体和数组。show convenience该命令查看当前所设置的所有的环境变量。这是一个比较强大的功能,环境变量和程序变量的交互使用,将使得程序调试更为灵活便捷。例如:set $i = 0print bar[$i++]->contents于是,当你就不必,print bar[0]->contents, print bar[1]-> contents地输入命令了。输入这样的命令后,只用敲回车,重复执行上一条语句,环境变量会自动累加,从而完成逐个输出的功能。十、查看寄存器要查看寄存器的值,很简单,可以使用如下命令:info registers查看寄存器的情况。(除了浮点寄存器)info all-registers查看所有寄存器的情况。(包括浮点寄存器)info registers 查看所指定的寄存器的情况。寄存器中放置了程序运行时的数据,比如程序当前运行的指令地址(ip),程序的当前堆栈地址(sp)等等。你同样可以使用 print命令来访问寄存器的情况,只需要在寄存器名字前加一个$符号就可以了。如:p $eip。改变程序的执行一旦使用GDB挂上被调试程序,当程序运行起来后,你可以根据自己的调试思路来动态地在GDB中更改当前被调试程序的运行线路或是其变量的值,这个强大的功能能够让你更好的调试你的程序,比如,你可以在程序的一次运行中走遍程序的所有分支。一、修改变量值修改被调试程序运行时的变量值,在GDB中很容易实现,使用GDB的print命令即可完成。如:(gdb) print x=4x=4这个表达式是C/C++的语法,意为把变量x的值修改为4,如果你当前调试的语言是Pascal,那么你可以使用Pascal的语法:x:=4。在某些时候,很有可能你的变量和GDB中的参数冲突,如:(gdb) whatis widthtype = double(gdb) p width$4 = 13(gdb) set width=47Invalid syntax in expression.因为,set width是GDB的命令,所以,出现了“Invalid syntax in expression”的设置错误,此时,你可以使用set var命令来告诉GDB,width不是你GDB的参数,而是程序的变量名,如:(gdb) set var width=47另外,还可能有些情况,GDB并不报告这种错误,所以保险起见,在你改变程序变量取值时,最好都使用set var格式的GDB命令。二、跳转执行一般来说,被调试程序会按照程序代码的运行顺序依次执行。GDB提供了乱序执行的功能,也就是说,GDB可以修改程序的执行顺序,可以让程序执行随意跳跃。这个功能可以由GDB的jump命令来完:jump 指定下一条语句的运行点。可以是文件的行号,可以是file:line格式,可以是+num这种偏移量格式。表式着下一条运行语句从哪里开始。jump 这里的是代码行的内存地址。注意,jump命令不会改变当前的程序栈中的内容,所以,当你从一个函数跳到另一个函数时,当函数运行完返回时进行弹栈操作时必然会发生错误,可能结果还是非常奇怪的,甚至于产生程序Core Dump。所以最好是同一个函数中进行跳转。熟悉汇编的人都知道,程序运行时,有一个寄存器用于保存当前代码所在的内存地址。所以,jump命令也就是改变了这个寄存器中的值。于是,你可以使用“set $pc”来更改跳转执行的地址。如:set $pc = 0x485三、产生信号量使用singal命令,可以产生一个信号量给被调试的程序。如:中断信号Ctrl+C。这非常方便于程序的调试,可以在程序运行的任意位置设置断点,并在该断点用GDB产生一个信号量,这种精确地在某处产生信号非常有利程序的调试。语法是:signal ,UNIX的系统信号量通常从1到15。所以取值也在这个范围。single命令和shell的kill命令不同,系统的kill命令发信号给被调试程序时,是由GDB截获的,而single命令所发出一信号则是直接发给被调试程序的。四、强制函数返回如果你的调试断点在某个函数中,并还有语句没有执行完。你可以使用return命令强制函数忽略还没有执行的语句并返回。returnreturn 使用return命令取消当前函数的执行,并立即返回,如果指定了,那么该表达式的值会被认作函数的返回值。五、强制调用函数call 表达式中可以一是函数,以此达到强制调用函数的目的。并显示函数的返回值,如果函数返回值是void,那么就不显示。另一个相似的命令也可以完成这一功能 ——print,print后面可以跟表达式,所以也可以用他来调用函数,print和call的不同是,如果函数返回void,call则不显示,print则显示函数返回值,并把该值存入历史数据中。在不同语言中使用GDBGDB 支持下列语言:C, C++, Fortran, PASCAL, Java, Chill, assembly, 和 Modula- 2。一般说来, GDB会根据你所调试的程序来确定当然的调试语言,比如:发现文件名后缀为“.c”的,GDB会认为是C程序。文件名后缀为“.C, .cc, .cp, .cpp, .cxx, .c++”的,GDB会认为是C++程序。而后缀是“.f, .F”的,GDB会认为是Fortran程序,还有,后缀为如果是“.s, .S”的会认为是汇编语言。也就是说,GDB会根据你所调试的程序的语言,来设置自己的语言环境,并让GDB的命令跟着语言环境的改变而改变。比如一些GDB命令需要用到表达式或变量时,这些表达式或变量的语法,完全是根据当前的语言环境而改变的。例如C/C++中对指针的语法是*p,而在Modula-2中则是p^。并且,如果你当前的程序是由几种不同语言一同编译成的,那到在调试过程中,GDB也能根据不同的语言自动地切换语言环境。这种跟着语言环境而改变的功能,真是体贴开发人员的一种设计。下面是几个相关于GDB语言环境的命令:show language查看当前的语言环境。如果GDB不能识为你所调试的编程语言,那么,C语言被认为是默认的环境。info frame查看当前函数的程序语言。info source查看当前文件的程序语言。如果GDB没有检测出当前的程序语言,那么你也可以手动设置当前的程序语言。使用set language命令即可做到。当set language命令后什么也不跟的话,你可以查看GDB所支持的语言种类:(gdb) set languageThe currently understood settings are:local or auto Automatic setting based on source filec Use the C languagec++ Use the C++ languageasm Use the Asm languagechill Use the Chill languagefortran Use the Fortran languagejava Use the Java languagemodula-2 Use the Modula-2 languagepascal Use the Pascal languagescheme Use the Scheme language于是你可以在set language后跟上被列出来的程序语言名,来设置当前的语言环境。 //++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ 今 天在群上看见了下面这样一个程序,说 x 能打印出 0这个值来,刚开始以为是简单的溢出,后面仔细一看和我以前的溢出猜想不一样,虽然这个技术hacker早就熟得都烂了,但是我一直都只是知道原理,没有亲手去调试过,今天提前完成了上班的任务,所以调试一下,使用的工具有 gcc,objdump,gdbreturnadress.c#includevoid function(void){ char buf[9]; int* ret; //ret = buf + 49; ret = buf + 28; printf(" *ret = %d\n", *ret); (*ret) += 10;}int main(int argc, char* argv[]){ int x; x = 5; function(); x = 2; printf(" printf x = %d\n", x); return 0;}我使用的gcc版本是gcc 版本 4.1.2 20070925 (Red Hat 4.1.2-33)gcc -v这个命令可以查看,在不同的编译器上,打印出来的值应该不是5.首先编译它,然后gdb 调试:gcc -g -o retaddr returnadress.c在我的编译器上执行./retaddr,结果是 5为什么呢,常规的初学者思维应该说是在函数function中没有对x=2修改,即使修改了,在printf前面也将x赋值为2了阿。以前我思维的缓冲溢出程序,应该像我注释掉的那几行互换一样,并把x=2注释掉,向下面的代码一样,应该是5,这个相对好理解一点。如果把注释的代码换换输出,程序如下:#includevoid function(void){ char buf[9]; int* ret; ret = buf + 49; //ret = buf + 17; *ret = 5; //printf(" *ret = %d\n", *ret); (*ret) += 7;}int main(int argc, char* argv[]){ int x; x = 5; function(); //x = 2; printf(" printf x = %d\n", x); return 0;}这里很好理解,利用数组缓冲溢出,确定我的编译器上buf的起始地址+49就是main函数中的x的地址。原理很简单关键在于调试的过程。要是程序是buf + 28 然后再+7的那个,那么在我的编译器上输出的结果printf x = 5这是因为在调用函数前,先要保存函数的返回地址(将函数返回地址压栈),然后再去调用函数,buf + 28,就是函数的返回地址(关于为什么 buf + 28 是函数的返回地址,请参考我blog里的另外一篇文章《毕业设计:linux入侵检测安全增强实现》),取到函数的返回地址以后,用这个语句(*ret) += 7跳过main函数中的 x = 1的赋值,直接去执行printf(" printf x = %d\n", x),所以打印出来的值就是main函数第一次对x赋的值5,第二次赋值被function里面的(*ret) += 7语句跳过了。所以打印出来的是5.这里是上面的原理,原理比较简单,一看就明白了,关键是function函数里面的buf 应该加多少和 *ret应该加多少才能得到我们想要的结果?如何去确定这些数值呢?其实也不难,只是我以前不会,今天问了问,学会了操作,姬路下来,以后可以复习,也希望能帮组到看这篇文章的其他人:)首先有几个基础的gdb命令:第一个是设置断点:break 行号例如: break 18第二个是continue,让程序接着断点往下走例如:continue第三个打印值:print 变量例如:print &buf第四个显示行号左后的程序源码:L 行号例如:L l 13第五个是开始运行程序例如:run我现在编译程序,若想gdb能反汇编,需要加上-g选项给gccgcc -g -o retaddr retaddress.c得出elf文件retaddr执行程序,结果是:[hongmy525@lhc laboratory]$ ./ret*ret = -204642304printf x = 2这个结果不是我们想要的,因为他们没有给我们带来预想的惊喜。我把它反汇编看看:[hongmy525@lhc laboratory]$ gdb retGNU gdb Red Hat Linux (6.6-40.fc8rh)Copyright (C) 2006 Free Software Foundation, Inc.GDB is free software, covered by the GNU General Public License, and you arewelcome to change it and/or distribute copies of it under certain conditions.Type "show copying" to see the conditions.There is absolutely no warranty for GDB. Type "show warranty" for details.This GDB was configured as "i386-redhat-linux-gnu"...Using host libthread_db library "/lib/libthread_db.so.1".(gdb) L 11 #include23 void function(void)4 {5 char buf[9];67 int* ret;89 //ret = buf + 49;10 ret = buf + 28;(gdb) break 9Breakpoint 1 at 0x80483ca: file retaddr.c, line 9.(gdb) runStarting program: /home/hongmy525/laboratory/retwarning: Missing the separate debug info file: /usr/lib/debug/.build-id/ac/2eeb206486bb7315d6ac4cd64de0cb50838ff6.debugwarning: Missing the separate debug info file: /usr/lib/debug/.build-id/ba/4ea1118691c826426e9410cafb798f25cefad5.debugBreakpoint 1, function () at retaddr.c:1010 ret = buf + 28;(gdb) print &buf$1 = (char (*)[9]) 0xbff0b4bb(gdb) L 1914 }1516 int main(int argc, char* argv[])17 {18 int x;1920 x = 5;21 function();2223 x = 2;(gdb) break 22Breakpoint 2 at 0x804840d: file retaddr.c, line 22.(gdb) continueContinuing.*ret = -1074744105Breakpoint 2, main () at retaddr.c:2323 x = 2;(gdb) print &x$2 = (int *) 0xbff0b4f0现在我们知道了function函数中的buf数组的地址$1 = (char (*)[9]) 0xbff0b4bb 和main函数中的变量x的地址$2 = (int *) 0xbff0b4f0。 0xbff0 b4 f0 ─ 0xbff0 b4 bb──────────────── 35因为是16进制:3 × 16 + 5 = 53buf的地址往上偏移 53 就能找到变量 x。于是我们可以在没有函数传参数的情况下在function函数中改变main函数的变量x的值。把程序修改如下:#includevoid function(void){ char buf[9]; int* ret; //ret = buf + 49; ret = buf + 53; printf(" *ret = %d\n", *ret); (*ret) += 10;}int main(int argc, char* argv[]){ int x; x = 5; function(); x = 2; printf(" printf x = %d\n", x); return 0;}程序的输出结果就是:*ret = 5printf x = 2这里,我们已经得到了一个想要的结果,还差printf x ,要是printf x 也能如意的打印出5,那么前面的原理就能实现了。当然,这里我不是指同时打印出5.如果说打印出*ret = 5是一道应用题,那么打印printf x = 5应该算一道小综合。现在我们分析一下该如何去求解我们的答案。首先,我们需要整理一下思路。一、找到返回地址,因为调用函数以前会将函数的返回地址压栈,我们首先需要找到main函数调用函数function之前的返回地址。二、以&buf为基点,找到x=2的赋值语句地址(即是找到 function函数的返回地址,这个地址压栈在main函数调用function之前) ret = buf + ??;三、跳过它·[ (*ret += ??) ]这样,我们就能让printf x = 5了。ok,let‘ go on.[hongmy525@lhc laboratory]$ objdump -d retret: file format elf32-i386Disassembly of section .init:080483f7 :80483f7: 8d 4c 24 04 lea 0x4(%esp),%ecx80483fb: 83 e4 f0 and $0xfffffff0,%esp80483fe: ff 71 fc pushl -0x4(%ecx)8048401: 55 push %ebp8048402: 89 e5 mov %esp,%ebp8048404: 51 push %ecx8048405: 83 ec 24 sub $0x24,%esp8048408: c7 45 f8 05 00 00 00 movl $0x5,-0x8(%ebp)804840f: e8 b0 ff ff ff call 80483c4 8048414: c7 45 f8 02 00 00 00 movl $0x2,-0x8(%ebp)804841b: 8b 45 f8 mov -0x8(%ebp),%eax804841e: 89 44 24 04 mov %eax,0x4(%esp)8048422: c7 04 24 1c 85 04 08 movl $0x804851c,(%esp)8048429: e8 ae fe ff ff call 80482dc 804842e: b8 00 00 00 00 mov $0x0,%eax8048433: 83 c4 24 add $0x24,%esp8048436: 59 pop %ecx8048437: 5d pop %ebp8048438: 8d 61 fc lea -0x4(%ecx),%esp804843b: c3 ret8048414: c7 45 f8 02 00 00 00 movl $0x2,-0x8(%ebp)这里,就是我们要找的关键,下面我们继续。[hongmy525@lhc laboratory]$ gdb ret(gdb) break 12Breakpoint 1 at 0x80483d3: file retaddr.c, line 12.(gdb) break 22Breakpoint 2 at 0x8048414: file retaddr.c, line 22.(gdb) runStarting program: /home/hongmy525/laboratory/retwarning: Missing the separate debug info file: /usr/lib/debug/.build-id/ac/2eeb206486bb7315d6ac4cd64de0cb50838ff6.debugwarning: Missing the separate debug info file: /usr/lib/debug/.build-id/ba/4ea1118691c826426e9410cafb798f25cefad5.debugBreakpoint 1, function () at retaddr.c:1212 printf(" *ret = %d\n", *ret);(gdb) print &buf$1 = (char (*)[9]) 0xbfd37adb(gdb) x/50x 0xbfd37adb0xbfd37adb: 0x04832000 0x00000008 0xd37b1000 0xd37b18bf0xbfd37aeb: 0x048414bf 0xae3ff408 0xae21f800 0xd37b28000xbfd37afb: 0x048469bf 0x9bb6c508 0xd37bbc00 0xd37b28bf0xbfd37b0b: 0xae3ff4bf 0x00000500 0xd37b3000 0xd37b88bf0xbfd37b1b: 0x9a5390bf 0x98bca000 0x04845000 0xd37b88080xbfd37b2b: 0x9a5390bf 0x00000100 0xd37bb400 0xd37bbcbf0xbfd37b3b: 0x98c810bf 0x00000000 0x00000100 0x000001000xbfd37b4b: 0x00000000 0xae3ff400 0x98bca000 0x000000000xbfd37b5b: 0xd37b8800 0xef8985bf 0xbf42fb0c 0x0000009e0xbfd37b6b: 0x00000000 0x00000000 0x9838c000 0x9a52bd000xbfd37b7b: 0x98bfc000 0x00000100 0x0482f000 0x000000080xbfd37b8b: 0x04831100 0x0483f708 0x00000108 0xd37bb4000xbfd37b9b: 0x048450bf 0x04844008没有结果,因为我们没有4字节对齐吧?呵呵,OK,4字节对齐的再来一次(这个gdb命令是查看这个地址往后50×4=200个字节的内存中的存放内容)(gdb) x/50x 0xbfd37adc0xbfd37adc: 0x08048320 0x00000000 0xbfd37b10 0xbfd37b180xbfd37aec: 0x08048414 0x00ae3ff4 0x00ae21f8 0xbfd37b280xbfd37afc: 0x08048469 0x009bb6c5 0xbfd37bbc 0xbfd37b280xbfd37b0c: 0x00ae3ff4 0x00000005 0xbfd37b30 0xbfd37b880xbfd37b1c: 0x009a5390 0x0098bca0 0x08048450 0xbfd37b880xbfd37b2c: 0x009a5390 0x00000001 0xbfd37bb4 0xbfd37bbc0xbfd37b3c: 0x0098c810 0x00000000 0x00000001 0x000000010xbfd37b4c: 0x00000000 0x00ae3ff4 0x0098bca0 0x000000000xbfd37b5c: 0xbfd37b88 0x0cef8985 0x9ebf42fb 0x000000000xbfd37b6c: 0x00000000 0x00000000 0x009838c0 0x009a52bd0xbfd37b7c: 0x0098bfc0 0x00000001 0x080482f0 0x000000000xbfd37b8c: 0x08048311 0x080483f7 0x00000001 0xbfd37bb40xbfd37b9c: 0x08048450 0x08048440很明显,我们找到了我们想要的东西0xbfd37aec: 0x08048414 0x00ae3ff4 0x00ae21f8 0xbfd37b28看见了吗?0x08048414!!哈哈,兴奋啦~~,有时这样的输出是以字节为单位的,因为x86是little-endian。这时找着就比较费眼睛了。0x08048414 在0xbfd37aec 这个地址中,又该做减法了 0xbfd37a ec ─ 0xbfd37a db────────────── 111 × 16 + 1 = 17也就是说函数的返回地址距离&buf有17个字节,只有17个字节,哇~~~,太开心了,我给他加上就好了。ret = buf +17;这样,现在的ret指向的就是function函数的返回地址了。我们看源码,程序返回以后要做的是赋值,那我们不想让他赋值,804840f: e8 b0 ff ff ff call 80483c4 8048414: c7 45 f8 02 00 00 00 movl $0x2,-0x8(%ebp)804841b: 8b 45 f8 mov -0x8(%ebp),%eax于是我们跳过这条指令,让ret指向804841b, 0x080484 1b ─ 0x080484 14────────────── 7(*ret)+= 7这样,我们函数的返回地址+7,正好跳过赋值语句,执行printf(" printf x = %d\n", x);显眼,这样打印出来的就是5,程序如下:#includevoid function(void){ char buf[9]; int* ret; //ret = buf + 49; ret = buf + 17; printf(" *ret = %d\n", *ret); (*ret) += 7;}int main(int argc, char* argv[]){ int x; x = 5; function(); x = 2; printf(" printf x = %d\n", x); return 0;}程序输出如下:[hongmy525@lhc laboratory]$ ./ret*ret = 134513684printf x = 5完工。由群鬼舞者发起讨论,罗琰指导,谢谢他们。
阅读(482) | 评论(0) | 转发(0) |