choupiaoyi 2018-10-20
这个主题对于刚开始学习C语言时可能会觉得很简单啊,那好你告诉我下面几个题目的输出是什么,你要是能说对,并且说出为什么,那你就可以不用往下看了
int i = 0,j = 0;
1、j = (i++)+(i++)+(i++); //而不是j = i++i++i++;
2、j = (++i)+(++i)+(++i); //而不是j = ++i++i++i;
3、j = ++i+++i+++i;
4、j = i+++j;
下面我们一题一题来进行分析
首先:我们来分析1和2两个题,这里需要稍微懂点汇编知识,因为C语言是分析不出来的,所以只能从汇编的角度去分析
但是不懂汇编语言也不用怕,因为我也不懂汇编语言,用到我都是百度查询,有的也不是很懂,下面我在VS2010里面编写上面代码
#include <stdio.h>
#include <string.h>
int main()
{
int i = 0,j = 0;
//第一题
j = (i++)+(i++)+(i++);
//下面我们自己分析下认为应该是
//j= 0 + 1 + 2; i = 3
printf("i = %d,j = %d",i,j); //实际输出i = 3 j = 0
//第二题
j = (++i)+(++i)+(++i);
//下面我们自己分析下认为应该是
//j = 4 + 5 + 6; i = 6
printf("i = %d,j = %d",i,j); //实际输出i = 6 j = 18
//第三题
//j = ++i+++i+++i; //编译出错
//printf("i = %d,j = %d",i,j);
//第四题
j = i+++j;
printf("i = %d,j = %d",i,j);
system("pause");
return 0;
}
再看下对应反汇编代码
#include <stdio.h>
#include <string.h>
int main()
{
003A34A0 push ebp
003A34A1 mov ebp,esp
003A34A3 sub esp,0D8h
003A34A9 push ebx
003A34AA push esi
003A34AB push edi
003A34AC lea edi,[ebp-0D8h]
003A34B2 mov ecx,36h
003A34B7 mov eax,0CCCCCCCCh
003A34BC rep stos dword ptr es:[edi]
int i = 0,j = 0;
003A34BE mov dword ptr [i],0
003A34C5 mov dword ptr [j],0
//第一题
j = (i++)+(i++)+(i++);
003A34CC mov eax,dword ptr [i]
003A34CF add eax,dword ptr [i]
003A34D2 add eax,dword ptr [i]
003A34D5 mov dword ptr [j],eax
003A34D8 mov ecx,dword ptr [i]
003A34DB add ecx,1
003A34DE mov dword ptr [i],ecx
003A34E1 mov edx,dword ptr [i]
003A34E4 add edx,1
003A34E7 mov dword ptr [i],edx
003A34EA mov eax,dword ptr [i]
003A34ED add eax,1
003A34F0 mov dword ptr [i],eax
//下面我们自己分析下认为应该是
//j= 0 + 1 + 2; i = 3
printf("i = %d,j = %d",i,j); //实际输出i = 3 j = 0
003A34F3 mov esi,esp
003A34F5 mov eax,dword ptr [j]
003A34F8 push eax
003A34F9 mov ecx,dword ptr [i]
003A34FC push ecx
003A34FD push offset string "i = %d,j = %d" (3A5A00h)
003A3502 call dword ptr [__imp__printf (3A82B0h)]
003A3508 add esp,0Ch
003A350B cmp esi,esp
003A350D call @ILT+295(__RTC_CheckEsp) (3A112Ch)
//第二题
j = (++i)+(++i)+(++i);
003A3512 mov eax,dword ptr [i]
003A3515 add eax,1
003A3518 mov dword ptr [i],eax
003A351B mov ecx,dword ptr [i]
003A351E add ecx,1
003A3521 mov dword ptr [i],ecx
003A3524 mov edx,dword ptr [i]
003A3527 add edx,1
003A352A mov dword ptr [i],edx
003A352D mov eax,dword ptr [i]
003A3530 add eax,dword ptr [i]
003A3533 add eax,dword ptr [i]
003A3536 mov dword ptr [j],eax
//下面我们自己分析下认为应该是
//j = 4 + 5 + 6; i = 6
printf("i = %d,j = %d",i,j); //实际输出i = 6 j = 18
003A3539 mov esi,esp
003A353B mov eax,dword ptr [j]
003A353E push eax
003A353F mov ecx,dword ptr [i]
003A3542 push ecx
003A3543 push offset string "i = %d,j = %d" (3A5A00h)
003A3548 call dword ptr [__imp__printf (3A82B0h)]
003A354E add esp,0Ch
003A3551 cmp esi,esp
003A3553 call @ILT+295(__RTC_CheckEsp) (3A112Ch)
//第三题
//j = ++i+++i+++i; //编译出错
//printf("i = %d,j = %d",i,j);
//第四题
j = i+++j;
003A3558 mov eax,dword ptr [i]
003A355B add eax,dword ptr [j]
003A355E mov dword ptr [j],eax
003A3561 mov ecx,dword ptr [i]
003A3564 add ecx,1
003A3567 mov dword ptr [i],ecx
printf("i = %d,j = %d",i,j);
003A356A mov esi,esp
003A356C mov eax,dword ptr [j]
003A356F push eax
003A3570 mov ecx,dword ptr [i]
003A3573 push ecx
003A3574 push offset string "i = %d,j = %d" (3A5A00h)
003A3579 call dword ptr [__imp__printf (3A82B0h)]
003A357F add esp,0Ch
003A3582 cmp esi,esp
003A3584 call @ILT+295(__RTC_CheckEsp) (3A112Ch)
system("pause");
003A3589 push offset string "pause" (3A57B0h)
003A358E call @ILT+445(_system) (3A11C2h)
003A3593 add esp,4
return 0;
003A3596 xor eax,eax
}
首先我们来分析第1个题:j = (i++)+(i++)+(i++);
前面一些初始化我就不讲了,我们直接对这句汇编进行分析
//第一题
j = (i++)+(i++)+(i++);
003A34CC mov eax,dword ptr [i]
003A34CF add eax,dword ptr [i]
003A34D2 add eax,dword ptr [i]
003A34D5 mov dword ptr [j],eax
003A34D8 mov ecx,dword ptr [i]
003A34DB add ecx,1
003A34DE mov dword ptr [i],ecx
003A34E1 mov edx,dword ptr [i]
003A34E4 add edx,1
003A34E7 mov dword ptr [i],edx
003A34EA mov eax,dword ptr [i]
003A34ED add eax,1
003A34F0 mov dword ptr [i],eax
这里面实际就用了两条汇编指令mov和add:
mov指令:数据传输指令,用C语言的话讲就是赋值指令‘=’比如:mov AL,20H 相当于C语言就是 AL = 20H AL是寄存器
add指令:加法指令,用C语言的话讲就是一个复合赋值运算符指令‘+=’比如:add AX,8H 相当于C语言就是 AX += 8,再简单点就是AX = AX + 8
eax,ebx,ecx,edx,esi,edi,ebp,esp:这些都是通用寄存器,用C语言的话讲就是全局变量(但是这些寄存器又有特殊用处,这里不详细讲,感兴趣可以百度)
dword:双字 就是四个字节
ptr:pointer 即指针
[]:里的数据是一个地址值,这个地址值指向一个双字型数据
比如:mov eax,dword ptr [12345678];把内存地址12345678中的双字型(32位)数据赋给eax,相当于C语言就是 exa = *12345678;
mov eax,dword ptr [i] ;把内存地址&i中的双字型(32)数据赋给exa,相当于C语言就是eax = i;
好了知道这些汇编指令就可以分析了
003A34CC mov eax,dword ptr [i] ; 相当于C语言中 eax = i;因为i = 0,所以eax = 0
003A34CF add eax,dword ptr [i] ; 相当于C语言中 eax = eax + i; 因为i = 0,eax = 0,所以 eax = eax + i = 0
003A34D2 add eax,dword ptr [i] ; 相当于C语言中 eax = eax + i; 同上,eax = 0
003A34D5 mov dword ptr [j],eax ; 相当于C语言中 j = eax; 因为eax = 0,所以 j = 0
所以前四条汇编指令执行完,j = 0,再往下面分析
003A34D8 mov ecx,dword ptr [i] ; 相当于C语言中 ecx = i;因为i = 0,所以ecx = 0
003A34DB add ecx,1 ; 相当于C语言中 ecx = ecx + 1 ; 所有ecx = 1
003A34DE mov dword ptr [i],ecx ; 相当于C语言中 i = ecx;所以i = 1
003A34E1 mov edx,dword ptr [i] ; 相当于C语言中 edx = i;因为i = 1,所以edx = 1
003A34E4 add edx,1 ; 相当于C语言中 edx = edx + 1 ; 所有edx = 2
003A34E7 mov dword ptr [i],edx ; 相当于C语言中 i = edx;所以i = 2
003A34EA mov eax,dword ptr [i] ; 相当于C语言中 eax = i;因为i = 2,所以eax = 2
003A34ED add eax,1 ; 相当于C语言中 eax = eax + 1 ; 所有eax = 3
003A34F0 mov dword ptr [i],eax ; 相当于C语言中 i = eax;所以i = 3
所以通过上面分析,j = 0,i = 3;
这个分析完全和我们注释的分析是不一样的
好了我们在分析第2题(别忘了j = 0,i = 3)
j = (++i)+(++i)+(++i);
003A3512 mov eax,dword ptr [i] ; 相当于C语言中 eax = i;因为i = 3,所以eax = 3
003A3515 add eax,1 ; 相当于C语言中 eax = eax + 1 ; 所有eax = 4
003A3518 mov dword ptr [i],eax ; 相当于C语言中 i = eax;所以i = 4
003A351B mov ecx,dword ptr [i] ; 相当于C语言中 ecx = i;因为i = 4,所以ecx = 4
003A351E add ecx,1 ; 相当于C语言中 ecx = ecx + 1 ; 所有ecx = 5
003A3521 mov dword ptr [i],ecx ; 相当于C语言中 i = ecx;所以i = 5
003A3524 mov edx,dword ptr [i] ; 相当于C语言中 edx = i;因为i = 5,所以edx = 5
003A3527 add edx,1 ; 相当于C语言中 edx = edx + 1 ; 所有edx = 6
003A352A mov dword ptr [i],edx ; 相当于C语言中 i = edx;所以i = 6
003A352D mov eax,dword ptr [i] ; 相当于C语言中 eax = i;因为i = 6,所以eax = 6
003A3530 add eax,dword ptr [i] ; 相当于C语言中 eax = eax + i ; 所有eax = 12
003A3533 add eax,dword ptr [i] ; 相当于C语言中 eax = eax + i ; 所有eax = 18
003A3536 mov dword ptr [j],eax ; 相当于C语言中 j = eax;因为eax = 18,所以j = 18
通过上面分析,i = 6,j = 18
这个分析完全和我们注释的分析也是不一样的
好了我们接着分析第3题 (别忘了,i = 6)
j = ++i+++i+++i;
看看这个表达式是不是就是第2题的表达式去掉大括号啊,还真是啊
因为编译不通过,就没有办法通过反汇编分析了,所以只能从C语言角度分析了
分析过程:首先编译器读取第一个字符‘+,这时编译器可能认为这是一个加法,也可能认为是一个自增运算符,所以编译器还会往后面读取,再读取一个字符‘+’,这时编译器就可以判断出来了,这是一个自增运算符,而且后面肯定有一个变量在后面跟着,否则编译出错,所以再读取一个字符‘i’,总结前面就是执行了一个“++i”,然后往下分析,这时编译器往后面读取字符‘+’,这时编译器可能认为是加法,也可能认为是自增运算符,所以编译器还得往后面读取才能知道到底是什么字符,这时编译器再读取一个字符‘+’,这时编译器就能判断出来了,这是一个自增运算符,同时编译器也会报错,为什么会报错呢,因为前面++i,执行完是一个常数7,7后面又跟了自增运算符,相当于7++,这里肯定是错误的,因为自增或者自减运算符只能对变量执行,不能对常数,所以编译肯定报错的
上面编译器处理的方法叫做“贪心法”,编译器通过贪心法处理表达式中的子表达式
有人可能认为你这些都是你瞎猜的,谁知道你分析的对不对,又没有对应反汇编代码,所以我们在VS里面再加上一条语句
j = 7++;
看它是否和第3题的错误提示信息是否是一样,如果是一样的,就说明我们的分析是对的
看见没,是一样的错误信息,所以我们的分析完全正确,我同时也在ubuntu 10里面试了下,
gcc 提示信息:test.c:17: error: lvalue required as increment operand,中文意思:左值必须是一个变量操作数
讲的有点累了,说的也比较啰嗦,好了我们再分析下第4题(别忘了i = 6,j = 18)
j = i+++j;
这个表达式就会有两种结果:
第1种:j = (i++) + j;
第2种:j = i + (++j);
我们这次采用两种方法讲解:
第一种:直接从C语言用“贪心法”分析
第二种:从反汇编角度去分析
第一种:首先编译器读取i++,执行i++,然后在往后面读取字符‘+’这时编译认为可能是加法,也可能是自增运算符,所以还得往后面读取字符才能知道,再次读取一个字符‘j’,这时编译器就判断出来了,这是一个加法,所以编译器先执行,i++,然后在加上j,执行结果就是i = 7,j = 24,也就是它是按第1种情况执行的
第二种:从反汇编角度去分析
003A3558 mov eax,dword ptr [i] ; 相当于C语言中 eax = i;因为i = 6,所以eax = 6
003A355B add eax,dword ptr [j] ; 相当于C语言中 eax = eax + j ; 因为j = 18,所有eax = 24
003A355E mov dword ptr [j],eax ; 相当于C语言中 j = eax;所以j = 24
003A3561 mov ecx,dword ptr [i] ; 相当于C语言中 ecx = i;因为i = 6,所以ecx = 6
003A3564 add ecx,1 ; 相当于C语言中 ecx = ecx + 1 ; 所有ecx = 7
003A3567 mov dword ptr [i],ecx ; 相当于C语言中 i = ecx;所以i = 7
通过上面两种方法分析,i = 7,j = 24
两种分析方法里面具体执行细节还是不一样的,反汇编肯定是最详细的,最权威的,C语言还是不够详细的,比如这道题里面,执行i++时,表面感觉,结果肯定是6,执行完时i本身已经变成7了么?显然是看不出来的,只有通过反汇编我们才知道,实际i本身值没有变成7,而是最后才变成7的
这里好了,我们再硬插一道第5题(不然还得写一篇博客)
看见没,第五题就是b = b/*p;p是指向整型a的变量,但是你如果不注意,输入完毕,直接编译,编译出错
这时你在仔细回去看下代码,发现b = b/*p;后面语句都是绿色了,都注释掉了,这是为什么,其实这是因为编译器把/*p当成‘/*’注释符了,所以后面全都注释掉了,那难道就没有办法解决么?实际是可以解决的,你把除号后面加一个空格就可以了,b = b/ *p;
开始对上面进行总结:
1、++和--操作符在混合运算中的行为可能不同
2、++和--对应汇编指令不一定连续执行
3、在混合运算中,++和--的汇编指令可能被打断执行
4、编译器通过“贪心法”处理表达式中的子表达式
5、空格可以作为C语言中的一个完整符号的休止符
6、编译器读入空格后立即对之前读入的符号进行处理
这里面还有很多关于++,--的一些坑
比如:printf("%d,%d",i++,i++);
printf("%d,%d",i++,i);
你认为上面输出会是一样的么?
i = 1;
j = ++i+i+++i;
printf("j = %d",j); //j等于几,还是说编译出错
这些你都可以通过汇编去分析