linux内核编程学习笔记一：AT,T汇编语言-红联Linux系统门户

今天开始学习linux内核编程了，从没有内核编程基础开始学起。所以很多相关的知识都要了解。首先就是AT&T汇编语言。因为在linux内核源代码中，好像除了开始的bootsect.s和head.s是用intel的汇编外，别的汇编代码都是用的AT&T汇编语言，所以有必要把AT&T汇编语言了解一下。
不过，由于AT&T汇编和intel汇编大同小异，所以，了解一下一些不同的地方就可以了。

以下的内容都是AT&T汇编的特点：
1、寄存器前面要加“%”，如 mov %eax,%ebx
这里要注意的一点是，AT&T汇编中，源寄存器和目的寄存器的顺序和intel汇编刚好相反，AT&T汇编中，左边的是源寄存器，右边的是目的寄存器，在上边那个例子中，%eax是源寄存器，%ebx是目的寄存器。

2、立即数/常数前面要加$，如 mov $4,%ebx 把4这个数装入ebx这个寄存器。
符号常数直接用，如 mov value,%eax 即把value代表的那个值装入eax寄存器。
mov $value,%eax 即把value的值作为地址，而把对应那个地址中的值装入eax。

3、b(byte):8位， w（word）：16位， l（long）：32位
如： movb %ax,%bx movw %eax,%ebx

4、jum/call的操作数前要加上“*"作为前缀，远跳转ljmp，远调用lcall
如 ljmp $section,$offset
lcall $section,$offset
这里$section和offset表示的就是，以section为段地址，offset为段内偏移地址。因此，ljmp $section,$offset即跳转到section:offset地址。

5、远返回lret
如 lret $stack_adjust

6、寻址方式
表示方式 section:disp(base,index,scale)
计算方法 base+index*scale+disp
即 section:[base+index*scale+disp]
其中disp是表示偏移地址。
如 movl -4(%ebp),%eax 把[%ebp-4]的内容装入eax

7、C语言中嵌入汇编
格式: _asm_("asm statements":outputs:inputs:registers-modified)
其中，"asm statements"是汇编语句表达式，outputs,inputs,register-modified都是可选参数，以冒号隔开，且一次以0～9编号，如outputs的寄存器是0号，inputs寄存器是1号，往后依次类推。outputs是汇编语句执行完后输出到的寄存器，inputs是输入到某个寄存器。
例1：_asm_("pushl %%eax\n\t" "movl $0,%%eax\n\t" "popl %%eax");
在嵌入汇编中，寄存器前面要加两个%，因为gcc在编译是，会先去掉一个%再输出成汇编格式。
例2：{ register char _res;\
asm("push %%fs\n\t"
"movw %%ax,%%fs\n\t"
"movb %%fs:%2,%%al\n\t"
"pop %%fs"
:"=a"(_res):"0"(seg),"m"(*(addr)));\
_res;}
movb %%fs:%2,%%al\n\t一句中是把以fs为段地址，以后面的第二号寄存器即后面的seg中的值为偏移地址所对应的值装入al。"=a"(_res):"0"(seg),"m"(*(addr)))一句中，"=a"(_res)表示把a寄存器中的内容给_res，"0"(seg)表示把seg中的内容给0所对应的寄存器，而0即表示使用和前一个寄存器相同的寄存器，这里即使用a寄存器，也就是说把seg中的内容个a寄存器。
需要解释以下的是，a,b,c,d分别表示寄存器eax，ebx，ecx，edx
S，D分别表示寄存器esi，edi
r表示任意寄存器
0（数字0，不是o！）表示使用上一个寄存器

linux内核编程学习笔记一：AT,T汇编语言

共有 4 条评论

频道文章

最新教程

随机推荐