标签:
一直以来都对execve到底做了什么,总是犯迷糊,原来看Linux内核设计的艺术,这部分讲解的非常不细致,这次结合赵博士的书,重新理解了这部分代码。
首先列出代码,如下:
if (!(pid=fork())) {//进程1创建进程2
close(0);
if (open("/etc/rc",O_RDONLY,0))
_exit(1);
execve("/bin/sh",argv_rc,envp_rc);
_exit(2);
} 进程1创建进程2,进程2的页目录表及页表如图1,页目录表项是第32位,由于页目录表从内核0x0的位置,所以进程2的页目录项的位置为32,由于每个页目录项所占的字节数为4,所以内存地址为128。图 1
此时用命令行,查看内核地址为128的数据。0xffa027,就是进程2页表的首地址 。
图 2
0xffa000开始存放的进程2的页表项,如下图:
图 3
下面看真正的execve,代码如下:
int do_execve(unsigned long * eip,long tmp,char * filename,
char ** argv, char ** envp)
{
struct m_inode * inode;
struct buffer_head * bh;
struct exec ex;
unsigned long page[MAX_ARG_PAGES];//MAX_ARG_PAGES为32
int i,argc,envc;
int e_uid, e_gid;
int retval;
int sh_bang = 0;
unsigned long p=PAGE_SIZE*MAX_ARG_PAGES-4;//4096*32-4=131068=1FFFC
if ((0xffff & eip[1]) != 0x000f)
panic("execve called from supervisor mode");
for (i=0 ; i<MAX_ARG_PAGES ; i++) /* clear page-table */
page[i]=0;
if (!(inode=namei(filename))) //找到/bin/sh的i节点
return -ENOENT;
argc = count(argv);//参数的数量
envc = count(envp);//环境变量的数量
restart_interp:
.....
if (!(bh = bread(inode->i_dev,inode->i_zone[0]))) {//读取第一块的数据
retval = -EACCES;
goto exec_error2;
}
ex = *((struct exec *) bh->b_data); //赋值给文件头
.....
if (!sh_bang) {
p = copy_strings(envc,envp,page,p,0);
p = copy_strings(argc,argv,page,p,0);//最后返回的p是131068减去参数和环境变量的字节数,堆栈的指针。目前page数组中,page[31]已经是一个新申请页面的地址了。
if (!p) {
retval = -ENOMEM;
goto exec_error2;
}
}
/* OK, This is the point of no return */
if (current->executable)
iput(current->executable);
current->executable = inode;//刚刚获取的/bin/sh节点
for (i=0 ; i<32 ; i++)
current->sigaction[i].sa_handler = NULL;//信号处理函数为NULL
for (i=0 ; i<NR_OPEN ; i++)//close_on_exec为0
if ((current->close_on_exec>>i)&1)//不会执行
sys_close(i);
current->close_on_exec = 0;
free_page_tables(get_base(current->ldt[1]),get_limit(0x0f));//get_base(current->ldt[1])为128MB,get_limit(0x0f)为640KB,页目录项的第32项清零,它所指向的页表也都清0了。
free_page_tables(get_base(current->ldt[2]),get_limit(0x17));
if (last_task_used_math == current)
last_task_used_math = NULL;
current->used_math = 0;
p += change_ldt(ex.a_text,page)-MAX_ARG_PAGES*PAGE_SIZE;//p最后为PAGE_SIZE*MAX_ARG_PAGES-4 - 参数和环境变量的字节数 + 64MB - MAX_ARG_PAGES*PAGE_SIZE,最后就是64MB-4-
参数和环境变量的字节数,也就是换成了以64MB为界限的堆栈值了。
p = (unsigned long) create_tables((char *)p,argc,envc);
current->brk = ex.a_bss +(current->end_data = ex.a_data +(current->end_code = ex.a_text));//代码段,数据段,bss段
current->start_stack = p & 0xfffff000;
current->euid = e_uid;
current->egid = e_gid;
......
eip[0] = ex.a_entry; //内核栈要返回给用户空间的eip
eip[3] = p; //内核栈用返回给用户空间的esp
return 0;
....
return(retval);
} 1、inode=namei(filename),找到/bin/sh的i节点。2、argc = count(argv); envc = count(envp),计算参数及环境变量的数量。
3、bh = bread(inode->i_dev,inode->i_zone[0]);ex = *((struct exec *) bh->b_data),找到/bin/sh的文件头。
下面是copy_strings(envc,envp,page,p,0)。代码如下:
static unsigned long copy_strings(int argc,char ** argv,unsigned long *page,
unsigned long p, int from_kmem)
{
char *tmp, *pag=NULL;
int len, offset = 0;
unsigned long old_fs, new_fs;
if (!p)
return 0; /* bullet-proofing */
new_fs = get_ds();
old_fs = get_fs();
.....
while (argc-- > 0) {//参数的个数
.....
if (!(tmp = (char *)get_fs_long(((unsigned long *)argv)+argc)))//第一个参数的指针
panic("argc is wrong");
.....
len=0; /* remember zero-padding */
do {
len++;
} while (get_fs_byte(tmp++));//获取第一个参数的长度
if (p-len < 0) { /* this shouldn‘t happen - 128kB */
set_fs(old_fs);
return 0;
}
while (len) {
--p; --tmp; --len;
if (--offset < 0) {//第一次进入offset为-1
offset = p % PAGE_SIZE;//offset为4092
......
if (!(pag = (char *) page[p/PAGE_SIZE]) && //p/PAGE_SIZE为31
!(pag = (char *) page[p/PAGE_SIZE] =
(unsigned long *) get_free_page())) //page[31]存的是新申请页面的地址
return 0;
.....
}
*(pag + offset) = get_fs_byte(tmp);//伴随循环,参数被写到新申请的页面(从4092依次向低地址4091,4090.....)
}
}
......
return p;//最后返回的131068-参数的字节,堆栈的指针。
} 由于from_kmem为0,我们去掉from_kmem为其他值的情况。参数的含义如下:p为131068,argc位参数的个数,agrv为参数的指针数组,page是page[MAX_ARG_PAGES]的首地址。
我们假设只申请了一个页面就足够存参数和环境变量了,最后返回的p是131068减去参数和环境变量的字节数,堆栈的指针。目前page数组中,page[31]已经是一个新申请页面的地址了。
下面分析,free_page_tables代码,如下:
int free_page_tables(unsigned long from,unsigned long size)//from为128MB,size为640KB
{
unsigned long *pg_table;
unsigned long * dir, nr;
if (from & 0x3fffff)
panic("free_page_tables called with wrong alignment");
if (!from)
panic("Trying to free up swapper memory space");
size = (size + 0x3fffff) >> 22;//size为1
dir = (unsigned long *) ((from>>20) & 0xffc); //dir为128
for ( ; size-->0 ; dir++) {
if (!(1 & *dir))
continue;
pg_table = (unsigned long *) (0xfffff000 & *dir);//pg_table为页目录项第32项所指向的内存地址
for (nr=0 ; nr<1024 ; nr++) {
if (1 & *pg_table)
free_page(0xfffff000 & *pg_table);//mem_map对应的位减1,也许会清0,可以重新被用于分配
*pg_table = 0;//对应的页表项都清零
pg_table++;
}
free_page(0xfffff000 & *dir);//由于地址小于1MB,所以直接返回
*dir = 0;//第32项页目录项页清零
}
invalidate();
return 0;
} free_page,代码如下:void free_page(unsigned long addr)
{
if (addr < LOW_MEM) return;//1MB以上
if (addr >= HIGH_MEMORY)
panic("trying to free nonexistent page");
addr -= LOW_MEM;
addr >>= 12;
if (mem_map[addr]--) return;//mem_map对应的位减1
mem_map[addr]=0;
panic("trying to free free page");
} free_page_tables,页目录项的第32项清零,它所指向的页表也都清0了。图 4
下面来看change_ldt,代码如下:
static unsigned long change_ldt(unsigned long text_size,unsigned long * page)
{
unsigned long code_limit,data_limit,code_base,data_base;
int i;
code_limit = text_size+PAGE_SIZE -1;//text_size为shell代码段的长度
code_limit &= 0xFFFFF000;//代码段的界限就是shell代码段的长度
data_limit = 0x4000000;//数据段的界限是64MB
code_base = get_base(current->ldt[1]);//代码段基地址为128MB
data_base = code_base;//数据段基地址为128
set_base(current->ldt[1],code_base);//修改代码段基地址为128MB
set_limit(current->ldt[1],code_limit);//修改代码段界限为shell代码段的长度
set_base(current->ldt[2],data_base);//修改数据段基地址为128MB
set_limit(current->ldt[2],data_limit);//修改数据段界限为64MB
/* make sure fs points to the NEW data segment */
__asm__("pushl $0x17\n\tpop %%fs"::);
data_base += data_limit;//192MB
for (i=MAX_ARG_PAGES-1 ; i>=0 ; i--) {//MAX_ARG_PAGES为31
data_base -= PAGE_SIZE;//data_base为192MB-4096B
if (page[i])//现在只有page[31]有地址,里面存放着参数和环境变量的页面的首地址
put_page(page[i],data_base);
}
return data_limit;//返回64MB
}
change_ldt,修改了代码段和数据段的基地址和段界限,数据段的段界限为64MB,由于一个页目录项可以代表4MB的内存地址,所以需要16个页目录项。也就是从第32个页目录项到第48个页目录项。 下面来看put_page,代码如下:
unsigned long put_page(unsigned long page,unsigned long address)//address为0xBFFF000
{
unsigned long tmp, *page_table;
/* NOTE !!! This uses the fact that _pg_dir=0 */
if (page < LOW_MEM || page >= HIGH_MEMORY)
printk("Trying to put page %p at %p\n",page,address);
if (mem_map[(page-LOW_MEM)>>12] != 1)
printk("mem_map disagrees with %p at %p\n",page,address);
page_table = (unsigned long *) ((address>>20) & 0xffc);//BxBC,为188
if ((*page_table)&1)//目前为0
page_table = (unsigned long *) (0xfffff000 & *page_table);
else {//走到这里
if (!(tmp=get_free_page()))//获取存放页表项的页表
return 0;
*page_table = tmp|7;//页目录表第188项存放刚刚获取的页表地址
page_table = (unsigned long *) tmp;//把页表地址赋值给page_table
}
page_table[(address>>12) & 0x3ff] = page | 7;//页表的最后一项存放的是page(存放的参数和环境变量的页面的首地址)
/* no need for invalidate */
return page;
} put_page,address为0xBFFF000,page为page[31],存放的参数和环境变量的页面的首地址。执行完put_page后,内存的图如下:
页目录项的第48位,指向页表的首地址。页表的首地址+4092,这个地址存放的内容的就是存放的参数和环境变量的页面的首地址。
p += change_ldt(ex.a_text,page)-MAX_ARG_PAGES*PAGE_SIZE;//p最后为PAGE_SIZE*MAX_ARG_PAGES-4 - 参数和环境变量的字节数 + 64MB - MAX_ARG_PAGES*PAGE_SIZE,最后就是64MB-4- 参数和环境变量的字节数,也就是换成了以64MB为界限的堆栈值了。
然后调用create_tables,代码如下:
static unsigned long * create_tables(char * p,int argc,int envc)
{
unsigned long *argv,*envp;
unsigned long * sp;
sp = (unsigned long *) (0xfffffffc & (unsigned long) p);
sp -= envc+1;
envp = sp;
sp -= argc+1;
argv = sp;
put_fs_long((unsigned long)envp,--sp);
put_fs_long((unsigned long)argv,--sp);
put_fs_long((unsigned long)argc,--sp);
while (argc-->0) {
put_fs_long((unsigned long) p,argv++);
while (get_fs_byte(p++)) /* nothing */ ;
}
put_fs_long(0,argv);
while (envc-->0) {
put_fs_long((unsigned long) p,envp++);
while (get_fs_byte(p++)) /* nothing */ ;
}
put_fs_long(0,envp);
return sp;
}
最后的点睛之作,
eip[0] = ex.a_entry; //内核栈要返回给用户空间的eip eip[3] = p; //内核栈用返回给用户空间的espeip为0,esp为64MB-4-参数和环境变量的字节数,也就是说在用户空间,访问ss:eip,就是访问128MB+64MB-4-参数和环境变量的字节数,在经过分页机制,最后能够访问最终存放参数和环境变量的页面的指定位置。
标签:
原文地址:http://blog.csdn.net/jltxgcy/article/details/43560229