首 页文章中心

Linux学习网

您的位置Linux学习网 > Linux综合 > 文章内容

使用Linux系统调用的内核命令

作者:佚名  来源:不详  发布时间:2007-12-21 16:38:00

级别: 中级

M. Tim Jones (mtj@mtjones.com), 顾问工程师, EmulexjVCLinux联盟

2007 年 4 月 17 日

     Linux® 系统调用 —— 我们每天都在使用它们。不过您清楚系统调用是如何在用户空间和内核之间执行的吗?本文将探究 Linux 系统调用接口(SCI),学习如何添加新的系统调用(以及实现这种功能的其他方法),并介绍与 SCI 有关的一些工具。

    系统调用就是用户空间应用程序和内核提供的服务之间的一个接口。由于服务是在内核中提供的,因此无法执行直接调用;相反,您必须使用一个进程来跨越用户空间与内核之间的界限。在特定架构中实现此功能的方法会有所不同。因此,本文将着眼于最通用的架构 —— i386。

    在本文中,我将探究 Linux SCI,演示如何向 2.6.20 内核添加一个系统调用,然后从用户空间来使用这个函数。我们还将研究在进行系统调用开发时非常有用的一些函数,以及系统调用的其他选择。最后,我们将介绍与系统调用有关的一些辅助机制,比如在某个进程中跟踪系统调用的使用情况。

SCI

    Linux 中系统调用的实现会根据不同的架构而有所变化,而且即使在某种给定的体架构上也会不同。例如,早期的 x86 处理器使用了中断机制从用户空间迁移到内核空间中,不过新的 IA-32 处理器则提供了一些指令对这种转换进行优化(使用 sysentersysexit 指令)。由于存在大量的方法,最终结果也非常复杂,因此本文将着重于接口细节的表层讨论上。

    要对 Linux 的 SCI 进行改进,您不需要完全理解 SCI 的内部原理,因此我将使用一个简单的系统调用进程(请参看图 1)。每个系统调用都是通过一个单一的入口点多路传入内核。eax 寄存器用来标识应当调用的某个系统调用,这在 C 库中做了指定(来自用户空间应用程序的每个调用)。当加载了系统的 C 库调用索引和参数时,就会调用一个软件中断(0x80 中断),它将执行 system_call 函数(通过中断处理程序),这个函数会按照 eax 内容中的标识处理所有的系统调用。在经过几个简单测试之后,使用 system_call_table 和 eax 中包含的索引来执行真正的系统调用了。从系统调用中返回后,最终执行 syscall_exit,并调用 resume_userspace 返回用户空间。然后继续在 C 库中执行,它将返回到用户应用程序中。

jVCLinux联盟
图 1. 使用中断方法的系统调用的简化流程jVCLinux联盟
jVCLinux联盟

     SCI 的核心是系统调用多路分解表。这个表如图 2 所示,使用 eax 中提供的索引来确定要调用该表中的哪个系统调用(sys_call_table)。图中还给出了表内容的一些样例,以及这些内容的位置。(有关多路分解的更多内容,请参看侧栏 “系统调用多路分解”)

jVCLinux联盟
图 2. 系统调用表和各种链接jVCLinux联盟
 jVCLinux联盟

添加一个 Linux 系统调用

系统调用多路分解jVCLinux联盟

有些系统调用会由内核进一步进行多路分解。例如,BSD(Berkeley Software Distribution)socket 调用(socketbindconnect 等)都与一个单独的系统调用索引(__NR_socketcall)关联在一起,不过在内核中会进行多路分解,通过另外一个参数进入适当的调用。请参看 ./linux/net/socket.c 中的 sys_socketcall 函数。

    添加一个新系统调用主要是一些程序性的操作,但应该注意几件事情。本节将介绍几个系统调用的构造,从而展示它们的实现和用户空间应用程序对它们的使用。

向内核中添加新系统调用,需要执行 3 个基本步骤:

  1. 添加新函数。
  2. 更新头文件。
  3. 针对这个新函数更新系统调用表。

注意: 这个过程忽略了用户空间的需求,我将稍后介绍。

    最常见的情况是,您会为自己的函数创建一个新文件。不过,为了简单起见,我将自己的新函数添加到现有的源文件中。清单 1 所示的前两个函数,是系统调用的简单示例。清单 2 提供了一个使用指针参数的稍微复杂的函数。

jVCLinux联盟
清单 1. 系统调用示例的简单内核函数jVCLinux联盟

                asmlinkage long sys_getjiffies( void ){  return (long)get_jiffies_64();}asmlinkage long sys_diffjiffies( long ujiffies ){  return (long)get_jiffies_64() - ujiffies;}

在清单 1 中,我们为进行 jiffies 监视提供了两个函数。(有关 jiffies 的更多信息,请参看侧栏 “Kernel jiffies”)。第一个函数会返回当前 jiffy,而第二个函数则返回当前值与所传递进来的值之间的差值。注意 asmlinkage 修饰符的使用。这个宏(在 linux/include/asm-i386/linkage.h 中定义)告诉编译器将传递栈中的所有函数参数。

jVCLinux联盟
清单 2. 系统调用示例的最后内核函数jVCLinux联盟

                asmlinkage long sys_pdiffjiffies( long ujiffies,                                  long __user *presult ){  long cur_jiffies = (long)get_jiffies_64();  long result;  int  err = 0;  if (presult) {    result = cur_jiffies - ujiffies;    err = put_user( result, presult );  }  return err ? -EFAULT : 0;}
jVCLinux联盟
内核 jiffiesjVCLinux联盟

Linux 内核具有一个名为 jiffies 的全局变量,它代表从机器启动时算起的时间滴答数。这个变量最初被初始化为 0,每次时钟中断时都会加 1。您可以使用 get_jiffies_64 函数来读取 jiffies 的值,然后使用 jiffies_to_msecs 将其换算成毫秒或使用 jiffies_to_usecs 将其换算成微秒。jiffies 的全局定义和相关函数是在 ./linux/include/linux/jiffies.h 中提供的。

    清单 2 给出了第三个函数。这个函数使用了两个参数:一个 long 类型,以及一个指向被定义为 __userlong 的指针。__user 宏简单告诉编译器(通过 noderef)不应该解除这个指针的引用(因为在当前地址空间中它是没有意义的)。这个函数会计算这两个 jiffies 值之间的差值,然后通过一个用户空间指针将结果提供给用户。put_user 函数将结果值放入 presult 所指定的用户空间位置。如果在这个操作过程中出现错误,将立即返回,您也可以通知用户空间调用者。

     对于步骤 2 来说,我对头文件进行了更新:在系统调用表中为这几个新函数安排空间。对于本例来说,我使用新系统调用号更新了 linux/include/asm/unistd.h 头文件。更新如清单 3 中的黑体所示。

jVCLinux联盟
清单 3. 更新 unistd.h 文件为新系统调用安排空间jVCLinux联盟

                #define __NR_getcpu318#define __NR_epoll_pwait319#define __NR_getjiffies320                #define __NR_diffjiffies321                #define __NR_pdiffjiffies322                #define NR_syscalls323            
jVCLinux联盟

    现在已经有了自己的内核系统调用,以及表示这些系统调用的编号。接下来需要做的是要在这些编号(表索引)和函数本身之间建立一种对等关系。这就是第 3 个步骤,更新系统调用表。如清单 4 所示,我将为这个新函数更新 linux/arch/i386/kernel/syscall_table.S 文件,它会填充清单 3 显示的特定索引。

jVCLinux联盟
清单 4. 使用新函数更新系统调用表jVCLinux联盟

                .long sys_getcpu.long sys_epoll_pwait.long sys_getjiffies/* 320 */.long sys_diffjiffies                .long sys_pdiffjiffies            
jVCLinux联盟

注意: 这个表的大小是由符号常量 NR_syscalls 定义的。

    现在,我们已经完成了对内核的更新。接下来必须对内核重新进行编译,并在测试用户空间应用程序之前使引导使用的新映像变为可用。

对用户内存进行读写

    Linux 内核提供了几个函数,可以用来将系统调用参数移动到用户空间中,或从中移出。方法包括一些基本类型的简单函数(例如 get_userput_user)。要移动一块儿数据(如结构或数组),您可以使用另外一组函数: copy_from_usercopy_to_user。可以使用专门的调用移动以 null 结尾的字符串: strncpy_from_userstrlen_from_user。您也可以通过调用 access_ok 来测试用户空间指针是否有效。这些函数都是在 linux/include/asm/uaccess.h 中定义的。

    您可以使用 access_ok 宏来验证给定操作的用户空间指针。这个函数有 3 个参数,分别是访问类型(VERIFY_READVERIFY_WRITE),指向用户空间内存块的指针,以及块的大小(单位为字节)。如果成功,这个函数就返回 0:

int access_ok( type, address, size );
jVCLinux联盟

    要在内核和用户空间移动一些简单类型(例如 int 或 long 类型),可以使用 get_userput_user 轻松地实现。这两个宏都包含一个值以及一个指向变量的指针。get_user 函数将用户空间地址(ptr)指定的值移动到所指定的内核变量(var)中。 put_user 函数则将内核变量(var)指定的值移动到用户空间地址(ptr)。 如果成功,这两个函数都返回 0:

int get_user( var, ptr );int put_user( var, ptr );
jVCLinux联盟

    要移动更大的对象,例如结构或数组,您可以使用 copy_from_usercopy_to_user 函数。这些函数将在用户空间和内核之间移动完整的数据块。 copy_from_user 函数会将一块数据从用户空间移动到内核空间,copy_to_user 则会将一块数据从内核空间移动到用户空间:

unsigned long copy_from_user( void *to, const void __user *from, jVCLinux联盟
unsigned long n );unsigned long copy_to_user( void *to, const void __user *from,jVCLinux联盟
unsigned long n );
jVCLinux联盟

     最后,您可以使用 strncpy_from_user 函数将一个以 NULL 结尾的字符串从用户空间移动到内核空间中。在调用这个函数之前,您可以通过调用 strlen_user 宏来获得用户空间字符串的大小:

long strncpy_from_user( char *dst, const char __user *src, long count );strlen_user( str );
jVCLinux联盟

    这些函数为内核和用户空间之间的内存移动提供了基本功能。实际上还可以使用另外一些函数(例如减少执行检查数量的函数)。您可以在 uaccess.h 中找到这些函数。

收藏本页到: 365Key | del.icio.us | | 添加到雅虎收藏+
  • 网站帮助 - 广告合作 - 网站地图