Lua性能优化技巧（二）：基本事实

在运行任何代码之前，Lua都会把源代码翻译（预编译）成一种内部的格式。这种格式是一个虚拟机指令序列，与真实的CPU所执行的机器码类似。之后，这个内部格式将会被由一个包含巨大的switch结构的while循环组成的C代码解释执行，switch中的每个case对应一条指令。

可能你已经在别处了解到，从5.0版开始，Lua使用一种基于寄存器的虚拟机。这里所说的虚拟机“寄存器”与真正的CPU寄存器并不相同，因为后者难于移植，而且数量非常有限。Lua使用一个栈（通过一个数组和若干索引来实现）来提供寄存器。每个活动的函数都有一个激活记录，也就是栈上的一个可供该函数存储寄存器的片段。因此，每个函数都有自己的寄存器[1]。一个函数可以使用最多250个寄存器，因为每个指令只有8位用于引用一个寄存器。

由于寄存器数目众多，因此Lua预编译器可以把所有的局部变量都保存在寄存器里。这样带来的好处是，访问局部变量会非常快。例如，如果a和b是局部变量，语句

代码如下：

a = a + b

将只会生成一个指令：

代码如下：

ADD 0 0 1

（假设a和b在寄存器里分别对应0和1）。作为对比，如果a和b都是全局变量，那么这段代码将会变成：

代码如下：

GETGLOBAL 0 0 ; a

GETGLOBAL 1 1 ; b

ADD 0 0 1

SETGLOBAL 0 0 ; a

因此，可以很简单地得出在Lua编程时最重要的性能优化方式：使用局部变量！

如果你想压榨程序的性能，有很多地方都可以使用这个方法。例如，如果你要在一个很长的循环里调用一个函数，可以预先将这个函数赋值给一个局部变量。比如说如下代码：

代码如下：

for i = 1, 1000000 do

    local x = math.sin(i)

end

比下面这段要慢30%：

代码如下：

local sin = math.sin

for i = 1, 1000000 do

    local x = sin(i)

end

访问外部局部变量（或者说，函数的上值）没有直接访问局部变量那么快，但依然比访问全局变量要快一些。例如下面的代码片段：

代码如下：

function foo (x)

    for i = 1, 1000000 do

        x = x + math.sin(i)

    end

    return x

end

print(foo(10))

可以优化为在foo外声明一次sin：

代码如下：

local sin = math.sin

function foo (x)

    for i = 1, 1000000 do

        x = x + sin(i)

    end

    return x

end

print(foo(10))

第二段代码比前者要快30%。

尽管比起其他语言的编译器来说，Lua的编译器非常高效，但是编译依然是重体力活。因此，应该尽可能避免运行时的编译（例如使用loadstring函数），除非你真的需要有如此动态要求的代码，例如由用户输入的代码。只有很少的情况下才需要动态编译代码。

例如，下面的代码创建一个包含返回常数值1到100000的若干个函数的表：

代码如下：

local lim = 10000

local a = {}

for i = 1, lim do

    a[i] = loadstring(string.format("return %d", i))

end

print(a[10]()) --> 10

执行这段代码需要1.4秒。

通过使用闭包，我们可以避免使用动态编译。下面的代码只需要十分之一的时间完成相同的工作：

代码如下：

function fk (k)

    return function () return k end

end

local lim = 100000

local a = {}

for i = 1, lim do a[i] = fk(i) end


print(a[10]()) --> 10

Lua性能优化技巧（二）：基本事实

80193653

相关推荐

Linux内存管理-预备篇(寄存器)

高性能 Lua 技巧（译）

深入分析golang多值返回以及闭包的实现

android反编译----smali Wiki翻译--寄存器

Linux系统对IO端口和IO内存的管理

五大元素组成JVM结构

嵌入式学习之ARM中断

TX2440 裸跑实验-汇编C语言混编(ADS1.2编译) 进阶(二)

ARM汇编指令集学习笔记

Linux C语言内联汇编使用

3.1 设计自己的计算机

【转帖】内存与寄存器的时间快慢

存储层次（Memory hierarchy）、寄存器（Register）、缓存（Cache）

AD7190的小总结