free0day 2020-05-25
接上一篇继续分析一下runtime.newproc方法。
newproc函数的签名为 newproc(siz int32, fn *funcval)
siz是传入的参数大小(不是个数);fn对应的是函数,但并不是函数指针,funcval.fn才是真正指向函数代码的指针。
// go/src/runtime/runtime2.go type funcval struct { fn uintptr // 真正指向函数代码的指针 }
在golang中编译器会把类似 go foo() 编译成调用 runtime.newproc 方法。
准备一段代码:
package main import ( "fmt" "time" ) func main() { go printAdd(3, 7) time.Sleep(time.Second) } func printAdd(a, b int) { fmt.Println(a + b) }
开始调试:
关于golang栈结构的分析可以参考 Golang源码学习:使用gdb调试探究Golang函数调用栈结构
:~/study# dlv debug test.go Type ‘help‘ for list of commands. (dlv) b main.main Breakpoint 1 set at 0x4ada0f for main.main() ./test.go:8 (dlv) c > main.main() ./test.go:8 (hits goroutine(1):1 total:1) (PC: 0x4ada0f) 3: import ( 4: "fmt" 5: "time" 6: ) 7: => 8: func main() { 9: go printAdd(3, 7) 10: time.Sleep(time.Second) 11: } 12: 13: func printAdd(a, b int) { // 这里执行几次si,得到下面。 (dlv) disass TEXT main.main(SB) /root/study/test.go test.go:8 0x4ada00 64488b0c25f8ffffff mov rcx, qword ptr fs:[0xfffffff8] test.go:8 0x4ada09 483b6110 cmp rsp, qword ptr [rcx+0x10] test.go:8 0x4ada0d 764f jbe 0x4ada5e test.go:8 0x4ada0f* 4883ec28 sub rsp, 0x28 test.go:8 0x4ada13 48896c2420 mov qword ptr [rsp+0x20], rbp test.go:8 0x4ada18 488d6c2420 lea rbp, ptr [rsp+0x20] // 在main的栈帧中设置newproc的参数siz,16字节 test.go:9 0x4ada1d c7042410000000 mov dword ptr [rsp], 0x10 // 计算printAdd函数对应的funcval结构体的地址放入rax test.go:9 0x4ada24 488d057d5e0300 lea rax, ptr [rip+0x35e7d] // 在main的栈帧中设置newproc的参数fn test.go:9 0x4ada2b 4889442408 mov qword ptr [rsp+0x8], rax // printAdd的参数a test.go:9 0x4ada30 48c744241003000000 mov qword ptr [rsp+0x10], 0x3 // printAdd的参数b test.go:9 0x4ada39 48c744241807000000 mov qword ptr [rsp+0x18], 0x7 // 调用 runtime.newproc => test.go:9 0x4ada42 e80902f9ff call $runtime.newproc test.go:10 0x4ada47 48c7042400ca9a3b mov qword ptr [rsp], 0x3b9aca00 test.go:10 0x4ada4f e86c4afaff call $time.Sleep test.go:11 0x4ada54 488b6c2420 mov rbp, qword ptr [rsp+0x20] test.go:11 0x4ada59 4883c428 add rsp, 0x28 test.go:11 0x4ada5d c3 ret test.go:8 0x4ada5e e88d47fbff call $runtime.morestack_noctxt <autogenerated>:1 0x4ada63 eb9b jmp $main.main
我们来验证一下fn参数:
(dlv) regs ...... Rax = 0x00000000004e38a8 // 存储的是 printAdd 对应的 runtime.funcval 地址。 ...... (dlv) p *(*runtime.funcval)(0x00000000004e38a8) runtime.funcval {fn: 4905584} // 4905584是十进制,转换成十六进制是 0x4ada70。 (dlv) p &printAdd (*)(0x4ada70) // 函数指针与上面的 funcval.fn 相符。
此段仅用来分析go关键字的实现。与下面的 main goroutine无直接关联。
以下注释的场景均为初始化时。
runtime·rt0_go 中调用 runtime.newproc 相关代码:
TEXT runtime·rt0_go(SB),NOSPLIT,$0 ...... // 调用runtime·newproc创建goroutine,指向函数为runtime·main MOVQ $runtime·mainPC(SB), AX // runtime·mainPC就是runtime·main PUSHQ AX // newproc的第二个参数fn,也就是goroutine要执行的函数。 PUSHQ $0 // newproc的第一个参数siz,表示要传入runtime·main中参数的大小,此处为0。 // 创建 main goroutine。非main goroutine也是此方法创建。 CALL runtime·newproc(SB) POPQ AX POPQ AX ...... DATA runtime·mainPC+0(SB)/8,$runtime·main(SB) GLOBL runtime·mainPC(SB),RODATA,$8
func newproc(siz int32, fn *funcval) { // 获取fn函数的参数起始地址,可参考上例中的printAdd,sys.PtrSize的值是8。 argp := add(unsafe.Pointer(&fn), sys.PtrSize) // 获取一个g(m0.g0) gp := getg() // 调用者的pc,也就是执行完此函数返回调用者时的下一条指令地址,本例中是 POPQ AX pc := getcallerpc() systemstack(func() { newproc1(fn, argp, siz, gp, pc) }) }
func newproc1(fn *funcval, argp unsafe.Pointer, narg int32, callergp *g, callerpc uintptr) { _g_ := getg() // 当前g。g0 ...... acquirem() // 禁止抢占 siz := narg siz = (siz + 7) &^ 7 // 使siz为8的整数倍。&^为双目运算符,将运算符左边数据相异的保留,相同位清零。 ...... _p_ := _g_.m.p.ptr() // 当前关联的p。allp[0] newg := gfget(_p_) // 获取一个g,下有分析。 if newg == nil { newg = malg(_StackMin) // 分配一个新g casgstatus(newg, _Gidle, _Gdead) // 更改状态 allgadd(newg) // 加入到allgs切片中 } ...... // 调整newg的栈顶指针 totalSize := 4*sys.RegSize + uintptr(siz) + sys.MinFrameSize // extra space in case of reads slightly beyond frame totalSize += -totalSize & (sys.SpAlign - 1) // align to spAlign sp := newg.stack.hi - totalSize spArg := sp ...... if narg > 0 { memmove(unsafe.Pointer(spArg), argp, uintptr(narg)) // 将参数从调用newproc的函数栈帧中copy到新的g栈帧中。 ...... } // newg.sched存储的是调度相关的信息,调度器要将这些信息装载到cpu中才能运行goroutine。 memclrNoHeapPointers(unsafe.Pointer(&newg.sched), unsafe.Sizeof(newg.sched)) // 将newg.sched结构体清零 newg.sched.sp = sp // 栈顶 newg.stktopsp = sp // 此处只是暂时借用pc属性存储 runtime.goexit + 1 位置的地址。在gostartcallfn会用到。 newg.sched.pc = funcPC(goexit) + sys.PCQuantum // +PCQuantum so that previous instruction is in same function newg.sched.g = guintptr(unsafe.Pointer(newg)) // 存储newg指针 gostartcallfn(&newg.sched, fn) // 将函数与g关联起来。下有分析。 ...... casgstatus(newg, _Gdead, _Grunnable) // 更改状态 ...... runqput(_p_, newg, true) // 存储到运行队列中。 // 初始化时不会执行,mainStarted 在 runtime.main 中设置为 true if atomic.Load(&sched.npidle) != 0 && atomic.Load(&sched.nmspinning) == 0 && mainStarted { wakep() } releasem(_g_.m) }
总结一下初始化时newproc1做的工作:
概括讲就是:获取g->复制参数->设置调度属性->放入队列等调度。
下面来分析以下gfget、gostartcallfn。
整体逻辑为:在p.gFree为空,sched.gFree中不空时,从后者向前者最多转移32个。然后从前者的头部返回一个。如果没有分配栈帧,就分配。
func gfget(_p_ *p) *g { retry: // 如果p.gFree为空,但sched.gFree中不为空,则从其中最多获取32个 if _p_.gFree.empty() && (!sched.gFree.stack.empty() || !sched.gFree.noStack.empty()) { lock(&sched.gFree.lock) // Move a batch of free Gs to the P. for _p_.gFree.n < 32 { // Prefer Gs with stacks. gp := sched.gFree.stack.pop() if gp == nil { gp = sched.gFree.noStack.pop() if gp == nil { break } } sched.gFree.n-- _p_.gFree.push(gp) _p_.gFree.n++ } unlock(&sched.gFree.lock) goto retry } gp := _p_.gFree.pop() // 从列表头部获取一个g if gp == nil { return nil } _p_.gFree.n-- if gp.stack.lo == 0 { // 没有栈就分配栈 // Stack was deallocated in gfput. Allocate a new one. systemstack(func() { gp.stack = stackalloc(_FixedStack) }) gp.stackguard0 = gp.stack.lo + _StackGuard } else { ...... } return gp }
func gostartcallfn(gobuf *gobuf, fv *funcval) { var fn unsafe.Pointer // fn是真正指向函数的指针 if fv != nil { fn = unsafe.Pointer(fv.fn) } else { fn = unsafe.Pointer(funcPC(nilfunc)) } gostartcall(gobuf, fn, unsafe.Pointer(fv)) }
gostartcall主要做了两件事:
func gostartcall(buf *gobuf, fn, ctxt unsafe.Pointer) { sp := buf.sp if sys.RegSize > sys.PtrSize { sp -= sys.PtrSize *(*uintptr)(unsafe.Pointer(sp)) = 0 } sp -= sys.PtrSize // 为返回地址预留空间 // buf.pc 存储的是 funcPC(goexit) + sys.PCQuantum // 将其存储到返回地址是为了伪造成 fn 是被 goexit 调用的,在 fn 执行完后返回 goexit执行,做一些清理工作。 *(*uintptr)(unsafe.Pointer(sp)) = buf.pc buf.sp = sp // 重新赋值 buf.pc = uintptr(fn) // 赋值为函数指针 buf.ctxt = ctxt }