GO可以说是近几年最热门的新兴语言之一了, 一般人看到分布式和大数据就会想到GO,
这个系列的文章会通过研究golang的源代码来分析内部的实现原理, 和CoreCLR不同的是, golang的源代码已经被很多人研究过了, 我将会着重研究他们未提到过的部分.另一点和CoreCLR不同的是, golang的源代码非常易懂, 注释也非常的丰富,
很明显Google的工程师在写代码的时候有考虑其他人会去看这份代码.尽管代码非常易懂, 研究它们还是需要实际运行和调试才能得到更好的理解,
这个系列分析的golang源代码是Google官方的实现的1.9.2版本, 不适用于其他版本和gccgo等其他实现, 运行环境是Ubuntu 16.04 LTS 64bit.编译golang源代码
go的源代码是用go写的, 编译也需要一个可运行的go.
首先我们从官网下载源代码和二进制文件.注意两个压缩包解压出来文件夹名称都是go, 我们解压到以下目录:
源代码: ~/git_go/go_src二进制: ~/git_go/go_bin
编译go之前需要设置环境变量,
GOROOT_BOOTSTRAP
是go二进制文件夹的所在目录,GO_GCFLAGS
是编译go时使用的参数. export GOROOT_BOOTSTRAP=~/git_go/go_binexport GO_GCFLAGS="-N -l"
这里的-N
参数代表禁止优化, -l
参数代表禁止内联, go在编译目标程序的时候会嵌入运行时(runtime)的二进制,
都准备好以后就可以进入go的源代码文件夹执行all.bash
编译了:
编译的结果在~/git_go/go_src/bin
下:
调试golang源代码
之前CoreCLR的系列中我使用了lldb, 在这个系列中我继续沿用这个调试器.
这个系列中使用的是lldb 4.0.以以下源代码(hello.go)为例:
package mainimport ( "fmt" "time")func printNumber(from, to int, c chan int) { for x := from; x <= to; x++ { fmt.Printf("%d\n", x) time.Sleep(1 * time.Millisecond) } c <- 0}func main() { c := make(chan int, 3) go printNumber(1, 3, c) go printNumber(4, 6, c) _, _ = <- c, <- c}
编译源代码使用以下命令, 这里的-l
参数的意思和上面一样, 如果有需要还可以加-N
参数:
~/git_go/go_src/bin/go build -gcflags "-l" hello.go
编译后使用lldb运行:
lldb ./hello
go里面的函数符号名称的命名规则是包名称.函数名称
, 例如主函数的符号名称是main.main
, 运行时中的newobject
的符号名称是runtime.newobject
.
可以看到成功的进入了主函数, 并且有源代码提示.
接下来给按文件名和行数来下断点:然后查看函数的汇编代码:
关于lldb的命令可以查看.
在我使用的环境中lldb可以正常的下断点, 步进和步过go代码或者汇编指令, 但打印变量输出的值有可能是错的, 即使不开启优化.虽然打印变量这个功能不好用, 我们仍然可以直接让go输出我们想要的值,
例如修改runtime/malloc.go
输出当前环境下arena|spans|bitmap区的大小: 修改后进入src
并执行./make.bash
, 然后重新编译目标程序, 运行:
可以看到当前环境下arena是512G, spans是512M, bitmap是16G.
这个方法虽然比较笨, 但是可以在任何情况下输出我们想要的值.此外, go运行时(runtime)的源代码会包括在目标文件中,
例如你对runtime.newobject
下断点可以对go自身的源代码进行调试. 参考链接
接下来我将分析golang的任务调度机制和三色GC的具体实现, 敬请期待.