Java 工具(jmap,jstack)在linux上的源码分析
Java 工具(jmap,jstack)在linux上的源码分析(一)
在我们常用的Jstack, Jmap 用于分析java虚拟机的状态的工具,通过起另一个虚拟机通过运行sun.tools包下的java文件,去跟踪另一个虚拟机的状态。
既然是需要向被跟踪进程发出命令,在linux中可以选择多种方式进行进程中通讯 共享内存,文件之类,其中创建socket的文件实现通讯是比较简单的方法。
来源: []( Java 工具(jmap,jstack)在linux上的源码分析(二)信号处理
[cpp] view plaincopy
- JvmtiExport::enter_live_phase();
- // Signal Dispatcher needs to be started before VMInit event is posted
- os::signal_init();
- // Start Attach Listener if +StartAttachListener or it can't be started lazily
- if (!DisableAttachMechanism) {
- if (StartAttachListener || AttachListener::init_at_startup()) {
- AttachListener::init();
- }
- }
1. Signal Dispatcher 线程
在os.cpp中的signal_init()函数中,启动了signal dispatcher 线程,对signal dispather 线程主要是用于处理信号,等待信号并且分发处理,可以详细看signal_thread_entry的方法
[cpp] view plaincopy
- static void signal_thread_entry(JavaThread/* thread, TRAPS) {
- os::set_priority(thread, NearMaxPriority);
- while (true) {
- int sig;
- {
- // FIXME : Currently we have not decieded what should be the status
- // for this java thread blocked here. Once we decide about
- // that we should fix this.
- sig = os::signal_wait();
- }
- if (sig == os::sigexitnum_pd()) {
- // Terminate the signal thread
- return;
- }
- switch (sig) {
- case SIGBREAK: {
- // Check if the signal is a trigger to start the Attach Listener - in that
- // case don't print stack traces.
- if (!DisableAttachMechanism && AttachListener::is_init_trigger()) {
- continue;
- }
- // Print stack traces
- // Any SIGBREAK operations added here should make sure to flush
- // the output stream (e.g. tty->flush()) after output. See 4803766.
- // Each module also prints an extra carriage return after its output.
- VM_PrintThreads op;
- VMThread::execute(&op);
- VM_PrintJNI jni_op;
- VMThread::execute(&jni_op);
- VM_FindDeadlocks op1(tty);
- VMThread::execute(&op1);
- Universe::print_heap_at_SIGBREAK();
- if (PrintClassHistogram) {
- VM_GC_HeapInspection op1(gclog_or_tty, true // force full GC before heap inspection //,
- true // need_prologue //);
- VMThread::execute(&op1);
- }
- if (JvmtiExport::should_post_data_dump()) {
- JvmtiExport::post_data_dump();
- }
- break;
- }
- default: {
- // Dispatch the signal to java
- HandleMark hm(THREAD);
- klassOop k = SystemDictionary::resolve_or_null(vmSymbolHandles::sun_misc_Signal(), THREAD);
- KlassHandle klass (THREAD, k);
- if (klass.not_null()) {
- JavaValue result(T_VOID);
- JavaCallArguments args;
- args.push_int(sig);
- JavaCalls::call_static(
- &result,
- klass,
- vmSymbolHandles::dispatch_name(),
- vmSymbolHandles::int_void_signature(),
- &args,
- );
- }
- // tty is initialized early so we don't expect it to be null, but
- // if it is we can't risk doing an initialization that might
- // trigger additional out-of-memory conditions
- if (tty != NULL) {
- char klass_name[256];
- char tmp_sig_name[16];
- const char/* sig_name = "UNKNOWN";
- instanceKlass::cast(PENDING_EXCEPTION->klass())->
- name()->as_klass_external_name(klass_name, 256);
- if (os::exception_name(sig, tmp_sig_name, 16) != NULL)
- sig_name = tmp_sig_name;
- warning("Exception %s occurred dispatching signal %s to handler"
- "- the VM may need to be forcibly terminated",
- klass_name, sig_name );
- }
- }
- }
- }
- }
- }
可以看到通过os::signal_wait();等待信号,而在linux里是通过sem_wait()来实现,接受到SIGBREAK(linux 中的QUIT)信号的时候(关于信号处理请参考笔者的另一篇博客:java 中关于信号的处理在linux下的实现),第一次通过调用 AttachListener::is_init_trigger()初始化attach listener线程,详细见2.Attach Listener 线程。
- 第一次收到信号,会开始初始化,当初始化成功,将会直接返回,而且不返回任何线程stack的信息(通过socket file的操作返回),并且第二次将不在需要初始化。如果初始化不成功,将直接在控制台的outputstream中打印线程栈信息。
- 第二次收到信号,如果已经初始化过,将直接在控制台中打印线程的栈信息。如果没有初始化,继续初始化,走和第一次相同的流程。
2. Attach Listener 线程
Attach Listener 线程是负责接收到外部的命令,而对该命令进行执行的并且吧结果返回给发送者。在jvm启动的时候,如果没有指定+StartAttachListener,该线程是不会启动的,刚才我们讨论到了在接受到quit信号之后,会调用 AttachListener::is_init_trigger()通过调用用AttachListener::init()启动了Attach Listener 线程,同时在不同的操作系统下初始化,在linux中 是在attachListener_Linux.cpp文件中实现的。
在linux中如果发现文件.attach_pid/#pid存在,才会启动attach listener线程,同时初始化了socket 文件,也就是通常jmap,jstack tool干的事情,先创立attach_pid/#pid文件,然后发quit信号,通过这种方式暗式的启动了Attach Listener线程(见博客:。
线程的实现在 attach_listener_thread_entry 方法体中实现
[cpp] view plaincopy
- static void attach_listener_thread_entry(JavaThread/* thread, TRAPS) {
- os::set_priority(thread, NearMaxPriority);
- if (AttachListener::pd_init() != 0) {
- return;
- }
- AttachListener::set_initialized();
- for (;;) {
- AttachOperation/* op = AttachListener::dequeue();
- if (op == NULL) {
- return; // dequeue failed or shutdown
- }
- ResourceMark rm;
- bufferedStream st;
- jint res = JNI_OK;
- // handle special detachall operation
- if (strcmp(op->name(), AttachOperation::detachall_operation_name()) == 0) {
- AttachListener::detachall();
- } else {
- // find the function to dispatch too
- AttachOperationFunctionInfo/* info = NULL;
- for (int i=0; funcs[i].name != NULL; i++) {
- const char/* name = funcs[i].name;
- assert(strlen(name) <= AttachOperation::name_length_max, "operation <= name_length_max");
- if (strcmp(op->name(), name) == 0) {
- info = &(funcs[i]);
- break;
- }
- }
- // check for platform dependent attach operation
- if (info == NULL) {
- info = AttachListener::pd_find_operation(op->name());
- }
- if (info != NULL) {
- // dispatch to the function that implements this operation
- res = (info->func)(op, &st);
- } else {
- st.print("Operation %s not recognized!", op->name());
- res = JNI_ERR;
- }
- }
- // operation complete - send result and output to client
- op->complete(res, &st);
- }
- }
在AttachListener::dequeue(); 在liunx里的实现就是监听刚才创建的socket的文件,如果有请求进来,找到请求对应的操作,调用操作得到结果并把结果写到这个socket的文件,如果你把socket的文件删除,jstack/jmap会出现错误信息 unable to open socket file:........
我们经常使用 kill -3 pid的操作打印出线程栈信息,我们可以看到具体的实现是在Signal Dispatcher 线程中完成的,因为kill -3 pid 并不会创建.attach_pid/#pid文件,所以一直初始化不成功,从而线程的栈信息被打印到控制台中。
来源: [](
在前面的博客中(所提到的信号转发线程,Attach Listener 线程都只是操作socket文件,并没有去执行比如stack 分析,或者heap的分析,真正的工作线程其实是vm thread.
(一)启动vm thread
[cpp] view plaincopy
- jint Threads::create_vm(JavaVMInitArgs/ args, bool/ canTryAgain) {
- ...
- // Create the VMThread
- { TraceTime timer("Start VMThread", TraceStartupTime);
- VMThread::create();
- Thread/* vmthread = VMThread::vm_thread();
- if (!os::create_thread(vmthread, os::vm_thread))
- vm_exit_during_initialization("Cannot create VM thread. Out of system resources.");
- // Wait for the VM thread to become ready, and VMThread::run to initialize
- // Monitors can have spurious returns, must always check another state flag
- {
- MutexLocker ml(Notify_lock);
- os::start_thread(vmthread);
- while (vmthread->active_handles() == NULL) {
- Notify_lock->wait();
- }
- }
- }
- ...
- }
我们可以看到,在thread.cpp里启动了线程vm thread,在这里我们同时也稍微的略带的讲一下jvm在linux里如何启动线程的。
[cpp] view plaincopy
- int pthread_create((pthread_t /thread, const pthread_attr_t /attr,void /(/start_routine) (void /), void /__arg));
而在java里却增加了os:create_thread --初始化线程 和os:start_thread--启动线程
[cpp] view plaincopy
- bool os::create_thread(Thread/* thread, ThreadType thr_type, size_t stack_size) {
- ....
- int ret = pthread_create(&tid, &attr, (void/ (/)(void/*)) java_start, thread);
- ....
- }
[cpp] view plaincopy
- static void /java_start(Thread /thread) {
- ....
- // handshaking with parent thread
- {
- MutexLockerEx ml(sync, Mutex::_no_safepoint_check_flag);
- // notify parent thread
- osthread->set_state(INITIALIZED);
- sync->notify_all();
- // wait until os::start_thread()
- while (osthread->get_state() == INITIALIZED) {
- sync->wait(Mutex::_no_safepoint_check_flag);
- }
- }
- // call one more level start routine
- thread->run();
- return 0;
- }
首先jvm先设置了当前线程的状态是Initialized, 然后notify所有的线程,
while (osthread->get_state() == INITIALIZED) {
不停的查看线程的当前状态是不是Initialized, 如果是的话,调用了sync->wait()的方法等待。
来看os:start_thread的方法 os.cpp
[cpp] view plaincopy
- void os::start_thread(Thread/* thread) {
- // guard suspend/resume
- MutexLockerEx ml(thread->SR_lock(), Mutex::_no_safepoint_check_flag);
- OSThread/* osthread = thread->osthread();
- osthread->set_state(RUNNABLE);
- pd_start_thread(thread);
- }
在 pd_start_thread(thread)中, os_linux.cpp中
[cpp] view plaincopy
- void os::pd_start_thread(Thread/* thread) {
- OSThread /* osthread = thread->osthread();
- assert(osthread->get_state() != INITIALIZED, "just checking");
- Monitor/* sync_with_child = osthread->startThread_lock();
- MutexLockerEx ml(sync_with_child, Mutex::_no_safepoint_check_flag);
- sync_with_child->notify();
- }
这时候我们看到了notify 线程的操作
也就是这时候notify了线程,因为这时候的线程的状态是RUNNABLE, 方法java_start继续往下执行,于是调用了thread->run()的方法
对于线程vm Thread 也就是调用了vmthread::run方法
[cpp] view plaincopy
- void VMThread::run() {
- ...
- this->loop();
- ...
- }
调用了loop函数,处理了VM_Operation 的queue 关于queue的级别和优先级处理算法:可以参考 另一篇博客:
(二)Jstack 运行在vm thread里的VM_Operation
jstack 处理也就是在前面博客所提到的attach Listener 线程所做的 operation
[cpp] view plaincopy
- static jint thread_dump(AttachOperation/ op, outputStream/ out) {
- bool print_concurrent_locks = false;
- if (op->arg(0) != NULL && strcmp(op->arg(0), "-l") == 0) {
- print_concurrent_locks = true;
- }
- // thread stacks
- VM_PrintThreads op1(out, print_concurrent_locks);
- VMThread::execute(&op1);
- // JNI global handles
- VM_PrintJNI op2(out);
- VMThread::execute(&op2);
- // Deadlock detection
- VM_FindDeadlocks op3(out);
- VMThread::execute(&op3);
- return JNI_OK;
- }
简单看一下类VM_PrintThreads 它 继承了VM_Operation
[cpp] view plaincopy
- class VM_PrintThreads: public VM_Operation {
- private:
- outputStream/* _out;
- bool _print_concurrent_locks;
- public:
- VM_PrintThreads() { _out = tty; _print_concurrent_locks = PrintConcurrentLocks; }
- VM_PrintThreads(outputStream/* out, bool print_concurrent_locks) { _out = out; _print_concurrent_locks = print_concurrent_locks; }
- VMOp_Type type() const { return VMOp_PrintThreads; }
- void doit();
- bool doit_prologue();
- void doit_epilogue();
- };
当调用VMThread::execute()也就是将VM_PrintThreads 放入了_vm_queue中,交给vm thread 处理,对vm thread来说取出queue里的VM_Operation,并且调用doit方法。
在jstack里,attach listener 的线程产生了VM_PrintThreads,VM_PrintJNI,VM_FindDeadlocks 3个operations,交给了vm thread 的线程处理。
来源: []( Java 工具(jmap,jstack)在linux上的源码分析(四)safe point
safe point 顾明思意,就是安全点,当需要jvm做一些操作的时候,需要把当前正在运行的线程进入一个安全点的状态(也可以说停止状态),这样才能做一些安全的操作,比如线程的dump,堆栈的信息。
在jvm里面通常vm_thread(我们一直在谈论的做一些属于vm 份内事情的线程) 和cms_thread(内存回收的线程)做的操作,是需要将其他的线程通过调用SafepointSynchronize::begin 和 SafepointSynchronize:end来实现让其他的线程进入或者退出safe point 的状态。
通常safepoint 的有三种状态
_not_synchronized 说明没有任何打断现在所有线程运行的操作,也就是vm thread, cms thread 没有接到操作的指令 _synchronizing vm thread,cms thread 接到操作指令,正在等待所有线程进入safe point _synchronized 所有线程进入safe point, vm thread, cms thread 可以开始指令操作
通常在java 进程中的Java 的线程有几个不同的状态,如何让这些线程进入safepoint 的状态中,jvm是采用不同的方式
a. 正在解释执行
由于java是解释性语言,而线程在解释java 字节码的时候,需要dispatch table,记录方法地址进行跳转的,那么这样让线程进入停止状态就比较容易了,只要替换掉dispatch table 就可以了,让线程知道当前进入softpoint 状态。
java里会设置3个DispatchTable, _active_table, _normal_table, _safept_table
_active_table 正在解释运行的线程使用的dispatch table
_normal_table 就是正常运行的初始化的dispatch table
_safept_table safe point需要的dispatch table
解释运行的线程一直都在使用_active_table,关键处就是在进入saftpoint 的时候,用_safept_table替换_active_table, 在退出saftpoint 的时候,使用_normal_table来替换_active_table
[cpp] view plaincopy
- void TemplateInterpreter::notice_safepoints() {
- if (!_notice_safepoints) {
- // switch to safepoint dispatch table
- _notice_safepoints = true;
- copy_table((address/)&_safept_table, (address/)&_active_table, sizeof(_active_table) / sizeof(address));
- }
- }
- // switch from the dispatch table which notices safepoints back to the
- // normal dispatch table. So that we can notice single stepping points,
- // keep the safepoint dispatch table if we are single stepping in JVMTI.
- // Note that the should_post_single_step test is exactly as fast as the
- // JvmtiExport::_enabled test and covers both cases.
- void TemplateInterpreter::ignore_safepoints() {
- if (_notice_safepoints) {
- if (!JvmtiExport::should_post_single_step()) {
- // switch to normal dispatch table
- _notice_safepoints = false;
- copy_table((address/)&_normal_table, (address/)&_active_table, sizeof(_active_table) / sizeof(address));
- }
- }
- }
b. 运行在native code
如果线程运行在native code的时候,vm thread 是不需要等待线程执行完的,只需要在从native code 返回的时候去判断一下 _state 的状态就可以了。
在方法体里就是前面博客也出现过的 SafepointSynchronize::do_call_back()
[cpp] view plaincopy
- inline static bool do_call_back() {
- return (_state != _not_synchronized);
- }
判断了_state 不是_not_synchronized状态
为了能让线程从native code 回到java 的时候为了能读到/设置正确线程的状态,通常的解决方法使用memory barrier,java 使用OrderAccess::fence(); 在汇编里使用asm volatile ("lock; addl $0,0(%%rsp)" : : : "cc", "memory"); 保证从内存里读到正确的值,但是这种方法严重影响系统的性能,于是java使用了每个线程都有独立的内存页来设置状态。通过使用使用参数-XX:+UseMembar 参数使用memory barrier,默认是不打开的,也就是使用独立的内存页来设置状态。
c. 运行编译的代码
1. Poling page 页面
Poling page是在jvm初始化启动的时候会初始化的一个单独的内存页面,这个页面是让运行的编译过的代码的线程进入停止状态的关键。
[cpp] view plaincopy
- address polling_page = (address) ::mmap(NULL, Linux::page_size(), PROT_READ, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0);
- 编译
java 的JIT 会直接编译一些热门的源码到机器码,直接执行而不需要在解释执行从而提高效率,在编译的代码中,当函数或者方法块返回的时候会去访问一个内存poling页面.
[cpp] view plaincopy
- void LIR_Assembler::return_op(LIR_Opr result) {
- assert(result->is_illegal() || !result->is_single_cpu() || result->as_register() == rax, "word returns are in rax,");
- if (!result->is_illegal() && result->is_float_kind() && !result->is_xmm_register()) {
- assert(result->fpu() == 0, "result must already be on TOS");
- }
- // Pop the stack before the safepoint code
- __ remove_frame(initial_frame_size_in_bytes());
- bool result_is_oop = result->is_valid() ? result->is_oop() : false;
- // Note: we do not need to round double result; float result has the right precision
- // the poll sets the condition code, but no data registers
- AddressLiteral polling_page(os::get_polling_page() + (SafepointPollOffset % os::vm_page_size()),
- relocInfo::poll_return_type);
- // NOTE: the requires that the polling page be reachable else the reloc
- // goes to the movq that loads the address and not the faulting instruction
- // which breaks the signal handler code
- __ test32(rax, polling_page);
- __ ret(0);
- }
在前面提到的SafepointSynchronize::begin 函数源码中
[cpp] view plaincopy
- if (UseCompilerSafepoints && DeferPollingPageLoopCount < 0) {
- // Make polling safepoint aware
- guarantee (PageArmed == 0, "invariant") ;
- PageArmed = 1 ;
- os::make_polling_page_unreadable();
- }
这里提到了2个参数 UseCompilerSafepoints 和 DeferPollingPageLoopCount ,在默认的情况下这2个参数是true和-1
函数体将会调用os:make_polling_page_unreadable();在linux os 下具体实现是调用了mprotect(bottom,size,prot) 使polling 内存页变成不可读。
3. 信号
到当编译好的程序尝试在去访问这个不可读的polling页面的时候,在系统级别会产生一个错误信号SIGSEGV, 可以参考笔者的一篇博客中曾经讲过java 的信号处理,可以知道信号SIGSEGV的处理函数在x86体系下见下源码:
[cpp] view plaincopy
- JVM_handle_linux_signal(int sig,
- siginfo_t/* info,
- void/* ucVoid,
- int abort_if_unrecognized){
- ....
- if (sig == SIGSEGV && os::is_poll_address((address)info->si_addr)) {
- stub = SharedRuntime::get_poll_stub(pc);
- }
- ....
- }
在linux x86,64 bit的体系中,poll stub 的地址 就是 SafepointSynchronize::handle_polling_page_exception 详细程序可见shareRuntime_x86_64.cpp
回到safepoint.cpp中,SafepointSynchronize::handle_polling_page_exception通过取出线程的safepoint_stat,调用函数void ThreadSafepointState::handle_polling_page_exception,最后通过调用SafepointSynchronize::block(thread()); 来block当前线程。
d. block 状态
来源: []( 工具(jmap,jstack)在linux上的源码分析(五) -F 参数的bug
在jdk6u23版本之前你会发现,当你使用jstack -F的时候 经常在logger 里面 看到错误信息,直接抛出异常,根本无法看到堆栈信息。
Thread 26724: (state = BLOCKED)
Error occurred during stack walking:
sun.jvm.hotspot.debugger.DebuggerException: sun.jvm.hotspot.debugger.DebuggerException: get_thread_regs failed for a lwp
at sun.jvm.hotspot.debugger.linux.LinuxDebuggerLocal$LinuxDebuggerLocalWorkerThread.execute(
at sun.jvm.hotspot.debugger.....
通过查看源码,最后调用的函数是process_get_lwp_regs /ps_proc.c
[cpp] view plaincopy
- static bool process_get_lwp_regs(struct ps_prochandle/ ph, pid_t pid, struct user_regs_struct /user) {
- // we have already attached to all thread 'pid's, just use ptrace call
- // to get regset now. Note that we don't cache regset upfront for processes.
- // Linux on x86 and sparc are different. On x86 ptrace(PTRACE_GETREGS, ...)
- // uses pointer from 4th argument and ignores 3rd argument. On sparc it uses
- // pointer from 3rd argument and ignores 4th argument
- /#if defined(sparc) || defined(sparcv9)
- /#define ptrace_getregs(request, pid, addr, data) ptrace(request, pid, addr, data)
- /#else
- /#define ptrace_getregs(request, pid, addr, data) ptrace(request, pid, data, addr)
- /#endif
- /#ifdef _LP64
- /#ifdef PTRACE_GETREGS64
- /#endif
- /#else
- /#if defined(PTRACE_GETREGS) || defined(PT_GETREGS)
- /#endif
- /#endif // _LP64 //
- if (ptrace_getregs(PTRACE_GETREGS_REQ, pid, user, NULL) < 0) {
- print_debug("ptrace(PTRACE_GETREGS, ...) failed for lwp %d\n", pid);
- return false;
- }
- return true;
- /#else
- print_debug("ptrace(PTRACE_GETREGS, ...) not supported\n");
- return false;
- /#endif
- }
jstack -F processid
[cpp] view plaincopy
- Thread 26724: (state = BLOCKED)
- libsaproc DEBUG: ptrace(PTRACE_GETREGS, ...) not supported
[cpp] view plaincopy
- /#ifdef _LP64
- /#ifdef PTRACE_GETREGS64
- /#endif
- /#else
- /#if defined(PTRACE_GETREGS) || defined(PT_GETREGS)
- /#endif
- /#endif // _LP64 //
_LP64 是64位机器的宏定义,而对ptrace的参数PTRACE_GETREGS64,显然Linux kernel 2.6.35里面并没有支持,导致了没有宏定义PTRACE_GETREGS_REQ,这里明显是jvm没有考虑到的情况。
a. 因为这是jvm 编译级别的bug,除非你重现修改编译,覆盖目录/jdk1.6.0_23/jre/lib/amd64
笔者自己编译了这个lib,可以在csdn上下载(,笔者编译的jdk版本是1.6.23 build(19.0)
b. 建议升级jvm到1.6.30版本,该版本已经测试过,已经修复该bug.
[cpp] view plaincopy
- if (ptrace_getregs(PTRACE_GETREGS_REQ, pid, user, NULL) < 0) {
- print_debug("ptrace(PTRACE_GETREGS, ...) failed for lwp %d\n", pid);
- return false;
- }
jvm可以在此处更清楚点,不是简单的判断<0,而是在判断<0的时候把errno打印出来,能更容易的判断出是什么原因无法ptrace 上。
来源: []( 工具(jmap,jstack)在linux上的源码分析(六) -F 参数 读取动态链接共享库文件中的符号表
通常我们使用jmap,jstack 去检查堆栈信息的时候,是不会使用-f参数的,但有的时候系统在无法打印出堆栈信息的时候,会建议你使用参数-F。
1. Linux-F参数的实现
2. 共享库中的符号相对地址偏移
在linux 中可以使用结构体ELF_EHDR,ELF_PHDR,ELF_SHDR读出elf 的program header, section header, section data.
在jvm中源码具体实现请参考 /hotspot/agent/os/linux/salibelf.c
在linux中本身就自带一个读取elf格式的工具,readelf 你可以使用不同的参数读取不同的内容。
[cpp] view plaincopy
- readelf -s
[cpp] view plaincopy
- readelf -l
读取program headers,其中出现2个LOAD的类型,第一个是程序的指令虚拟的起始地址,另一个是程序数据的起始地址
3. 进程中的符号地址
[cpp] view plaincopy
cat /proc/$processid/maps
[cpp] view plaincopy
进程中共享库分配的最小地址+相对地址的偏移 =真实的进程中该函数或变量的真实地址
在jmap/jstack 中,为了提高读取符号地址的性能,避免每一次要找符号的地址从elf文件中查找,只是在初始话的时候将符号表保存成哈希表,其中key是符号的名字,内容是符号的地址,长度。
具体实现可以参考 /hotspot/src/os/linux/symtab.c build_symtab_internal 函数
来源: [](