[转帖]MYSQL源码分析（二）--主要代码流程_MySQL, Oracle及数据库讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛

总帖数

每页帖数

1/1页

返回列表

发起投票

查看: 2550 | 回复: 0

主题： [转帖]MYSQL源码分析（二）--主要代码流程

ad222888

注册用户

等级：新兵
经验：66
发帖：134
精华：0
注册：2016-9-25
状态：离线
发送短消息息给ad222888

加好友发送短消息息给ad222888

发消息

发表于：

2018-8-15 9:35:00 | [全部帖] [楼主帖]

楼主

我们从MySQL启动开始，看一下MySQL业务流程。
★ 首先入口函数在目录sql/main.cc中：

int main(int argc, char **argv)
return mysqld_main(argc, argv);

调用了mysqld_main(argc, argv)函数，这个函数在sql/mysqld.cc中

接着开始初始化：
★ MY_INIT(argv[0]);函数位于sql/my_init.cc，用于初始化mysql内部的系统库，MYSQL定义了大量的全局变量用于系统的状态值，这样省去很多函数之间的交互参数，这些全局变量定义在my_static.cc中。
★ 接着初始化变量sys_var_init();
★ 初始化审计接口（这部分用的不多，暂时不深入）mysql_audit_initialize();
★ 初始化日志功能logger.init_base(); 日志是系统的一个重要地方，mysql定义了一个logger类，在文件sql/Logger.hpp中，里面定义了一系列的成员函数，具体可以参照logger.hpp中的注释，很详细。（后续会专门针对日志模块做一次分析）
★ 接着就初始化配置信息了，
开始之后，又是一大堆全局变量初始化。
init_thread_environment()初始化线程环境。（这个就是线程池了）
mysql_init_variables()初始化配置变量，
这边给我最大的感悟就是，MYSQL在获取或者修改一些变量时，一定会先与之相关的系统变量都读出来确认一遍，全部没问题后才修改，有问题都会有相应的日志（所以日志模块必须最先初始化）
如果初始化失败，会调用mysql_server_end() ，而mysql_server_end()实际上是一个宏定义

#define mysql_server_end() mysql_client_plugin_deinit() //宏定义也可以这样用

mysql_client_plugin_deinit()用于终止mysql server的线程。
★ 初始化server的模块init_server_components()

table_def_init() || hostname_cache_init(); //初始化table cache
query_cache_init(); //初始化查询cache
#ifdef HAVE_REPLICATION
init_slave_list(); //如果有复制，还要初始化备机的状态list
#endif

后面还有一些cache初始化如

★ network_init();//初始化网络模块，创建socket监听

这个流程和传统的tcp服务端代码基本一样，单独开启一个线程用于监听， set_ports();
函数用于初始化端口，默认为3306。

ip_sock= create_socket(ai, AF_INET, &a);
if (ip_sock == INVALID_SOCKET)
ip_sock= create_socket(ai, AF_INET6, &a);
// Report user-error if we failed to create a socket.
if (ip_sock == INVALID_SOCKET)
sql_perror(ER_DEFAULT(ER_IPSOCK_ERROR)); /* purecov: tested */
unireg_abort(1); /* purecov: tested */

现在IPV4上创建侦听，如果失败了，再在ipv6上创建侦听。
有时候，mysql所用的端口不会及时释放（重启，关闭的时候），这里有个算法

for (waited= 0, retry= 1; ; retry++, waited+= this_wait)
if (((ret= bind(ip_sock, a->ai_addr, a->ai_addrlen)) >= 0 ) ||
(socket_errno != SOCKET_EADDRINUSE) ||
(waited >= mysqld_port_timeout))
break;
sql_print_information("Retrying bind on TCP/IP port %u", mysqld_port);
this_wait= retry * retry / 3 + 1;
sleep(this_wait);

他会按照

Sleep intervals: 1, 2, 4, 6, 9, 13, 17, 22, ...
Retry at second: 1, 3, 7, 13, 22, 35, 52, 74, ...

来省资源。
接着就是三种系统的侦听代码，原理都是一样的。

★ start_signal_handler();// 创建pid文件

调用create_pid_file()，调用了自己封装的mysql_file_write()把内容写到了文件，mysql_file_write()也是个宏定义。

★ if (mysql_rm_tmp_tables() || acl_init(opt_noacl) ||
my_tz_init((THD *)0, default_tz_name, opt_bootstrap))

删除tmp_table并初始化数据库级别的权限。

★
init_status_vars(); //初始化mysql中的status变量
inlog_unsafe_map_init();
initialize_information_schema_acl();
execute_ddl_log_recovery();
create_shutdown_thread();

未启动先保护，这样异常出现时，系统不会直接崩掉，同时会尽可能的多保留下信息。

★
start_handle_manager(); //创建manager线程
mysql_thread_create(key_thread_handle_manager, &hThread, &connection_attrib, handle_manager, 0)
★ handle_connections_sockets();

主要处理函数，
一系列异常保护之后，如果系统收到新的连接，就创建新的线程处理之create_new_thread(thd);
这里可以看出在创建线程之前，有大部分的代码用来检查内容是否有问题，大约占了2/3，所以异常保护，入参校验是很重要的。

★ 对当前连接数检测connection_count，先对互斥量LOCK_connection_count枷锁，如果大于``max_connections+1，则报错，没有问题，才新建线程，（一个典型的互斥线程）,ok,现在线程创建成功了。

之后的一段代码一度让我很费解。前前后后看了很久，终于搞明白流程是怎么继续往下面走的。以下是整个过程：
★ 在create_new_thread(thd);的末尾，有一行代码：

MYSQL_CALLBACK(thread_scheduler, add_connection, (thd));同样他是一个宏：

#define MYSQL_CALLBACK(OBJ, FUNC, PARAMS) \
do { \
if ((OBJ) && ((OBJ)->FUNC)) \
(OBJ)->FUNC PARAMS; \
} while (0)

这样，这个代码就是调用thread_scheduler的add_connection函数，参数是(thd)。
★ 继续看的定义：（代码在scheduler.cc里面）

scheduler_functions *thread_scheduler= NULL;

scheduler_functions的定义：

struct scheduler_functions
uint max_threads;
bool (*init)(void);
bool (*init_new_connection_thread)(void);
void (*add_connection)(THD *thd);
void (*thd_wait_begin)(THD *thd, int wait_type);
void (*thd_wait_end)(THD *thd);
void (*post_kill_notification)(THD *thd);
bool (*end_thread)(THD *thd, bool cache_thread);
void (*end)(void);

可以看得出来，add_connection是他这个结构的第四个成员，是一个成员变量。
★ Mysql给thread_scheduler提供了两种值，一种单线程的情况，一种是多线程的情况。单线程就是每次只有一个用户连接，多线程用的比较多。
单线程：

static scheduler_functions one_thread_scheduler_functions=
1, // max_threads
NULL, // init
init_new_connection_handler_thread, // init_new_connection_thread
#ifndef EMBEDDED_LIBRARY
handle_connection_in_main_thread, // add_connection
#else
NULL, // add_connection
#endif // EMBEDDED_LIBRARY
NULL, // thd_wait_begin
NULL, // thd_wait_end
NULL, // post_kill_notification
no_threads_end, // end_thread
NULL, // end

多线程：

#ifndef EMBEDDED_LIBRARY
static scheduler_functions one_thread_per_connection_scheduler_functions=
0, // max_threads
NULL, // init
init_new_connection_handler_thread, // init_new_connection_thread
create_thread_to_handle_connection, // add_connection
NULL, // thd_wait_begin
NULL, // thd_wait_end
NULL, // post_kill_notification
one_thread_per_connection_end, // end_thread
NULL, // end
#endif // EMBEDDED_LIBRARY

EMBEDDED_LIBRARY是一种用于开发板的库。
★ 那么MYSQL是怎么知道当前thread_scheduler的值呢，这个就是我忽视的问题。在上文所述，logger.init()之后，mysql调用了一个init_common_variables(）函数，里面初始化了这个变量的值。
在init_common_variables()中调用了一个get_options()函数：

#ifdef EMBEDDED_LIBRARY
one_thread_scheduler();
#else
if (thread_handling <= SCHEDULER_ONE_THREAD_PER_CONNECTION)
one_thread_per_connection_scheduler();
else /* thread_handling == SCHEDULER_NO_THREADS) */
one_thread_scheduler();
#endif

我们这边多线程用的比较多，所以从上述的函数，参照多线程的结构体，上述回调函数就是调用了create_thread_to_handle_connection这个函数。
找到这个函数（在mysqld.cc里），流程继续：

★ 在create_thread_to_handle_connection中：

if ((error= mysql_thread_create(key_thread_one_connection,
&thd->real_id, &connection_attrib,
handle_one_connection,
(void*) thd)))

创建一个线程，并调用handle_one_connection函数
★ 在handle_one_connection中继续调用do_handle_one_connection（）
★ 之后又是一个回调函数：

MYSQL_CALLBACK_ELSE(thread_scheduler, init_new_connection_thread, (), 0)

★ 找到init_new_connection_thread（），里面调用了my_thread_init（）到目前为止，才算创建了一个新的线程
★ 在进行一些确认过程后，终于来到了do_command(thd)
★ 在接收到command的时候，mysql对command做了一些简单的处理（后来我才知道，这个叫做预处理。。。），就开始分发dispatch_command（）
★ 在dispatch_command（）中，有一个巨大的switch语句，里面涵盖了MYSQL支持的所有语句，这些语句在mysql_com.h中定义

enum enum_server_command
COM_SLEEP, COM_QUIT, COM_INIT_DB, COM_QUERY, COM_FIELD_LIST,
COM_CREATE_DB, COM_DROP_DB, COM_REFRESH, COM_SHUTDOWN, COM_STATISTICS,
COM_PROCESS_INFO, COM_CONNECT, COM_PROCESS_KILL, COM_DEBUG, COM_PING,
COM_TIME, COM_DELAYED_INSERT, COM_CHANGE_USER, COM_BINLOG_DUMP,
COM_TABLE_DUMP, COM_CONNECT_OUT, COM_REGISTER_SLAVE,
COM_STMT_PREPARE, COM_STMT_EXECUTE, COM_STMT_SEND_LONG_DATA, COM_STMT_CLOSE,
COM_STMT_RESET, COM_SET_OPTION, COM_STMT_FETCH, COM_DAEMON,
/* don't forget to update const char *command_name[] in sql_parse.cc */
/* Must be last */
COM_END

★ 我们以查询语句为例
在收到查询指令后，mysql还是先预处理，然后在处理:

mysql_parse(thd, thd->query(), thd->query_length(), &end_of_stmt);

解析查询语句
★ 在mysql_parse函数中，有段注释：

Warning.
The purpose of query_cache_send_result_to_client() is to lookup the
query in the query cache first, to avoid parsing and executing it.
So, the natural implementation would be to:
- first, call query_cache_send_result_to_client,
- second, if caching failed, initialise the lexical and syntactic parser.
The problem is that the query cache depends on a clean initialization
of (among others) lex->safe_to_cache_query and thd->server_status,
which are reset respectively in
- lex_start()
- mysql_reset_thd_for_next_command()
So, initializing the lexical analyser *before* using the query cache
is required for the cache to work properly.
FIXME: cleanup the dependencies in the code to simplify this.

他大概的意思是：本来mysql应该先调用query_cache_send_result_to_client()在query_cache中查询该语句，加快查询速度。如果失败，在调用lex_start()和mysql_reset_thd_for_next_command()来初始化thd，在解析sql。但是查询cache也需要干净的thd，只能先调用lex_start()和mysql_reset_thd_for_next_command()来初始化thd了，这样导致代码和逻辑有悖。
★ 好，作者说的很清楚了，那么我们接下来，就应该先查cache，查询不到，再进行命令解析。

lex_start(thd);
query_cache_send_result_to_client(thd, (char*) inBuf, length) sql_command
mysql_execute_command(thd);

★ 在mysql_execute_command()中，先确定command要对哪张表操作

lex->first_lists_tables_same();

根据该表的状态，会做一些预处理，尽量减少之后的操作对表的影响（因为目前还不知道这条指令执行之后，会对数据库产生什么样的影响）做好保护是必须的。
★ 然后有个switch语句，他决定了command属于哪种类型，
这些类型定义在sql_lex.h中：

enum enum_sql_command {
SQLCOM_SELECT, SQLCOM_CREATE_TABLE, SQLCOM_CREATE_INDEX, SQLCOM_ALTER_TABLE,
SQLCOM_UPDATE, SQLCOM_INSERT, SQLCOM_INSERT_SELECT,
SQLCOM_DELETE, SQLCOM_TRUNCATE, SQLCOM_DROP_TABLE, SQLCOM_DROP_INDEX,
SQLCOM_SHOW_DATABASES, SQLCOM_SHOW_TABLES, SQLCOM_SHOW_FIELDS,
SQLCOM_SHOW_KEYS, SQLCOM_SHOW_VARIABLES, SQLCOM_SHOW_STATUS,
SQLCOM_SHOW_ENGINE_LOGS, SQLCOM_SHOW_ENGINE_STATUS, SQLCOM_SHOW_ENGINE_MUTEX,
SQLCOM_SHOW_PROCESSLIST, SQLCOM_SHOW_MASTER_STAT, SQLCOM_SHOW_SLAVE_STAT,
SQLCOM_SHOW_GRANTS, SQLCOM_SHOW_CREATE, SQLCOM_SHOW_CHARSETS,
SQLCOM_SHOW_COLLATIONS, SQLCOM_SHOW_CREATE_DB, SQLCOM_SHOW_TABLE_STATUS,
SQLCOM_SHOW_TRIGGERS,
SQLCOM_LOAD,SQLCOM_SET_OPTION,SQLCOM_LOCK_TABLES,SQLCOM_UNLOCK_TABLES,
SQLCOM_GRANT,
SQLCOM_CHANGE_DB, SQLCOM_CREATE_DB, SQLCOM_DROP_DB, SQLCOM_ALTER_DB,
SQLCOM_REPAIR, SQLCOM_REPLACE, SQLCOM_REPLACE_SELECT,
SQLCOM_CREATE_FUNCTION, SQLCOM_DROP_FUNCTION,
SQLCOM_REVOKE,SQLCOM_OPTIMIZE, SQLCOM_CHECK,
SQLCOM_ASSIGN_TO_KEYCACHE, SQLCOM_PRELOAD_KEYS,
SQLCOM_FLUSH, SQLCOM_KILL, SQLCOM_ANALYZE,
SQLCOM_ROLLBACK, SQLCOM_ROLLBACK_TO_SAVEPOINT,
SQLCOM_COMMIT, SQLCOM_SAVEPOINT, SQLCOM_RELEASE_SAVEPOINT,
SQLCOM_SLAVE_START, SQLCOM_SLAVE_STOP,
SQLCOM_BEGIN, SQLCOM_CHANGE_MASTER,
SQLCOM_RENAME_TABLE,
SQLCOM_RESET, SQLCOM_PURGE, SQLCOM_PURGE_BEFORE, SQLCOM_SHOW_BINLOGS,
SQLCOM_SHOW_OPEN_TABLES,
SQLCOM_HA_OPEN, SQLCOM_HA_CLOSE, SQLCOM_HA_READ,
SQLCOM_SHOW_SLAVE_HOSTS, SQLCOM_DELETE_MULTI, SQLCOM_UPDATE_MULTI,
SQLCOM_SHOW_BINLOG_EVENTS, SQLCOM_DO,
SQLCOM_SHOW_WARNS, SQLCOM_EMPTY_QUERY, SQLCOM_SHOW_ERRORS,
SQLCOM_SHOW_STORAGE_ENGINES, SQLCOM_SHOW_PRIVILEGES,
SQLCOM_HELP, SQLCOM_CREATE_USER, SQLCOM_DROP_USER, SQLCOM_RENAME_USER,
SQLCOM_REVOKE_ALL, SQLCOM_CHECKSUM,
SQLCOM_CREATE_PROCEDURE, SQLCOM_CREATE_SPFUNCTION, SQLCOM_CALL,
SQLCOM_DROP_PROCEDURE, SQLCOM_ALTER_PROCEDURE,SQLCOM_ALTER_FUNCTION,
SQLCOM_SHOW_CREATE_PROC, SQLCOM_SHOW_CREATE_FUNC,
SQLCOM_SHOW_STATUS_PROC, SQLCOM_SHOW_STATUS_FUNC,
SQLCOM_PREPARE, SQLCOM_EXECUTE, SQLCOM_DEALLOCATE_PREPARE,
SQLCOM_CREATE_VIEW, SQLCOM_DROP_VIEW,
SQLCOM_CREATE_TRIGGER, SQLCOM_DROP_TRIGGER,
SQLCOM_XA_START, SQLCOM_XA_END, SQLCOM_XA_PREPARE,
SQLCOM_XA_COMMIT, SQLCOM_XA_ROLLBACK, SQLCOM_XA_RECOVER,
SQLCOM_SHOW_PROC_CODE, SQLCOM_SHOW_FUNC_CODE,
SQLCOM_ALTER_TABLESPACE,
SQLCOM_INSTALL_PLUGIN, SQLCOM_UNINSTALL_PLUGIN,
SQLCOM_SHOW_AUTHORS, SQLCOM_BINLOG_BASE64_EVENT,
SQLCOM_SHOW_PLUGINS,
SQLCOM_SHOW_CONTRIBUTORS,
SQLCOM_CREATE_SERVER, SQLCOM_DROP_SERVER, SQLCOM_ALTER_SERVER,
SQLCOM_CREATE_EVENT, SQLCOM_ALTER_EVENT, SQLCOM_DROP_EVENT,
SQLCOM_SHOW_CREATE_EVENT, SQLCOM_SHOW_EVENTS,
SQLCOM_SHOW_CREATE_TRIGGER,
SQLCOM_ALTER_DB_UPGRADE,
SQLCOM_SHOW_PROFILE, SQLCOM_SHOW_PROFILES,
SQLCOM_SIGNAL, SQLCOM_RESIGNAL,
SQLCOM_SHOW_RELAYLOG_EVENTS,
When a command is added here, be sure it's also added in mysqld.cc
in "struct show_var_st status_vars[]= {" ...
/* This should be the last !!! */
SQLCOM_END

★ 我们仍然以查询命令为例。找到

case SQLCOM_SELECT:
thd->status_var.last_query_cost= 0.0;
lex->exchange != NULL implies SELECT .. INTO OUTFILE and this
requires FILE_ACL access.
ulong privileges_requested= lex->exchange ? SELECT_ACL | FILE_ACL :
SELECT_ACL;
if (all_tables)
res= check_table_access(thd,
privileges_requested,
all_tables, FALSE, UINT_MAX, FALSE);
else
res= check_access(thd, privileges_requested, any_db, NULL, NULL, 0, 0);
if (res)
break;
res= execute_sqlcom_select(thd, all_tables);
break;

重置查询消耗时间：thd->status_var.last_query_cost= 0.0;
检查用户权限：check_table_access
执行select命令execute_sqlcom_select
之后就是命令的解析，处理，以及然后查询，规整结果集。下次笔记再说。

本版精华
热门帖子

操作引用/回复

总帖数

每页帖数

1/1页

返回列表

用户登录

Weblogic中间件技术论坛

Tuxedo中间件技术论坛

数据库论坛

Java论坛

Linux/unix论坛

网站地图