binlog日志详解(看这篇就够了)

binlog日志详解(看这篇就够了)-mikechen

binlog是mysql的关键组成部分,掌握好binlog非常重要,下面我就重点来详解binlog@mikechen

binlog基本概念

binlog全称是Binary Log,翻译过来就是二进制日志,是MySQL数据库的一种日志文件。

 

binlog的作用

binlog作用:主要用于记录数据库中的修改操作,以便进行数据备份、恢复和复制等操作。

不管用什么存储引擎,只要发生了表数据更新,都会产生 binlog 日志。

binlog日志详解(看这篇就够了)-mikechen

体现为如下3点:

1.数据恢复

在数据库出现故障或数据错误时,可以使用binlog来还原数据库到之前的状态。

2.数据复制

MySQL的主从复制依赖于binlog,可以将主数据库的修改操作同步到一个或多个从数据库上。

3.数据备份

通过记录所有的数据库修改操作,binlog可以用于创建完整的数据库备份。

 

binlog的特点

binlog的特点,主要体现为如下几点:

1.二进制格式

binlog以二进制形式存储,不可读,用于节省磁盘空间和提高性能。

 

2.追加写入

binlog以追加方式写入,减少对磁盘的随机写入,提高性能。

 

3.可复制性

binlog可用于主从复制,实现数据复制和分布式架构。

 

4.事务性

binlog记录操作是事务性的,要么全部成功,要么全部失败。

 

5.多种格式

支持多种格式,如Statement格式、Row格式和Mixed格式,适用于不同的场景

 

binlog日志三种模式

binlog 日志有三种格式,分别为 STATMENT 、 ROW 和 MIXED。

1.Statement格式

Statement基于SQL语句的复制( statement-based replication, ),每一条会修改数据的SQL语句会记录到 binlog 中 。

指定statement,记录的内容是SQL语句原文。

比如:执行一条update T set update_time=now where id=1,记录的内容如下。

binlog日志详解(看这篇就够了)-mikechen

Statement会记录SQL语句的执行,对于非事务性操作较为适用。

 

2.Row格式

row记录的内容不再是简单的SQL语句了,还包含操作的具体数据。

如下图所示:

binlog日志详解(看这篇就够了)-mikechen

如果一个update语句修改一百行数据,那么这种模式下就会记录100行对应的记录日志。

这种格式需要更大的容量来记录,比较占用空间,适用于事务性操作。

 

3.Mixed格式

MIXED是基于 STATMENT 和 ROW 两种模式的混合模式。

可以根据操作类型自动选择使用Statement或Row格式,是一种混合模式。

 

binlog写入机制

binlog的写入时机也非常简单,事务执行过程中,先把日志写到binlog cache,事务提交的时候,再把binlog cache写到binlog文件中。

当执行对数据库表的数据修改操作时,如:插入(INSERT)、更新(UPDATE)和删除(DELETE)等,MySQL会生成相应的binlog事件。

日志刷盘流程,如下图所示:

binlog日志详解(看这篇就够了)-mikechen

binlog采用追加写入机制,即新的binlog事件总是被附加到当前binlog文件的末尾。

这种机制有助于减少对磁盘的随机写入,提高了性能。因为磁盘随机写入通常比顺序写入要慢。

binlog是事务性的,这意味着一个事务内的所有SQL语句要么都被记录到binlog中,要么都不会被记录。

如果一个事务失败(如由于完整性约束违反或其他错误),则binlog中的对应事件会被回滚,不会记录到binlog中。

总的来说,binlog的写入机制保证了数据的一致性和完整性,并通过追加写入和事务性写入来提高性能和可靠性。

 

开启binlog日志

要开启binlog日志,你需要编辑MySQL的配置文件(通常是my.cnf或my.ini)并添加以下配置:

[mysqld]
log_bin = /path/to/binlog_filename

log_bin启用binlog日志,指定binlog文件的存储路径和文件名。

然后,重新启动MySQL服务以使配置生效。

验证我们的MySQL数据库是否开启binlog,可以使用show variables like ‘%log_bin%’命令。

mysql> show variables like '%log_bin%';
 --------------------------------- -------------------------------- 
| Variable_name                   | Value                          |
 --------------------------------- -------------------------------- 
| log_bin                         | ON                             |/*这显示ON,表示已经开启binlog*/
| log_bin_basename                | /var/lib/mysql/mysql-bin       |/*这是binlog日志文件存放的目录和名称*/
| log_bin_index                   | /var/lib/mysql/mysql-bin.index |/*这是binlog日志文件的索引文件目录和名称*/

需要我们注意其中的两个参数:

  • log_bin_basename:这里是配置的binlog日志文件的存放的目录和名称。
  • log_bin_index:这个参数配置的是binlog日志的索引文件存储目录和名称,这里面记录了MySQL目前所有的有效的binlog日志文件列表。

 

binlog和 redolog区别

binlog和redo log是MySQL数据库中的两种不同类型的日志,它们在用途、内容、存储位置、生命周期和写入时机等方面有明显的区别。

1.用途不同

binlog(二进制日志)用于数据库的备份、恢复、复制和迁移。

redo log(重做日志)用于数据库的恢复,确保事务的持久性和一致性。

 

2.日志内容不同

binlog记录的是SQL语句或数据行的变化。

redo log记录的是事务的物理变化,即对磁盘上数据页的修改。

 

3.存储位置不同

binlog通常以文本文件形式存储在磁盘上,供备份和复制使用。

redo log是数据库内部的循环写入的二进制日志,不可直接访问。

 

4.日志的生命周期不同

binlog的生命周期由用户配置决定,可以根据需要手动删除旧的binlog文件。

redo log的生命周期由数据库管理,一般情况下不需要手动操作。

陈睿mikechen

10年+大厂架构经验,资深技术专家,就职于阿里巴巴、淘宝、百度等一线互联网大厂。

关注「mikechen」公众号,获取更多技术干货!

后台回复面试即可获取《史上最全阿里Java面试题总结》,后台回复架构,即可获取《阿里架构师进阶专题全部合集

评论交流
    说说你的看法