binlog是mysql的关键组成部分,掌握好binlog非常重要,下面我就重点来详解binlog@mikechen
binlog基本概念
binlog全称是Binary Log,翻译过来就是二进制日志,是MySQL数据库的一种日志文件。
binlog的作用
binlog作用:主要用于记录数据库中的修改操作,以便进行数据备份、恢复和复制等操作。
不管用什么存储引擎,只要发生了表数据更新,都会产生 binlog 日志。
体现为如下3点:
1.数据恢复
在数据库出现故障或数据错误时,可以使用binlog来还原数据库到之前的状态。
2.数据复制
MySQL的主从复制依赖于binlog,可以将主数据库的修改操作同步到一个或多个从数据库上。
3.数据备份
通过记录所有的数据库修改操作,binlog可以用于创建完整的数据库备份。
binlog的特点
binlog的特点,主要体现为如下几点:
1.二进制格式
binlog以二进制形式存储,不可读,用于节省磁盘空间和提高性能。
2.追加写入
binlog以追加方式写入,减少对磁盘的随机写入,提高性能。
3.可复制性
binlog可用于主从复制,实现数据复制和分布式架构。
4.事务性
binlog记录操作是事务性的,要么全部成功,要么全部失败。
5.多种格式
支持多种格式,如Statement格式、Row格式和Mixed格式,适用于不同的场景
binlog日志三种模式
binlog 日志有三种格式,分别为 STATMENT 、 ROW 和 MIXED。
1.Statement格式
Statement基于SQL语句的复制( statement-based replication, ),每一条会修改数据的SQL语句会记录到 binlog 中 。
指定statement,记录的内容是SQL语句原文。
比如:执行一条update T set update_time=now where id=1,记录的内容如下。
Statement会记录SQL语句的执行,对于非事务性操作较为适用。
2.Row格式
row记录的内容不再是简单的SQL语句了,还包含操作的具体数据。
如下图所示:
如果一个update语句修改一百行数据,那么这种模式下就会记录100行对应的记录日志。
这种格式需要更大的容量来记录,比较占用空间,适用于事务性操作。
3.Mixed格式
MIXED是基于 STATMENT 和 ROW 两种模式的混合模式。
可以根据操作类型自动选择使用Statement或Row格式,是一种混合模式。
binlog写入机制
binlog的写入时机也非常简单,事务执行过程中,先把日志写到binlog cache,事务提交的时候,再把binlog cache写到binlog文件中。
当执行对数据库表的数据修改操作时,如:插入(INSERT)、更新(UPDATE)和删除(DELETE)等,MySQL会生成相应的binlog事件。
日志刷盘流程,如下图所示:
binlog采用追加写入机制,即新的binlog事件总是被附加到当前binlog文件的末尾。
这种机制有助于减少对磁盘的随机写入,提高了性能。因为磁盘随机写入通常比顺序写入要慢。
binlog是事务性的,这意味着一个事务内的所有SQL语句要么都被记录到binlog中,要么都不会被记录。
如果一个事务失败(如由于完整性约束违反或其他错误),则binlog中的对应事件会被回滚,不会记录到binlog中。
总的来说,binlog的写入机制保证了数据的一致性和完整性,并通过追加写入和事务性写入来提高性能和可靠性。
开启binlog日志
要开启binlog日志,你需要编辑MySQL的配置文件(通常是my.cnf或my.ini)并添加以下配置:
[mysqld] log_bin = /path/to/binlog_filename
log_bin启用binlog日志,指定binlog文件的存储路径和文件名。
然后,重新启动MySQL服务以使配置生效。
验证我们的MySQL数据库是否开启binlog,可以使用show variables like ‘%log_bin%’命令。
mysql> show variables like '%log_bin%'; --------------------------------- -------------------------------- | Variable_name | Value | --------------------------------- -------------------------------- | log_bin | ON |/*这显示ON,表示已经开启binlog*/ | log_bin_basename | /var/lib/mysql/mysql-bin |/*这是binlog日志文件存放的目录和名称*/ | log_bin_index | /var/lib/mysql/mysql-bin.index |/*这是binlog日志文件的索引文件目录和名称*/
需要我们注意其中的两个参数:
- log_bin_basename:这里是配置的binlog日志文件的存放的目录和名称。
- log_bin_index:这个参数配置的是binlog日志的索引文件存储目录和名称,这里面记录了MySQL目前所有的有效的binlog日志文件列表。
binlog和 redolog区别
binlog和redo log是MySQL数据库中的两种不同类型的日志,它们在用途、内容、存储位置、生命周期和写入时机等方面有明显的区别。
1.用途不同
binlog(二进制日志)用于数据库的备份、恢复、复制和迁移。
redo log(重做日志)用于数据库的恢复,确保事务的持久性和一致性。
2.日志内容不同
binlog记录的是SQL语句或数据行的变化。
redo log记录的是事务的物理变化,即对磁盘上数据页的修改。
3.存储位置不同
binlog通常以文本文件形式存储在磁盘上,供备份和复制使用。
redo log是数据库内部的循环写入的二进制日志,不可直接访问。
4.日志的生命周期不同
binlog的生命周期由用户配置决定,可以根据需要手动删除旧的binlog文件。
redo log的生命周期由数据库管理,一般情况下不需要手动操作。
陈睿mikechen
10年+大厂架构经验,资深技术专家,就职于阿里巴巴、淘宝、百度等一线互联网大厂。
关注「mikechen」公众号,获取更多技术干货!
后台回复【面试】即可获取《史上最全阿里Java面试题总结》,后台回复【架构】,即可获取《阿里架构师进阶专题全部合集》