PostgreSQL与MySQL的那些事(对比)
一、前言
当前国内的现状,互联网公司使用MySQL的较多,PostgreSQL的使用比例反而不高,相信看到PG的新特性后,你会爱上她。当然MySQL作为最流行的数据库,依然会吸引大部分人的眼球。
PostgreSQL标榜自己是世界上最先进的开源数据库,甚至PG粉丝或者一些PGER宣称,她可以和Oracle相媲美(虽然PG很强大,但是和Oracle还是有差距的,当然PG优势也是显而易见的),而且没有那么昂贵的价格和傲慢的客服。当然PG功能完善和强大,最早始于9版本,在10版本快速发展,增加很多功能和特性。PostgreSQL是完全由社区驱动的开源项目,他的核心代码,都是由社区维护,商用版本都是基于PG做的二次开发,像国内的瀚高公司,乘数科技,国外的第二象限,EDB。
MySQL 是最流行的开源数据。MySQL被卖几次后,最终落到Oracle公司的囊中。正是因此,MySQL之父Monty,修改了MySQL的源代码,创立了MariaDB分支。当然不得不提另一个重要的分支,percana公司的Percona Server。Percona公司更擅长MySQL运维,开发了很多非常实用运维工具,而且都已经开源,并回馈给社区,像XtraBackup和pt-Toolkits工具。
MySQL背后是成熟的商业公司(Oracle有自己的MySQL企业版,收费,有许多社区版没有的 特性),而PostgreSQL背后是一个庞大的志愿开发组,相比而言,PostgreSQL的商业性质更少一些,他没有所谓的PostgreSQL企业版,但是存在基于PG开发的一些企业级的PG数据库,比如EDB,Highgo DB。
一、开源方面
PostgreSQL: The world’s most advanced open source database
开源协议:PostgreSQL基于自由的BSD/MIT许可,组织可以使用、复制、修改和重新分发代码,只需要提供一个版权声明即可。
PG的开源协议特别灵活,任何公司的和个人都可以把PG作为一个产品销售,而不需要像MySQL那样必须修改大部分代码才可以作为公司的产品。
MySQL:World’s Most Popular Open Source Database
开源协议:核心代码基于GPL或Commercial License
MySQL的开源协议是基于GPL协议,任何公司都可以免费使用,不允许修改后和衍生的代码做为闭源的商业软件发布和销售,MySQL的版权在甲骨文手中,甲骨文可以推了其商业闭源版本。
二、ACID支持方面
PostgreSQL支持事务的强一致性,事务保证性好,完全支持ACID特性。
MySQL只有innodb引擎支持事务,事务一致性保证上可根据实际需求调整,为了最大限度的保护数据,MySQL可配置双一模式,对ACID的支持上比PG稍弱弱。
三、SQL标准的支持方面
PostgreSQL几乎支持所有的SQL标准,支持类型相当丰富。
MySQL只支持部分SQL标准,相比于PG支持类型稍弱。
四、复制
MySQL的复制是基于binlog的逻辑异步复制,无法实现同步复制
- 复制模式
- 一主一备
- 一主多备
- 级联复制
- 循环复制
- 主主复制
数据流转优势:通过canal增量数据的订阅和消费,可以同步数据到kafka,通过kafka做数据流转。
MySQL所有的高可用方案都是基于binlog做的同步,以及基于MySQL的分布式数据也是基于MySQL的binlog实现,binlog是MySQL生态圈最基本技术实现。
PostgreSQL可以做到同步,异步,半同步复制,以及基于日志逻辑复制,可以实现表级别的订阅和发布。
- 复制模式
- 一主一备
- 一主多备
- 级联复制
- 热备库/流复制
- 逻辑复制
数据流转优势:通过逻辑复制实现消息的订阅和消费,可以同步数据到kafka,通过kafka实现数据流转。
五、并发控制
PostgreSQL通过其MVCC实现有效地解决了并发问题,从而实现了非常高的并发性。
PG新老数据一起存放的基于XID的MVCC机制,新老数据一起存放,需要定时触 发VACUUM,会带来多余的IO和数据库对象加锁开销,引起数据库整体的并发能力下降。而且VACUUM清理不及时,还可能会引发数据膨胀。
当然PostgreSQL还有一点影响比较,为了保证事务的强一致性,未决事务会影响所有表VACUUM清理,导致表膨胀。
MySQL仅在InnoDB中支持MVCC。
innodb的基于回滚段实现的MVCC机制,但是MySQL的间隙锁影响较大,锁定数据较多。
PS:
MVCC
多版本并发控制,是通过在对某个时间点的数据进行快照,保证了每个时间点看到的数据都具有事务一致性;
隐藏了两个列信息,一个是创建的时间,一个是到期时间。存储的不是真的时间值,而是版本号
实现的方式:
- 乐观并发控制
- 悲观并发控制
在repeatable read隔离级别下:
六、性能
PostgreSQL
① PostgreSQL广泛用于读写速度高和数据一致性高的大型系统。此外,它还支持各种性能优化,当然这些优化仅在商业解决方案中可用,例如地理空间数据支持,没有读锁定的并发性等等。
② PostgreSQL性能最适用于需要执行复杂查询的系统。
③ PostgreSQL在OLTP/ OLAP系统中表现良好,读写速度以及大数据分析方面表现良好,基于PG的GP数据库,在数据仓库领域表现良好。
④ PostgreSQL也适用于商业智能应用程序,但更适合需要快速读/写速度的数据仓库和数据分析应用程序。
MySQL
① MySQL是广泛选择的基于Web的项目,需要数据库只是为了简单的数据事务。 但是,当遇到重负载或尝试完成复杂查询时,MySQL通常会表现不佳。
② MySQL的读取速度,在OLTP系统中表现良好。
③ MySQL + InnoDB为OLTP场景提供了非常好的读/写速度。总体而言,MySQL在高并发场景下表现良好。
④ MySQL是可靠的,并且与商业智能应用程序配合良好,因为商业智能应用程序通常读取很多。
七、高可用技术的实现
PostgreSQL
基于流复制的异步、同步主从
基于流复制的–keepalive
基于流复制的 –repmgr
基于流复制的 –patroni+etcd
共享存储HA(corosync+pacemaker)
Postgres-XC
Postgres-XL
中间件实现:pgpool、pgcluster、slony、plploxy
MySQL
主从复制
主主复制
MHA
LVS+KEEPALIVE
MGR分布式数据库,多点写入[不建议],基于paxos协议
PXC分布式数据库,多点写入[不建议],基于令牌环协议。
INNODB CLUSTER[8.0新技术,基于MGR实现,上层封装命令],基于paxos协议。
中间件实现:mycat
八、外部数据源
PostgreSQL FDW –[foreign-data wrapper的一个简称,可以叫外部封装数据]
PostgreSQL不支持多数据引擎。但支持Extension组件扩充,以及通过名为FDW的技术将Oracle、Hadoop、MongoDB、SQLServer、Excel、CSV文件等作为外部表进行读写操作,因此,可以为大数据与关系型数据库提供良好对接。
MySQL:无
九、数据存储和数据类型
PG主表采用堆表存放,存放的数据量较大,数据访问方式类似于Oracle的堆表。
MySQL采用索引组织表,MySQL必须有主键索引,所有的数据访问都是通过主键实现,二级索引访问时,需要扫描两遍索引(主键和二级索引)。
PostgreSQL与MySQL优劣对比
PostgreSQL相对于MySQL的优势
1、在SQL的标准实现上要比MySQL完善,而且功能实现比较严谨;
2、存储过程的功能支持要比MySQL好,具备本地缓存执行计划的能力;
3、对表连接支持较完整,优化器的功能较完整,支持的索引类型很多,复杂查询能力较强;
4、PG主表采用堆表存放,MySQL采用索引组织表,能够支持比MySQL更大的数据量。
5、PG的主备复制属于物理复制,相对于MySQL基于binlog的逻辑复制,数据的一致性更加可靠,复制性能更高,对主机性能的影响也更小。
6、MySQL的存储引擎插件化机制,存在锁机制复杂影响并发的问题,而PG不存在。
7、PG对可以实现外部数据源查询,数据源的支持类型丰富。
8、PG原生的逻辑复制可以实现表级别的订阅发布,可以实现数据通过kafka流转,而不需要其他的组件。
9、PG支持三种表连接方式,嵌套循环,哈希连接,排序合并,而MySQL只支持嵌套循环。
10、 PostgreSQL源代码写的很清晰,易读性比MySQL强太多了。
11、 PostgreSQL通过PostGIS扩展支持地理空间数据。 地理空间数据有专用的类型和功能,可直接在数据库级别使用,使开发人员更容易进行分析和编码。
12、可扩展型系统,有丰富可扩展组件,作为contribute发布。
13、 PostgreSQL支持JSON和其他NoSQL功能,如本机XML支持和使用HSTORE的键值对。 它还支持索引JSON数据以加快访问速度,特别是10版本JSONB更是强大。
14、 PostgreSQL完全免费,而且是BSD协议,如果你把PostgreSQL改一改,然后再拿去卖钱,也没有人管你,这一点很重要,这表明了PostgreSQL数据库不会被其它公司控制。 相反,MySQL现在主要是被Oracle公司控制。
MySQL相对于PG的优势
1、innodb的基于回滚段实现的MVCC机制,相对PG新老数据一起存放的基于XID的MVCC机制,是占优的。新老数据一起存放,需要定时触 发VACUUM,会带来多余的IO和数据库对象加锁开销,引起数据库整体的并发能力下降。而且VACUUM清理不及时,还可能会引发数据膨胀;
2、MySQL采用索引组织表,这种存储方式非常适合基于主键匹配的查询、删改操作,但是对表结构设计存在约束;
3、MySQL的优化器较简单,系统表、运算符、数据类型的实现都很精简,非常适合简单的查询操作;
4、MySQL相对于PG在国内的流行度更高,PG在国内显得就有些落寞了。
5、MySQL的存储引擎插件化机制,使得它的应用场景更加广泛,比如除了innodb适合事务处理场景外,myisam适合静态数据的查询场景。