技术选型,pg转mysqll和pg怎么选

MySQL与PostgreSQL:该选择哪个开源数据库?
是一位软件工程师与热情的博主,对编程与新事物充满了激情和兴趣。近日,Naresh撰写了一篇,对开源世界最常见的两种数据库MySQL与PostgreSQL的特点进行了详尽的分析和比对。如果打算为项目选择一款免费、开源的数据库,那么你可能会在MySQL与PostgreSQL之间犹豫不定。MySQL与PostgreSQL都是 免费、开源、强大、且功能丰富的数据库。你主要的问题可能是:哪一个才是最好的开源数据库,MySQL还是PostgreSQL呢?该选择哪一个开源数据 库呢?在选择数据库时,你所做的是个长期的决策,因为后面如果再改变决定将是非常困难且代价高昂的。你希望一开始就选择正确。两个流行的开源数据库MySQL与PostgreSQL常常成为最后要选择的产品。对这两个开源数据库的高层次概览将会有助于你选择最适合自己需要的。MySQLMySQL相对来说比较年轻,首度出现在1994年。它声称自己是最流行的开源数据库。MySQL就是LAMP(用于Web开发的软件包,包括 Linux、Apache及Perl/PHP/Python)中的M。构建在LAMP栈之上的大多数应用都会使用MySQL,包括那些知名的应用,如 WordPress、Drupal、Zend及phpBB等。一开始,MySQL的设计目标是成为一个快速的Web服务器后端,使用快速的索引序列访问方法(ISAM),不支持ACID。经过早期快速的发展之 后,MySQL开始支持更多的存储引擎,并通过InnoDB引擎实现了ACID。MySQL还支持其他存储引擎,提供了临时表的功能(使用MEMORY存 储引擎),通过MyISAM引擎实现了高速读的数据库,此外还有其他的核心存储引擎与第三方引擎。MySQL的文档非常丰富,有很多质量不错的免费参考手册、图书与在线文档,还有来自于Oracle和第三方厂商的培训与支持。MySQL近几年经历了所有权的变更和一些颇具戏剧性的事件。它最初是由MySQL AB开发的,然后在2008年以10亿美金的价格卖给了Sun公司,Sun公司又在2010年被Oracle收购。Oracle支持MySQL的多个版 本:Standard、Enterprise、Classic、Cluster、Embedded与Community。其中有一些是免费下载的,另外一 些则是收费的。其核心代码基于GPL许可,对于那些不想使用GPL许可的开发者与厂商来说还有商业许可可供使用。现在,基于最初的MySQL代码还有更多的数据库可供选择,因为几个核心的MySQL开发者已经发布了MySQL分支。最初的MySQL创建者之一 Michael &Monty& Widenius貌似后悔将MySQL卖给了Sun公司,于是又开发了他自己的MySQL分支MariaDB,它是免费的,基于GPL许可。知名的 MySQL开发者Brian Aker所创建的分支Drizzle对其进行了大量的改写,特别针对多CPU、云、网络应用与高并发进行了优化。PostgreSQLPostgreSQL标榜自己是世界上最先进的开源数据库。PostgreSQL的一些粉丝说它能与Oracle相媲美,而且没有那么昂贵的价格和傲慢的客服。它拥有很长的历史,最初是1985年在加利福尼亚大学伯克利分校开发的,作为Ingres数据库的后继。PostgreSQL是完全由社区驱动的开源项目,由全世界超过1000名贡献者所维护。它提供了单个完整功能的版本,而不像MySQL那样提供了 多个不同的社区版、商业版与企业版。PostgreSQL基于自由的BSD/MIT许可,组织可以使用、复制、修改和重新分发代码,只需要提供一个版权声 明即可。可靠性是PostgreSQL的最高优先级。它以坚如磐石的品质和良好的工程化而闻名,支持高事务、任务关键型应用。PostgreSQL的文档非 常精良,提供了大量免费的在线手册,还针对旧版本提供了归档的参考手册。PostgreSQL的社区支持是非常棒的,还有来自于独立厂商的商业支持。数据一致性与完整性也是PostgreSQL的高优先级特性。PostgreSQL是完全支持ACID特性的,它对于数据库访问提供了强大的安全性 保证,充分利用了企业安全工具,如Kerberos与OpenSSL等。你可以定义自己的检查,根据自己的业务规则确保数据质量。在众多的管理特性 中,point-in-time recovery(PITR)是非常棒的特性,这是个灵活的高可用特性,提供了诸如针对失败恢复创建热备份以及快照与恢复的能力。但这并不是 PostgreSQL的全部,项目还提供了几个方法来管理PostgreSQL以实现高可用、负载均衡与复制等,这样你就可以使用适合自己特定需求的功能 了。平台MySQL与PostgreSQL都出现在一些高流量的Web站点上:MySQL:Slashdot、Twitter、Facebook与WikipediaPostgreSQL:Yahoo使用了一个修改的PostgreSQL数据库来处理每天数以亿计的事件,还有Reddit和DisqusMySQL与PostgreSQL都能运行在多个操作系统上,如Linux、Unix、Mac OS X与Windows。他们都是开源、免费的,因此测试他们时的唯一代价就是你的时间与硬件。他们都很灵活且具有可伸缩性,可用在小型系统和大型分布式系统 上。MySQL在一个领域上要比PostgreSQL更进一步,那就是它的触角延伸到了嵌入式领域,这是通过libmysqld实现的。 PostgreSQL不支持嵌入式应用,依然坚守在传统的客户端/服务器架构上。MySQL通常被认为是针对网站与应用的快速数据库后端,能够进行快速的读取和大量的查询操作,不过在复杂特性与数据完整性检查方面不太尽如人意。 PostgreSQL是针对事务型企业应用的严肃、功能完善的数据库,支持强ACID特性和很多数据完整性检查。他们二者都在某些任务上具有很快的速 度,MySQL不同存储引擎的行为有较大差别。MyISAM引擎是最快的,因为它只执行很少的数据完整性检查,适合于后端读操作较多的站点,不过对于包含 敏感数据的读/写数据库来说就是个灾难了,因为MyISAM表最终可能会损坏。MySQL提供了修复MySQL表的工具,不过对于敏感数据来说,支持 ACID特性的InnoDB则是个更好的选择。与之相反,PostgreSQL则是个只有单一存储引擎的完全集成的数据库。你可以通过调整postgresql.conf文件的参数来改进性能,也可以调整查询与事务。PostgreSQL文档对于性能调优提供了非常详尽的介绍。MySQL与PostgreSQL都是高可配置的,并且可以针对不同的任务进行相应的优化。他们都支持通过扩展来添加额外的功能。一个常见的误解就是MySQL要比PostgreSQL更容易学习。关系数据库系统都是非常复杂的,这两个数据库的学习曲线其实是差不多的。标准兼容性PostgreSQL旨在实现SQL兼容性(当前标准是ANSI-SQL:2008)。MySQL则兼容大部分SQL,不过还有自己的扩展,可以支 持NoSQL特性,这在参考手册中都有介绍。每种方式都有优缺点。兼容标准会让数据库管理员、数据库开发者与应用开发者更舒服一些,因为这意味着他们只需 学习一套标准、一套特性和命令即可。这会节省时间,提升效率,也不会被锁定在特定的厂商上。支持使用非标准的自定义功能的人们认为这样可以快速采用新的特性,而不必等待标准进程完成。ANSI/ISO标准在不断演化,因此标准兼容性也是个 变化的目标:知名的关系型数据库Microsoft SQL Server、Oracle与IBM DB2也只是部分兼容于标准。结论虽然有不同的历史、引擎与工具,不过并没有明确的参考能够表明这两个数据库哪一个能够适用于所有情况。很多组织喜欢使用PostgreSQL,因为 它的可靠性好,在保护数据方面很擅长,而且是个社区项目,不会陷入厂商的牢笼之中。MySQL更加灵活,提供了更多选项来针对不同的任务进行裁剪。很多时 候,对于一个组织来说,对某个软件使用的熟练程度要比特性上的原因更重要。来源:
MySQL 的详细介绍:
MySQL 的下载地址:
转载请注明:文章转载自 开源中国社区
本文标题:MySQL与PostgreSQL:该选择哪个开源数据库?
本文地址:
笑话,mysql与postgresql比存储过程?你以为开放性就是公共厕所?想进就进?你要加procedure的理由是什么?比function多几个字母,敲起来更爽?MySQL对于存储过程的支持已经足够好了,而且区分了FUNCTION与PROCEDURE的使用场景,我曾经将一个项目中的所有SQLSERVER存储过程及函数,全部翻译为MySQL的,只是调整了语法,逻辑表述并不受影响。PostgreSQL我也写过存储过程,因为使用FUNCTION的,一些限制又无法突破,写起来比较别扭。将FUNCTION的限制去掉而引入PROCEDURE是值得的。开放性,有时候也是指“兼容性”,便于别的数据库用户转成你的用户,如果转换起来区别太大,肯定失去了这些用户,论免费和性能MySQL并不逊于它。PostgreSQL现在最大的优势是License,任何厂家只要原因都可以封装成“私有”商业数据库(国内的确有人这么干)。国内小公司会在意License? MS SQL都不是正版的 还在乎有个半商业许可问题
呵呵 当你知道procedure有多强大的时候就知道为什么了。用oracle竟然不会procedure
其实我觉得你还是不要换的好。。若你现在的业务量使用MYSQL中以。。用上了PGSQL也不会给你带来多少大的改观,而且你若看过国外的网站的话。。除去一些非常变态的和复杂的SQL,MYSQL会比PGSQL慢。。其他的要好不少。。换句话说就是,mysql无法支持复杂业务逻辑。逻辑层为什么要交给数据库做? 数据库能做的很好的事情为什么要耗时耗力的用自己拙劣的方式做一遍?我不认同你这种说法,既然所有数据都在数据库,而数据库又能做得很好,那我们花这么多时间研究编程语言,研究新型框架为了什么,有意义么?既然数据库都能做得很好了,那任何事情数据库搞定不久就行了。所有这些争论都是无意义的,选择自己所熟悉的,自己觉得上手容易的,选择自己有把握的才是真正适合自己的。这些那些都是虚的!
华为 阿里巴巴 网易 顺丰 先给你4个名字yahoo
华为 阿里巴巴 网易 顺丰 先给你4个名字
同意,所以我用PostgreSQL的原生版本,还没用过EnterpriseDB
井底之蛙了。
其实我觉得你还是不要换的好。。若你现在的业务量使用MYSQL中以。。用上了PGSQL也不会给你带来多少大的改观,而且你若看过国外的网站的话。。除去一些非常变态的和复杂的SQL,MYSQL会比PGSQL慢。。其他的要好不少。。什么“其他的要好不少”?你倒是拿出个参考看呵呵。就不告诉你。。豆B。看到这种评论都TMD是别人说什么。PGSQL好。。就哪里好哪里好。。自己从来都没有实践过的豆B啊。呵呵,阿Q,你赢了!你丫就生活在自己的幻想世界里吧
其实我觉得你还是不要换的好。。若你现在的业务量使用MYSQL中以。。用上了PGSQL也不会给你带来多少大的改观,而且你若看过国外的网站的话。。除去一些非常变态的和复杂的SQL,MYSQL会比PGSQL慢。。其他的要好不少。。什么“其他的要好不少”?你倒是拿出个参考看呵呵。就不告诉你。。豆B。呵呵,典型的无脑2B
这只是惯性和从众,而不是因为mysql本身好典型的“自以为”。就像炒股,你觉得这只股好,但市场不买账,那也涨不起来啊市场好不代表产品好,比如javascript
其实我觉得你还是不要换的好。。若你现在的业务量使用MYSQL中以。。用上了PGSQL也不会给你带来多少大的改观,而且你若看过国外的网站的话。。除去一些非常变态的和复杂的SQL,MYSQL会比PGSQL慢。。其他的要好不少。。什么“其他的要好不少”?你倒是拿出个参考看呵呵。就不告诉你。。豆B。看到这种评论都TMD是别人说什么。PGSQL好。。就哪里好哪里好。。自己从来都没有实践过的豆B啊。
其实我觉得你还是不要换的好。。若你现在的业务量使用MYSQL中以。。用上了PGSQL也不会给你带来多少大的改观,而且你若看过国外的网站的话。。除去一些非常变态的和复杂的SQL,MYSQL会比PGSQL慢。。其他的要好不少。。什么“其他的要好不少”?你倒是拿出个参考看呵呵。就不告诉你。。豆B。
这只是惯性和从众,而不是因为mysql本身好典型的“自以为”。就像炒股,你觉得这只股好,但市场不买账,那也涨不起来啊请问MongoDB和PostgreSQL这两个要如何选择
[问题点数:40分,结帖人i_Popular]
本版专家分:0
结帖率 84.62%
CSDN今日推荐
本版专家分:105394
2017年6月 其他数据库开发大版内专家分月排行榜第一2017年2月 其他数据库开发大版内专家分月排行榜第一2013年11月 其他数据库开发大版内专家分月排行榜第一2013年9月 其他数据库开发大版内专家分月排行榜第一2013年2月 其他数据库开发大版内专家分月排行榜第一
2018年2月 其他数据库开发大版内专家分月排行榜第二2018年1月 其他数据库开发大版内专家分月排行榜第二2017年12月 其他数据库开发大版内专家分月排行榜第二2017年11月 其他数据库开发大版内专家分月排行榜第二2017年1月 其他数据库开发大版内专家分月排行榜第二2014年8月 其他数据库开发大版内专家分月排行榜第二2014年2月 其他数据库开发大版内专家分月排行榜第二2014年1月 其他数据库开发大版内专家分月排行榜第二2013年12月 其他数据库开发大版内专家分月排行榜第二2013年10月 其他数据库开发大版内专家分月排行榜第二2013年8月 其他数据库开发大版内专家分月排行榜第二2013年5月 其他数据库开发大版内专家分月排行榜第二2013年1月 其他数据库开发大版内专家分月排行榜第二2012年8月 其他数据库开发大版内专家分月排行榜第二2012年5月 其他数据库开发大版内专家分月排行榜第二2012年4月 其他数据库开发大版内专家分月排行榜第二2012年1月 其他数据库开发大版内专家分月排行榜第二
2017年9月 其他数据库开发大版内专家分月排行榜第三2017年7月 其他数据库开发大版内专家分月排行榜第三2017年5月 其他数据库开发大版内专家分月排行榜第三2017年3月 其他数据库开发大版内专家分月排行榜第三2016年12月 其他数据库开发大版内专家分月排行榜第三2014年11月 其他数据库开发大版内专家分月排行榜第三2014年7月 其他数据库开发大版内专家分月排行榜第三2014年6月 其他数据库开发大版内专家分月排行榜第三2014年5月 其他数据库开发大版内专家分月排行榜第三2013年7月 其他数据库开发大版内专家分月排行榜第三2013年3月 其他数据库开发大版内专家分月排行榜第三2012年7月 其他数据库开发大版内专家分月排行榜第三2012年6月 其他数据库开发大版内专家分月排行榜第三2011年12月 其他数据库开发大版内专家分月排行榜第三
本版专家分:175
本版专家分:1099
本版专家分:235
2013年12月 PHP大版内专家分月排行榜第三
本版专家分:35
2013年 总版技术专家分年内排行榜第六
2013年3月 总版技术专家分月排行榜第二
2014年2月 Java大版内专家分月排行榜第一2013年8月 Java大版内专家分月排行榜第一2013年5月 Java大版内专家分月排行榜第一2013年4月 Java大版内专家分月排行榜第一2013年3月 Java大版内专家分月排行榜第一2013年2月 Java大版内专家分月排行榜第一
2016年9月 Java大版内专家分月排行榜第二2013年9月 Java大版内专家分月排行榜第二2013年7月 Java大版内专家分月排行榜第二2013年6月 Java大版内专家分月排行榜第二2012年12月 Java大版内专家分月排行榜第二2012年10月 Java大版内专家分月排行榜第二
本版专家分:20
本版专家分:0
本版专家分:68
匿名用户不能发表回复!|
CSDN今日推荐PostgreSQL 与 MySQL 相比,优势何在? - 知乎有问题,上知乎。知乎作为中文互联网最大的知识分享平台,以「知识连接一切」为愿景,致力于构建一个人人都可以便捷接入的知识分享网络,让人们便捷地与世界分享知识、经验和见解,发现更大的世界。<strong class="NumberBoard-itemValue" title="被浏览<strong class="NumberBoard-itemValue" title="2,678分享邀请回答4119 条评论分享收藏感谢收起24 条评论分享收藏感谢收起专长: 超过10年的PYTHON开发经验, 精通PHP,AngularJS, 大数据分析和架构设计...
MySQL高可用方案选型参考
可选MySQL高可用方案
MySQL的各种高可用方案,大多是基于以下几种基础来部署的:
基于主从复制;
基于Galera协议;
基于NDB引擎;
基于中间件/proxy;
基于共享存储;
基于主机高可用;
在这些可选项中,最常见的就是基于主从复制的方案,其次是基于Galera的方案,我们重点说说这两种方案。其余几种方案在生产上用的并不多,我们只简单说下。
基于主从复制的高可用方案
双节点主从 + keepalived/heartbeat
一般来说,中小型规模的时候,采用这种架构是最省事的。
两个节点可以采用简单的一主一从模式,或者双主模式,并且放置于同一个VLAN中,在master节点发生故障后,利用keepalived/heartbeat的高可用机制实现快速切换到slave节点。
在这个方案里,有几个需要注意的地方:
采用keepalived作为高可用方案时,两个节点最好都设置成BACKUP模式,避免因为意外情况下(比如脑裂)相互抢占导致往两个节点写入相同数据而引发冲突;
把两个节点的auto_increment_increment(自增步长)和auto_increment_offset(自增起始值)设成不同值。其目的是为了避免master节点意外宕机时,可能会有部分binlog未能及时复制到slave上被应用,从而会导致slave新写入数据的自增值和原先master上冲突了,因此一开始就使其错开;当然了,如果有合适的容错机制能解决主从自增ID冲突的话,也可以不这么做;
slave节点服务器配置不要太差,否则更容易导致复制延迟。作为热备节点的slave服务器,硬件配置不能低于master节点;
如果对延迟问题很敏感的话,可考虑使用MariaDB分支版本,或者直接上线MySQL 5.7最新版本,利用多线程复制的方式可以很大程度降低复制延迟;
-对复制延迟特别敏感的另一个备选方案,是采用semi sync replication(就是所谓的半同步复制)或者后面会提到的PXC方案,基本上无延迟,不过事务并发性能会有不小程度的损失,需要综合评估再决定;
keepalived的检测机制需要适当完善,不能仅仅只是检查mysqld进程是否存活,或者MySQL服务端口是否可通,还应该进一步做数据写入或者运算的探测,判断响应时间,如果超过设定的阈值,就可以启动切换机制;
keepalived最终确定进行切换时,还需要判断slave的延迟程度。需要事先定好规则,以便决定在延迟情况下,采取直接切换或等待何种策略。直接切换可能因为复制延迟有些数据无法查询到而重复写入;
keepalived或heartbeat自身都无法解决脑裂的问题,因此在进行服务异常判断时,可以调整判断脚本,通过对第三方节点补充检测来决定是否进行切换,可降低脑裂问题产生的风险。
双节点主从+keepalived/heartbeat方案架构示意图见下:
多节点主从+MHA/MMM
多节点主从,可以采用一主多从,或者双主多从的模式。
这种模式下,可以采用MHA或MMM来管理整个集群,目前MHA应用的最多,优先推荐MHA,最新的MHA也已支持MySQL 5.6的GTID模式了,是个好消息。
MHA的优势很明显:
开源,用Perl开发,代码结构清晰,二次开发容易;
方案成熟,故障切换时,MHA会做到较严格的判断,尽量减少数据丢失,保证数据一致性;
提供一个通用框架,可根据自己的情况做自定义开发,尤其是判断和切换操作步骤;
支持binlog server,可提高binlog传送效率,进一步减少数据丢失风险。
不过MHA也有些限制:
需要在各个节点间打通ssh信任,这对某些公司安全制度来说是个挑战,因为如果某个节点被黑客攻破的话,其他节点也会跟着遭殃;
自带提供的脚本还需要进一步补充完善,当然了,一般的使用还是够用的。
多节点主从+etcd/zookeeper
在大规模节点环境下,采用keepalived或者MHA作为MySQL的高可用管理还是有些复杂或麻烦。
首先,这么多节点如果没有采用配置服务来管理,必然杂乱无章,线上切换时很容易误操作。
在较大规模环境下,建议采用etcd/zookeeper管理集群,可实现快速检测切换,以及便捷的节点管理。
基于Galera协议的高可用方案
Galera是Codership提供的多主数据同步复制机制,可以实现多个节点间的数据同步复制以及读写,并且可保障数据库的服务高可用及数据一致性。
基于Galera的高可用方案主要有MariaDB Galera Cluster和Percona XtraDB Cluster(简称PXC),目前PXC用的会比较多一些。
PXC的架构示意图见下:
(图片源自网络),图解:在底层采用wsrep接口实现数据在多节点间的同步复制。
(图片源自网络),图解:在PXC中,一次数据写入在各个节点间的验证/回滚流程。
服务高可用;
数据同步复制(并发复制),几乎无延迟;
多个可同时读写节点,可实现写扩展,不过最好事先进行分库分表,让各个节点分别写不同的表或者库,避免让galera解决数据冲突;
新节点可以自动部署,部署操作简单;
数据严格一致性,尤其适合电商类应用;
完全兼容MySQL;
虽然有这么多好处,但也有些局限性:
只支持InnoDB引擎;
所有表都要有主键;
不支持LOCK TABLE等显式锁操作;
锁冲突、死锁问题相对更多;
不支持XA;
集群吞吐量/性能取决于短板;
新加入节点采用SST时代价高;
存在写扩大问题;
如果并发事务量很大的话,建议采用InfiniBand网络,降低网络延迟;
事实上,采用PXC的主要目的是解决数据的一致性问题,高可用是顺带实现的。因为PXC存在写扩大以及短板效应,并发效率会有较大损失,类似semi sync replication机制。
其他高可用方案
基于NDB Cluster,由于NDB目前仍有不少缺陷和限制,不建议在生产环境上使用;
基于共享存储,一方面需要不太差的存储设备,另外共享存储可也会成为新的单点,除非采用基于高速网络的分布式存储,类似RDS的应用场景,架构方案就更复杂了,成本也可能更高;
基于中间件(Proxy),现在可靠的Proxy选择并不多,而且没有通用的Proxy,都有有所针对,比如有的专注解决读写分离,有的专注分库分表等等,真正好用的Proxy一般要自行开发;
基于主机高可用,是指采用类似RHCS构建一个高可用集群后,再部署MySQL应用的方案。老实说,我没实际用过,但从侧面了解到这种方案生产上用的并不多,可能也有些局限性所致吧;
以DBA们的聪明才智,肯定还有其他我不知道的方案,也欢迎同行们间多多交流。
没有更多推荐了,
加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!PG、GP与MySQL的特点和区别(未完) - Vvvolcano - 博客园
posts - 6, comments - 0, trackbacks - 0, articles - 0
PostgreSQL数据库
介绍:PostgreSQL是一种运行在Unix和Linux操作系统(在NT平台借助Cygnus也可以运行)平台上的免费的开放源码的关系数据库。最早是由美国加州大学伯克利分校开发的,开始只是作为一个演示系统发表,但是随着时间的推移,逐步分发,得到很多实际的应用,才逐步流行起来。网址:特点:1.省钱,可以运行在Unix和Lunux操作系统上。   2.支持SQL。   3.有丰富的数据类型。许多数据类型是一些商业数据库都没有提供的。   4.面向对象,它包含了一些面向对象的技术,如继承和类。   5.支持大数据,它不同于一般的桌面数据库,能够支持几乎不受限制大小的数据库,而且性能稳定。    描述:这个特点也是绝大多数考虑使用PostgreSQL数据库的原因之一,当然这种场景应该是有要求的,比如一些并发不高,但涉及统计分析类业务的场景相对比较适合。   6.方便集成web,提供一些接口方便 PHP,Perl等语言操作数据库。   7.事务处理。相对一些其他免费数据库如MySQL,PostgreSQL提供了事务处理,可以满足一些商业领域的数据需要。    描述:事务对数据库来真的是太重要了。   8.PostgreSQL运行速度明显低于MySQL。因为MySQL使用了线程,而PostgreSQL使用的是进程。在不同线程之间的环境转换和访问公用的存储区域显然要比在不同的进程之间要快得多。
   9.PostgreSQL的Sql语法相对更加干净和干练。
Greenplum数据库
介绍:Greenplum(以下简称GPDB)是一款开源数据仓库,基于开源的PostgreSQL改造而来,主要用来处理大规模数据分析任务。相比Hadoop,Greenplum更适合做大数据的存储、计算和分析引擎。网址:(开源社区介绍及引导页)特点:1.大规模并行处理架构   2.高性能加载,使用 MPP 技术,提供 Petabyte 级别数据量的加载性能(支持PB级别数据)。
    描述:采取MPP架构的数据库系统才能对海量数据进行管理。
       Greenplum支持50PB(1PB=1000TB)级海量数据的存储和处理,Greenplum将来自不同源系统的、不同部门、不同平台的数据集成到数据库中集中存放,
       并且存放详尽历史的数据轨迹,业务用户不用再面对一个又一个信息孤岛,也不再困惑于不同版本数据导致的偏差,同时对于IT人员也降低管理维护工作的复杂度。   3.大数据工作流查询优化
    描述:Greenplum提供资源管理功能(workload managemnt)来管理数据库资源,利用资源队列管理可实现按用户组的进行资源分配,如Session同时激活数、最大资源值等。
       通过资源管理功能,可以按用户级别进行资源分配和管理用户SQL查询优先级别,同时也能防止低质量SQL(如没有条件的多表join等)对系统资源的消耗。
   4.线性扩展。在MPP架构中增加节点就可以线性提高系统的存储容量和处理能力。
    描述:Greenplum在扩展节点时操作简单,在很短时间内就能完成数据的重新分布。       Greenplum线性扩展支持为数据分析系统将来的拓展给予了技术上的保障,用户可根据实施需要进行容量和性能的扩展。
   5.反应速度快。
    描述:Greenplum通过准实时、实时的数据加载方式,实现数据仓库的实时更新,进而实现动态数据仓库(ADW)。
       基于动态数据仓库,业务用户能对当前业务数据进行BI实时分析-“Just In Time BI”,能够让企业敏锐感知市场的变化,加快决策支持反应速度。
   5.多态数据存储和执行   6.基于Apache MADLib 的高级机器学习功能应用场景:大数据量的统计分析类业务(这个也是目前统计分析业务结合考量后所出的选择)。
     GREENPLUM虽然是关系型数据库产品,它的特点主要就是查询速度快,数据装载速度快,批量DML处理快。
     而且性能可以随着硬件的添加,呈线性增加,拥有非常良好的可扩展性。因此,它主要适用于面向分析的应用。比如构建企业级ODS/EDW,或者数据集市等等。
     GREENPLUM运行在X86架构的硬件平台上,目前支持的操作系统包括32/64位的 LINUX(REDHAT/SUSE)/SOLARIS/MAC OS。
PostgreSQL和Greenplum的区别
GP是在开源的PostgreSQL基础上开发的。GP不是开源的,是商业版的,PostgreSQL是开源的。
GP基于PostgreSQL开发而不是MySQL的原因请参考:https://read01.com/7JDQRP.html&
版权声明:本文为博主原创文章,未经博主允许不得转载。

我要回帖

更多关于 技术选型 的文章

 

随机推荐