关于大数据与会计的企业有哪些(阿里云 drds如何使用)
阿里云 drds如何使用,关于大数据与会计的企业有哪些?
大数据:
国外
IT项目——IBM
IBM是世界三大IT巨头之一,很多公司在考虑到一些大型的IT项目是会想到IBM、SAP这类公司,其成熟的方案得到世界的广泛认同。在大数据领域,IBM是Hadoop项目的主要参与者之一,服务的客户很多都是PB级的数据。IBM在网格计算、全球数据中心和企业大数据项目实施等众多领域有着丰富的经验。“IBM计划继续整合SPSS分析、高性能计算、BI工具、数据管理和建模、应对高性能计算的工作负载管理等众多技术。”
数据架构——Microsoft
微软除了windows长期占据桌面办公的90%以上的份额,windows在企业应用上也有大量的布局。尤其是在开源工具方面,微软的Windows Azure HDInsight、Hortonworks Data Platform for Windows一直很低调,通过和Hadoop的合作,微软在大数据领域基础架构上有整套的布局,这些开源工具将大数据解决方案良好地集成到企业中,为企业提供内部存储、管理、分析和共享大数据的服务。
数据仓库——Teradata
对于Teradata来说,Hadoop既是一种威胁也是一种机遇。数据管理,特别是关于SQL和关系数据库这一领域是Teradata的专长。所以像Hadoop这样的NoSQL平台崛起可能会威胁到Teradata。相反,Teradata接受了Hadoop,通过与Hortonworks合作,Teradata在Hadoop平台集成了SQL技术,这使Teradata的客户可以在Hadoop平台上方便地使用存储在Teradata数据仓库中的数据。
Hadoop生态——Cloudera
Cloudera是Hadoop生态系统中,规模最大、知名度最高的公司。其为它的Hadoop发行版开发了很多功能,包括Cloudera管理器,用于管理和监控,以及名为Impala的SQL引擎等等。Cloudera提供了一个企业级数据交互的软件平台,该平台让各组织以更快的速度和更低的成本来存储、运行和分析企业数据。
云计算——AWS(Amazon Web Services)
在大数据云计算领域,亚马逊可称得上是霸主。在解决了管理超大型数据中心和复杂软件系统的问题之后,亚马逊开始酝酿将这些能力和经验输出,AWS(Amazon Web Services)应运而生,点燃了全球公有云市场。AWS在云中提供高度可靠、可扩展、低成本的基础设施平台,为全球 190 个国家/地区超过百万的家企业、政府以及创业公司和组织提供支持。
数据可视化——Tableau
Tableau是一款定位在数据可视化的商务智能展现工具,用来实现交互地、可视化的分析和仪表盘分析。Tableau是数据可视化领域的杰出厂商,Tableau Desktop是Tableau公司开发的桌面系统中最简单的商业智能工具软件,Tableau没有强迫用户编写自定义代码,新的控制台也可完全自定义配置。在控制台上,不仅能够监测信息,而且还提供完整的分析能力。Tableau控制台灵活,具有高度的动态性。
国内
云计算——阿里云
作为阿里巴巴的云计算业务,有希望成为阿里巴巴最大的业务。阿里云针对快速开发、海量用户、大量数据、低延迟等互联网应用的实际需要,分别开发了企业级分布式应用服务框架(EDAS),分布式数据库服务(DRDS)和分布式消息框架(ONS)等来应对复杂的业务应用。这个架构已经承受住了“双十一”的考验。在云计算环境下,阿里云使用了成千上万个虚拟机来负载业务,其研发的分布式数据库服务(DRDS),分布式消息服务(ONS)都能以自动化的形式实现系统的秒级切换和快速恢复。
数据仓库及管理——星环
星环主要从事大数据时代核心平台数据库软件的研发与服务,是唯一被Gartner列为国际主流Hadoop发行版厂商。
商业智能 &报表——帆软
帆软软件由报表软件FineReport起家,目前已成为报表领域的权威者,拥有10年企业数据分析的行业经验。后发布的商业智能自助式BI工具FineBI,提供包括Hadoop、分布式数据库、多维数据库的大数据可视化分析;提供PC端、移动端、大屏的可视化方案,广泛应用于银行、电商、地产、医药、制造、电信、制造、化工等行业,拥有成熟的行业化解决方案。
大数据可视化——数字冰雹
数字冰雹也是一家低调的国内公司。主营大数据可视化业务,提供集设计、程序开发、硬件集成为一体的解决方案。其数据可视化大屏在业内独树一帜,广泛应用于航天战场、智慧城市、网络安全、企业管理、工业监控等领域。
会计有名的企业:
每个企业都有会计。与会计专业相关的企业主要是会计师事务所、税务师事务所、还有一些相关方面的咨询顾问公司。国际四大所普华永道(PWC)、德勤(DTT)、毕马威(KPMG)、安永(EY)。
与会计专业相关的企业主要是会计师事务所、税务师事务所、还有一些相关方面的咨询顾问公司.
阿里云和网盘区别?
阿里云和网盘是两种不同的服务。阿里云是由阿里巴巴集团旗下的阿里云计算有限公司提供的云计算服务,包括云服务器、对象存储、数据库、网络、安全等多种云服务。阿里云的主要用户是企业和开发者,可以用来搭建网站、应用程序、数据库等。网盘是一种在线存储服务,用户可以将文件上传到网盘中进行存储和分享。网盘一般是由第三方公司提供的服务,比如百度网盘、微云、360云盘等。网盘的主要用户是个人和小团体,可以用来存储照片、视频、文档等。总的来说,阿里云提供的是云计算服务,而网盘提供的是在线存储服务。它们的用户群体和使用场景也有所不同。
drds一定要使用分区字段进行查询吗?
DRDS(分布式关系型数据库服务)是阿里云提供的一种分布式关系型数据库解决方案。在DRDS中,分区字段对于查询的性能优化是非常重要的,但并非所有查询都必须使用分区字段进行查询。
使用分区字段进行查询可以带来以下优势:
1. 分区裁剪:DRDS在查询时可以根据分区字段的值进行裁剪,在指定分区上执行查询,减少了需要扫描的数据量,提高查询性能。
2. 并行查询:分区字段可以将数据分散到不同的存储节点上,使得查询可以并行执行,大大提高查询的吞吐量。
3. 数据分发平衡:使用合适的分区字段可以保证数据在各个分区上均匀分布,避免数据倾斜,提高查询的负载均衡性。
虽然使用分区字段进行查询可以获得这些优势,但并不是所有查询都需要使用分区字段。对于一些不涉及分区字段的查询,DRDS仍然能够处理和优化查询请求。
因此,使用分区字段进行查询在DRDS中是被推荐的,尤其是对于大数据量的表和复杂查询场景。但具体是否使用分区字段,以及如何选择和设计分区字段,需要根据业务场景和数据特点综合考量。
大家知道淘宝是用什么语言开发的吗?
淘宝网在最早的时候使用的 PHP 开发的系统,不过在 04 年左右,阿里开始把 PHP 换成 Java,然后阿里基本上全线使用的 Java。
因为面对着如此量级的用户和并发量,所以逼着阿里把 Java 的性能优化到极致,并且对于很多开源框架或中间件,也将其的性能压榨到极致,比如 MySQL,另外阿里也贡献了极多及优秀的开源框架。
让我们看看阿里都用到或用过哪些技术最初淘宝使用的是 LAMP,也就是 Linux + Apache + MySQL + PHP;随着业务量和并发量的上升,开始转用 IOE,也就是 IBM 小型机 + Oracle + EMC 存储,然后随着 PV 的继续上升,IOE 的框架已经到了瓶颈,阿里提出了“去 IOE”的口号,随着 PHP 向 Java 的迁移,分布式平台开始诞生;
邀请 SUN 公司更换开发语言,开始使用 Java 做基础语言,采用 MVC 框架 + EJB + IBatis ,后续改为 Spring + IBatis;
关于缓存,从最早的 ESI 做页面片段缓存,到 TBstore 分布式 Key-Value 缓存,发展到现在的自研分布式缓存系统 Tair;
负载均衡技术:Nginx、HAProxy,都是工作在网络第七层的反向代理软件;上了阿里云之后,有一个负载均衡的服务 SLB,提供给所有的阿里云用户使用;
分布式服务框架,红极一时的 Dubbo,阿里后来选择了 HSF 用于系统间的调用,是一个分布式 RPC 框架;
消息中间件:Notify 是阿里自研的消息服务引擎,也是支撑双十一的核心系统之一;
分布式数据库访问:TDDL 是 Taobao 分布式数据层的意思,数据存储可以自由扩展,不再受单机容量的瓶颈,后来改了个名字叫做 DRDS (分布式关系数据库服务)。
再看看阿里贡献过哪些开源项目FastJSON:一个性能很好的 Java 语言实现的 JSON 解析器和生成器;
Dubbo:高性能的分布式服务框架,可以通过高性能的 RPC 实现服务之间的调用;
Druid:一个高效的 JDBC 连接池、监控组件;
AliSQL:开源数据库,是基于 MySQL 官方版本的一个分支;
RocketMQ:分布式消息中间件;
ApasaraCache:飞天缓存,基于 Redis 改进的 K/V 数据库;
FastDFS:一个开源的分布式文件系统;
OceanBase:个支持海量数据的高性能分布式数据库系统;
Zeus:是一个完整的 Hadoop 作业平台,它支持了任务的整个生命周期;
Otter:基于数据库增量日志解析,将数据准实时同步到另外的数据库中,是一个分布式数据库同步系统。
当然,这些项目只是阿里开源项目中很小的一部分,目前阿里系基本是全线 Java,而且技术水平在国际上也是一流的。
我将持续分享Java开发、架构设计、程序员职业发展等方面的见解,希望能得到你的关注。