国际新闻

您所在位置:首页 > 国际新闻 > 正文

挖掘企业数据矿产,袋鼠云数栈(DTinsight)助力企业搭建数据中台

文章作者:www.hohoy.cn发布时间:2020-01-30浏览次数:1104

2017年5月,英国杂志《经济学人》发表了一篇文章,将数据与“未来石油”进行了比较。从那时起,数据是“21世纪最有价值的资源”的观点开始传播。

在进入消费领域之前,石油通常要经过开采、储存和运输、提炼和精炼的过程。同样,必须收集、处理和提取数据才能开展业务。

那么,如何处理“数据原油”?谁来处理它?

作为中国数据智能的领先实践者,袋鼠云依托最新的数据采集、处理、数据挖掘、机器学习、深度学习等技术,结合自身多年的数据应用经验,构建了企业级和基于工作站的PaaS多栈DTinsight,致力于构建“完整”、“统一”和“通用”的大数据系统,构建全球数据共享能力中心,帮助企业实现数字化转型,增强竞争力!

I . Product Functions

0.png

堆栈体系结构图(DTInSight Architecture Diagram for Stacks)

堆栈涵盖了构建数据中心过程中所需的所有工具,完全覆盖了离线计算和实时计算应用,满足了开发人员在数据同步、数据分析、数据挖掘、数据质量、数据映射、数据模型、数据应用编程接口、即席分析等各个层次的应用。解放了开发人员的生产力,大大缩短了数据价值的提取过程,提高了企业提取数据价值的能力。

(1)数据开发平台

数据开发平台是大数据的高效离线/实时开发工具。它集成了多类型任务开发、任务调度和运维管理,帮助企业提高开发效率,快速完成数据中心建设。

离线计算:一站式大数据开发平台,高效完成数据中心建设。

流式计算:基于SQL的流式计算开发平台帮助企业实时、智能地升级。

数据同步:基于自主开发的FlinkX多源双向数据写入,涵盖多种应用场景。数据同步:支持10个存储系统的数据读写

(2)数据资产平台

构建企业资产中心,实现数据资产的标准化和可视化管理,使企业能够“看到”、“管理”和“知道”数据。

数据映射:元数据管理和血缘关系视图,使数据的整个生命周期易于管理和控制。

数据质量超过33,360个过程和结果数据验证,及时发现数据质量问题,并保护数据准确性。

数据资源目录:主题/部门/应用数据资产的多维管理以及数据共享和交换服务。

(3)数据科学平台

可视化建模和交互式代码编写机器学习任务探索平台,可以实现数据访问、算法研发、模型训练、模型部署、任务操作和维护等开发场景,帮助企业构建算法服务能力,提供高效、安全、稳定的算法操作环境。

与主流机器学习框架兼容,支持丰富且高性能的算法组件,并满足多维计算场景。

可视化实验建模交互式笔记本,双重开发模式,完成机器学习作业探索。

支持模型定期培训、快速部署和外部服务。

(4)数据服务引擎

set分析引擎、数据应用编程接口、可视化、商务智能工具等多服务引擎为多维数据应用场景提供数据共享服务,提高数据开放和共享效率,快速发布数据价值。

data visualization :高效数据大屏幕构建工具,结合颜色值和强度,允许数据值可见

analysis engine :海量数据二级查询,进行数据自由探索

data API:零代码快速生成API,全面构建数据业务能力

2,亮点优势

1。一站式产品系统。涵盖数据全链接开发流程

平台涵盖全链接数据收集、数据分析、数据挖掘、任务操作和维护、数据质量、数据地图、数据模型、数据应用编程接口开放等场景,充分满足企业在构建数据过程中多样化和复杂的需求。

2。兼容且开放,兼容市场上的各种计算引擎

兼容市场上的主流大数据平台,如:Hadoop、Cloudera、Hortonworks、FusionInsight、GreenPlum、

虚拟机的最小数量仅为5台。企业购买的硬件不限于硬件制造商、型号或使用寿命。各功能模块可以根据需要进行匹配,数据中心的建设可以逐步进行,降低企业的一次性投资成本。

3。产品价值

PB级计算能力

提供强大的分布式计算引擎和多集群多租户机制,为企业提供PB级数据计算能力。

开发效率提高50%

集成可视化数据开发平台,涵盖数据研发的全过程,大大提高了数据研发和运营维护的效率。

全方位数据监控

全方位监控数据质量问题,帮助企业及时发现数据问题,降低数据带来的风险和损失。

十亿级数据秒响应

海量数据秒响应,支持多维分析和灵活的业务探索等业务场景,是企业大数据基础设施的加速器。

零代码生成应用编程接口

零代码生成应用编程接口,快速构建数据共享服务中心,监控数据应用的全过程。

4。案例分析

(1)旅游业

客户目前面临以下棘手问题:

票务支付通行证(Ticket Payment Pass)是针对不同格式(包括景区、剧院、旅行社、酒店、餐饮、在线旅行社电子商务等)的旅游企业升级票务智能服务的解决方案。),覆盖全国29个省和300个城市。

客户目前面临以下棘手问题:

难以通过多个系统数据,面临数据孤岛的问题。

数据指标生成缓慢,很难快速支持业务决策。

系统压力很大,很难进行大量数据计算。

数据可视化能力弱,开发周期长。

数据质量问题很多,很难保证业务指标的正确性。

数据分析不及时、不准确。Unclear手动对账“方案设计”基于多栈DTinsight,配置离线计算产品、流量计算产品、数据应用编程接口、数据质量、易[五世]等产品,帮助客户快速搭建数据中心,形成企业级数据资产系统,自动生成销售报告、渠道分析、客户来源分析等数据图表,为景区统计、分析和决策提供准确有力的数据源。

全方位渠道销售分析

通过建立数据中心,客户可以获得内外的所有数据,从而为平台商户提供各种数据增值服务:

全方位渠道销售分析

快速完成并与商户对账

快速支持数据应用的登陆,减少重复建设

景点交通实时预警和监控

景点交通预测,提高商户服务水平

等。景区提供准确的营销服务,提高转化率和客户保留率

(2)金融业

客户目前面临以下棘手问题:

全行数据挖掘需求不断增加,数据开发复杂度不断增加,数据量快速增长。目前,银行迫切需要提高数据质量,为银行各行提供完整、准确、及时的高质量数据服务,满足快速业务迭代的需求。

客户目前面临以下棘手问题:

开发工具相互分离,需要在各种开发工具之间不断切换。

客户目前面临以下棘手问题:

生产环境与测试环境隔离,ETL发布繁琐且容易出错。

创建表的过程很复杂,这会影响数据模型的开发进度。

Scheme design

基于几个DTinsight栈,帮助客户快速建立数据中心,在第一阶段,解决LibrA账户对接和调度系统对接的问题;第二阶段,解决报警系统对接和标准化建表的要求。

全方位渠道销售分析

通过建立数据中心,客户可以实现:

全方位渠道销售分析

导入/导出模式在线发布,大大减少了开发人员每次发布的工作量;

账号对接,基于数据的底层控制

客户目前面临以下棘手问题:

全方位渠道销售分析

项目意义

通过建立数据中心,客户可以实现:

来推动企业诚信体系建设,构建以信用为核心的新流通治理秩序。

建立全省商业流通企业诚信体系,为政府部门提供数据支持,提供准确的企业服务。

打破政府信息与市场信息的壁垒,建立行政信息与市场信息的互动渠道和机制。