数据开发从此变简单,打造一站式 DataSphere Studio
作者头像
  • 李文静
  • 2019-12-08 08:14:16 1

引言

DataSphere Studio(简称DSS)是微众银行自主研发的一款一站式数据应用开发和管理门户,隶属于微众银行的大数据平台——WeDataSphere。DSS基于Linkis计算中间件构建,能够轻松整合各种底层数据应用系统,使得数据应用开发更加简便高效。

DataSphere Studio定位于数据应用开发门户,覆盖了数据应用开发的全过程。它提供了一致的用户界面,通过工作流式的图形化拖拽开发体验,满足从数据导入、脱敏清洗、数据分析、质量检测、数据可视化展示、定时调度到数据应用等多个环节的需求。得益于Linkis计算中间件的支持,DSS具备了高并发、高可用、多租户隔离和资源管理等关键性能。

核心特点

DSS的主要特点包括:

一、一站式、全流程的数据应用开发管理界面

DSS高度集成,目前已集成的系统有:

  1. 数据开发IDE工具——Scriptis
  2. 数据可视化工具——Visualis(基于宜信Davinci二次开发)
  3. 数据质量管理工具——Qualitis
  4. 工作流调度工具——Azkaban

二、基于Linkis计算中间件,独特的AppJoint设计理念

AppJoint——应用关节,定义了一套统一的前后端接入规范,使外部数据应用系统能快速接入DSS,成为数据应用开发的一部分。DSS通过串联多个AppJoint,形成支持实时执行和定时调度的工作流,用户只需简单的拖拽操作就能完成整个数据应用的开发。

由于AppJoint对接了Linkis,外部数据应用系统具备了资源管理、并发控制、用户资源管理和跨系统上下文信息共享等功能,解决了应用孤岛问题。

三、以Project为管理单元

以Project为单位组织和管理各个数据应用系统,定义了一套跨数据应用系统的项目协同开发通用标准。

四、集成的数据应用组件

  1. DSS的调度能力——Azkaban AppJoint

    Azkaban AppJoint允许用户将编排好的工作流一键发布到Azkaban中进行定时调度,同时定义了一套标准且通用的DSS工作流解析发布规范,使得其他调度系统也能低成本对接。

  2. 数据开发——Scriptis AppJoint

    Scriptis是一款支持在线编写SQL、Pyspark、HiveQL等脚本,并提交给Linkis执行的数据分析Web工具,具备企业级特性的UDF、函数、资源管理和智能诊断等功能。Scriptis AppJoint为DSS集成了Scriptis的数据开发能力,使其脚本类型成为工作流中的节点。

  3. 数据可视化——Visualis AppJoint

    Visualis是一个基于宜信开源项目Davinci二次开发的数据可视化BI工具,在数据安全和权限方面提供了金融级数据可视化能力。Visualis AppJoint为DSS集成了Visualis的数据可视化能力,使得数据大屏和仪表盘可以作为工作流的节点与下游的数据集市关联起来。

  4. 数据质量——Qualitis AppJoint

    Qualitis AppJoint为DSS集成了数据质量校验能力,将数据质量系统集成到工作流开发中,对数据的完整性和准确性进行校验。

  5. 数据发送——Sender AppJoint

    Sender AppJoint为DSS集成了数据发送能力,目前支持SendEmail节点类型,所有其他节点的结果集都可以通过邮件发送。例如,SendEmail节点可以直接将数据大屏作为邮件发送出来。

  6. 信号节点——Signal AppJoint

    Signal AppJoint用于增强业务与流程之间的解耦和关联。其中包括:

    • DataChecker节点:检查库表分区是否存在。
    • EventSender节点:跨工作流和项目的消息发送节点。
    • EventReceiver节点:跨工作流和项目的消息接收节点。
  7. 功能节点

    空节点、子工作流节点。

与其他类似系统的比较

DSS是一个引领数据应用开发管理方向的开源项目,目前市场上还没有类似的开源产品。

应用场景

DataSphere Studio适用于以下场景:

  1. 正在筹建或初步具有大数据平台能力,但没有任何数据应用工具的场景。
  2. 已具备大数据基础平台能力,但只有少数数据应用工具的场景。
  3. 已具备大数据基础平台能力,且拥有全部数据应用工具,但工具间尚未打通,用户体验不佳、学习成本高的场景。
  4. 已具备大数据基础平台能力,且拥有全部数据应用工具,部分工具已经对接,但尚未定义统一标准的场景。

快速安装使用

点击此处进行快速安装和使用。

架构

(图略)

通过以上改写,DSS的核心信息得到了保留,同时避免了直接引用或过于相似的表达,确保了文章的原创性和可读性。

    本文来源:图灵汇
责任编辑: : 李文静
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
一站式DataSphere从此简单打造数据Studio开发
    下一篇