DataOps 第二篇 书籍描述汇总

内容纲要

企业级数据与AI项目成功之道

介绍

DevOps主要关注的是软件;

DataOps关注的是数据的实践;

DataOps的目的是加速数据和分析管道的创建,实现数据工作流执行的自动化,并提供满足组织需求的分析解决方案。使用DataOps,通过结合使用自动化、测试、编排、协作开发、容器化和持续监控的方式交付数据和分析。

来源

DataOps源于与DevOps相关联的底层思想。通过使用DataOps,将整个企业的利益相关者聚集在一起,如图6-6所示,这些利益相关者包括数据科学家、架构师、分析师、工程师和信息技术运营人员。DataOps用于驱动这些利益相关者之间的协作,并帮助他们与组织对数据和分析的需求保持一致。

图6-6 识别DataOps的各利益相关者

实现DataOps需要的条件

有时,利益相关者的活动和兴趣会有所不同,所以成功实现DataOps需要以下条件:

  • 营造一种所有利益相关者愿意共同努力并感到对整个DataOps进程负责的文化氛围。
  • 整合一系列定义明确的进程、角色、指导方针和衡量标准,以增强目标和目的。
  • 利用软件工具和基础设施支持自动化、测试和编制,以及所有利益相关者之间的协作和交流。

像DevOps一样,DataOps大量借鉴了敏捷和精益实践。DataOps强调使用具有业务参与的自组织团队,以及交付经过验证的资产的短期开发冲刺。版本控制系统和代码元库用于提高效率,以及代码和模型重用。

DataOpd的原则

DataOps的原则可以包括以下内容:

  • 认识到数据本身并不是目的,而是一种提供洞见的手段,这种洞见为业务增加和驱动价值。
  • 从错误中吸取教训,不断审查和更新进程。
  • 在分析生命周期的每个阶段,共享知识并提供反馈。
  • 尽可能实现自动化,并且重复使用现有工件,以避免不必要的返工。
  • 数据、架构、软件工具和软件代码在整个信息架构和数据拓扑中进行编制。
  • 通过MVP在短周期内进行迭代,以快速适应新的和不断变化的需求。
  • 人工智能模型和数据可视化等数据工件通常被视为代码,因此可以利用版本控制、自动测试和持续部署。
  • 质量和测试是优先事项,因此不会将未经测试的资产投入生产。
  • 进程监控是提高性能和价值的一种手段。

数据管道遵循有序的进程

许多数据管道遵循一个有序的进程,其中包括以下内容:

  • 从各种来源收集数据,然后验证并将数据加载到数据区域中。
  • 通过清理、丰富、集成和建模来组织数据,以支持目标数据区域。
  • 分析数据,优化和打包数据模型,以帮助提升组织洞见。
  • 在应用程序中注入人工智能,以帮助进行预测,并促进优化和自动化。

DataOps可以提供的贡献

通过解决跨越云、雾和霭计算的复杂数据拓扑,DataOps可以在以下方面做出贡献:

  • 通过深层次的自动化和测试提供简化的数据分析管道,从而加快进程并提高质量。
  • 通过采用严格的进程,提高数据和分析的价值主张。
  • 建立持续改进和协作的文化。
  • 支持数据拓扑中数据流的管理和编制。
  • 实施数据科学,提高人工智能对业务的价值。

DataOps是一种务实的方法,用于帮助组织更高效地利用数据和进行分析,并为不断改进以驱动价值和支持自身必须不断发展以保持生存能力的组织铺平道路。由于软件、数据和分析必须在生产环境中始终保持可访问,因此AIOps的实际应用可以帮助满足可用性需求。

Leave a Comment

您的电子邮箱地址不会被公开。 必填项已用*标注

close
arrow_upward