各行业大数据应用的逐渐深入,数据作为基础性战略资源的地位越来越重要,如何构建大数据环境下的数据资产,发挥数据要素资产价值成为企业关注的焦点,数据治理也随之成为数字经济和大数据生态中的新热点。

与此同时,在政策、技术、需求等多重因素的推动下,AI已经成为全球科技巨头的布局重点。那么,当数据治理遇上AI(人工智能),将如何相互促进和发展呢?

- 01 -


(资料图)

数据治理是AI应用和发展的前提

企业对全面数据治理的需求

监管机构希望企业能更加清晰地了解数据,对它进行有效的管控;企业管理层希望理清数据资产,降低数据应用的复杂性.对企业进行更高效的管理;企业员工也开始认识到数据的重要性,更多地采用数据驱动的方式来开展工作。数据治理正迅速发展成一种企业核心策略,做好数据治理,让数据更加准确完整,安全合规,释放出数据的无限潜能,挖掘出更多有价值的数据应用。

人工智能技术在应用和实践

确保数据质量和数据安全是最基础的底层保障。由于人工智能的落地应用效果会受到数据质量和安全的影响,更多的企业开始反思并转而去推动数据质量和安全的提升,建立好的数据环境,再进行人工智能应用的同步研发。大数据是人工智能技术研发、训练的关键,是人工智能长期发展的重要保障。只有当人工智能系统能够获取更为准确、及时、一致的高质量数据,才能提供更有效、有用、精准性高的智能化服务。

人工智能发展重点保障数据安全

人工智能系统的基础是大数据,要对外提供服务,就会涉及数据的安全保护,在这个过程中,一系列的数据安全防护手段是必不可少的,如数据脱敏管理,对敏感信息的风险评估、使用监控,对数据的泄露检测,数据库保密检查等。人工智能需要海量的数据,人工智能技术的进步取决于各种来源数据的可用性,如何确保这些数据的安全性与保证用户数据的隐私性是数据治理的重要领域。同时,通过对业务数据应用语义计算、数据挖掘、机器学习、知识图谱、认知计算等人工智能技术,也可以促进企业数据安全保障体系完善。

- 02 -

AI是智能化数据治理的有效保障

多年的理论研究更新、技术演进和应用实践,数据治理从概念到技术已经发生了很多变化。特别是随着人工智能的兴起,数据治理技术和人工智能技术有效的融合在一起,使智能化数据治理成为可能。数据治理工作中,将大数据应用机器学习技术,作数据挖掘和分析,从而识别哪些是用户隐私性数据、哪些数据可能有异常,一旦数据特征被确认,打上标签,未来再做数据管理时,就可以使用元数据管理的方法机制,对外提供服务。比如当碰到涉及的某特殊标记数据,就会有相应的流程启动,或在相关的数据对外服务提供过程中,自动识别数据涉及的个人隐私,避免引起政策方面的风险。通过AI技术的应用,可以增强数据安全管理和元数据管理的能力。

对于数据模型的管理,机器学习技术可用来分析数据库中数据实体的引用热度,通过聚类算法自动识别数据模型间的内在关系,还可以用于数据模型质量的检测和评估。对于非结构化数据的管理,像文档内容,图像,音频,视频,可以充分利用人工智能中的自然语言处理、图像识别、语音识别、视频处理等技术进行实现。

- 03 -

AI在数据治理中的应用

数字化时代,大数据治理和人工智能技术的深度结合,将在数据治理领域发挥重要的作用。

大数据包括社交数据,机器数据等,大数据对传统数据治理工作带来很多的扩展。在政策和流程上,大数据治理应覆盖大数据的获取、处理、存储、安全等环节;在数据生命周期管理各阶段,如数据存储、保留、归档、处置时,要考虑大数据保存时间与存储空间的平衡;大数据量大,因此应识别对业务有关键影响的数据元素,检查和保证数据质量;大数据还需要定义与其内容相关的元数据,需与传统数据定义标准保持一致,术语字典应包含大数据的术语,需要为非结构化数据提供分类、语义支持,Hadoop、NoSQL数据库的技术元数据也同样需要纳入元数据存储库管理;此外,在隐私方面,应考虑社交数据的隐私保护需求,制定相应政策,还要将大数据治理与企业内外部风险管控需求建立联系。

- 04 -

河姆渡工业互联网

数据是企业数字化转型的基础,数据贯穿工业互联网的各个环节,工业数据的获取与应用是工业互联网落地的基础。

依托河姆渡在工业互联网领域的积累,使数据贯穿工业互联网的各个环节,为工业互联网落地提供基础支撑,帮助企业解决痛点问题。

解决终端数据采集问题:解决数据与数据间交互、数据分析应用问题,为工业互联网落地提供基础支撑,助力企业决策分析。

推荐内容