分类目录:Big Data and AI

以下是分类 Big Data and AI 下的所有文章

医疗健康行业的数字化及应用

医疗健康的未来发展令人兴奋,而这全都在于协作,教育和利用正确的数字生态系统,使患者的健康成为护理的核心。COVID-19扰乱了医疗健康行业,并迫使医疗健康专业人员适应新的“非接触式”数字实践环境。未来,这种趋势将继续发展和扩大,远程医疗,物联网,数据分析,人工智能,AR/VR,机器人及助理等技术将发挥越来越……

Qlik最佳实践:Qlik Sense中的分层解决方案结构

在实施Qlik Sense架构时,我们强烈建议您实施语义层( Semantic Layer),在Qlik中称为QVD层。 QVD层充当集中式数据库,其中包含从一个或多个数据源提取产生的一组受控数据快照。 Qlik数据库中的数据应当为“业务就绪”的,这意味着它应该是干净的,及时的,可访问的,格式化且易于关联的,使这些数据非常适合真正的自助服……

药物研发中的人工智能

当前,由于增加的研发成本和降低的效率,制药业在维持其药物开发计划方面面临挑战。计算能力的显着提高与AI技术的进步相结合,可以用来彻底改变药物开发过程。 人工智能在药物开发中的应用 寻找成功的新药的任务是艰巨的,并且主要是药物开发中最困难的部分。这是由所谓的化学空间的巨大大小引起的,据估计约为10 60个……

数仓建模—Inmon 范式建模与 Kimball 维度建模

在数据仓库领域,有两位大师,一位是“数据仓库”之父 Bill Inmon,一位是数据仓库权威专家 Ralph Kimball,两位大师每人都有一本经典著作,Inmon 大师著作《数据仓库》及 Kimball 大师的《数仓工具箱》,两本书也代表了两种不同的数仓建设模式,这两种架构模式支撑了数据仓库以及商业智能近二十年的发展。今天我们就来聊……

Gartner: Data Hub,Data Lake和Data Warehouse:它们有何不同以及为什么它们在一起会更好

许多数据和分析领导者将Data Hub,数据湖和数据仓库视为可互换的替代方案。实际上,这些架构模式中的每一个都有不同的主要目的。当它们组合在一起时,它们可以支持日益复杂,多样化和分布式的工作负载。 概述 关键挑战 数据和分析领导者通常不清楚数据湖,数据仓库和Data Hub之间的区别。将它们定位为竞争性方法……

数据仓库建设灵魂10问

01 传统数仓和大数据数仓的异同?有哪些大的变化? 区别主要是数仓数据存储的地方不同,传统数仓数据存储在Mysql/Oracle等关系型数据库上,大数据数仓存储在Hadoop平台的Hive中(实际上是HDFS中),当然也有其他的数仓产品比如TD、Greenplum等。 我接触过的传统数仓技术架构是使用Kettle做ETL工具,数据保存在Mys……

数据模型——数据仓库的灵魂

前言 越来越多的业务,越来越多的信息化系统,让很多公司拥有了海量数据,但是分散的数据、隔离的系统,又形成了一个个数据孤岛。于是,为了利用好数据,各大公司纷纷建设了数据仓库,或者是最近升级为大数据平台之类的,但是,不同条线不同场景的数据又要如何整合到同一个仓库呢? 数据模型就此应运而生,通过高度抽象的……

明确、详细、可落地:给你份通用的数据分层方法

数据分层是数据仓库设计中十分重要的一个环节,优秀的分层设计能够让整个数据体系更易理解和使用。 而目前网络中大部分可以被检索到相关文章只是简单地提及数据分层的设计,或缺少明确而详细的说明,或缺少可落地实施的方案,或缺少具体的示例说明。 因此,本文将指出一种通用的数据仓库分层方法,具体包含如下内容: 介……

Google Cloud 2021 领导者观点:驱动业务发展的五大数据趋势

2020 年无疑是独特且复杂的一年。但无论世界如何变化,数据质量、处理速度与数据洞见仍然坚定地步入企业发展的最前沿。未来如何?我们将一同展望。 如果说 2021 年有什么与 2020 年保持一致,那就是难以捉摸的不确定性。我们不愿看到又一个 2020 年,但也得随时为各种意外做好准备。 2020 年可以说是意外频发、远超想象……

企业数字化之数据平台建设

一、大数据之应用 大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。通过采集数据资源,并对数据加以整合、分析、提取,得到有价值的信息,企业……