- 优百发布 >
- 资讯详情
2017年大数据及分(fēn)析市场的15项趋势预测
社交、移动和云、分(fēn)析以及相关的数据技术已经在数字时代赢得一席之地。2016年我们看到大数据技术不断给商(shāng)业智能(néng)注入活力。2017年则是数据和分(fēn)析的沉淀阶段。
John Schroeder, MapR科(kē)技(MapR Technologies)的执行主席和创始人预测了他(tā)对2017年数据及分(fēn)析方面的六大趋势
●人工智能(néng)(AI)将再度盛行 早在60年代,Ray Solomonoff 奠定了人工智能(néng)的数學(xué)理(lǐ)论基础,引入通用(yòng)贝叶斯原理(lǐ)(Bayesian)来归纳推理(lǐ)和预测。1980年,美國(guó)人工智能(néng)协会(American Association for Artificial Intelligence,AAAI)的第一次全國(guó)会议在斯坦福大學(xué)召开,其标志(zhì)着在软件中理(lǐ)论应用(yòng)的开始。Schroeder认為(wèi)AI如今和一些热词如机器智能(néng)、机器學(xué)习、神经网络和认知计算等一样,已经回归到主流探讨。為(wèi)何AI重返潮流,他(tā)指出定义大数据常用(yòng)的“三V”特性:速度(Velocity),多(duō)样性(Variety)和海量(Volume)。他(tā)认為(wèi)各平台可(kě)以将大数据的“三V”特性以现代和传统的混合式处理(lǐ)模型来处理(lǐ),这将比传统平台提高10-20倍的成本效率。谷歌记录了简单算法对大型数据集进行高速运行比对小(xiǎo)数据集应用(yòng)有(yǒu)更好的结果。Schroeder认為(wèi)我们将会目睹,对于高體(tǐ)量重复性任務(wù)来说,和人工知觉相比,应用(yòng)AI可(kě)获取更有(yǒu)效的一致性,从而避免人為(wèi)错误,产生最高价值。
●大数据治理(lǐ)或竞争优势 Schroeder认為(wèi)2017年数据治理(lǐ)和数据价值之争将点燃。企业拥有(yǒu)大量客户以及合作伙伴信息。领先的企业将把他(tā)们的数据分(fēn)类成“规范使用(yòng)案例”和“非规范使用(yòng)案例”两个类别来应用(yòng)。规范使用(yòng)案例数据需要治理(lǐ);数据质量和線(xiàn)性关系使其可(kě)以产生报表,并且跟踪数据进行各种转化及追溯来源。Schroeder认為(wèi)这非常必要甚至可(kě)强制执行,但可(kě)能(néng)对非规范使用(yòng)案例作用(yòng)有(yǒu)限,例如客户360或者当需要通过进行高行选择数处理(lǐ)、满足实时需求和处理(lǐ)结构化及非结构化的混合数据来产生有(yǒu)效结果时,会受到限制。
●公司将关注业務(wù)驱动型应用(yòng),避免数据湖(hú)陷入困境 Schroeder表示在2017年,企业机构将从“构建未来”的数据湖(hú)应用(yòng)转向业務(wù)驱动型数据应用(yòng)。当今世界需要分(fēn)析和操作能(néng)力去触及客户、处理(lǐ)索赔并且连接到个體(tǐ)的不同设备。举例而言,任何商(shāng)业网站需要提供实时的个性化推荐和价格查询。医疗健康型企业必须处理(lǐ)有(yǒu)效的索赔并且运用(yòng)分(fēn)析运营系统来防止索赔欺诈。媒體(tǐ)公司需要通过机顶盒提供个性化的内容。汽車(chē)制造商(shāng)和汽車(chē)共享公司则要交互运营其車(chē)辆和司机。这些案例的实施交付均需要由一个敏捷平台来实现,同时提供分(fēn)析和运营的处理(lǐ),跨越后台分(fēn)析和前台运营进行整合,提升了商(shāng)业价值。Schroeder认為(wèi)2017年企业机构将大举推动“提问题”型处理(lǐ)和架构及更多(duō)实际应用(yòng)来驱动長(cháng)期商(shāng)业价值。
●数据敏捷性决定胜负 Schroeder认為(wèi)自DevOps提供可(kě)连续性交付实施以来,软件发展逐渐导向敏捷性。2017年,处理(lǐ)和分(fēn)析模型将进化到一个类似的敏捷度层面,因為(wèi)企业认识到竞争优势的来源并非简单依靠大数据湖(hú)本身,而是数据敏捷性,以及其在不同场景对数据的理(lǐ)解能(néng)力和如何采取商(shāng)业行动。敏捷处理(lǐ)模型的出现将使同样的数据可(kě)以支持批量分(fēn)析、互动分(fēn)析、全球信息、数据库和基于文(wén)件的模型。越来越多(duō)的敏捷分(fēn)析模型也可(kě)以让单一数据支持更广泛的工具。最终结果就是产生可(kě)以支持最大范畴的处理(lǐ)和分(fēn)析模型的敏捷发展和应用(yòng)平台。
●區(qū)块链变革金融服務(wù)应用(yòng) Schroeder认為(wèi)2017年数据存储和交易处理(lǐ)的方式将令金融服務(wù)的选择和转换融合更广泛地应用(yòng)。區(qū)块链提供了一个全球分(fēn)布式总账,这将改变数据存储和交易的处理(lǐ)方式。區(qū)块链运行于全球分(fēn)布的计算机上,并可(kě)以被任何人查看。每个数据區(qū)块按照时间顺序相连,在不同區(qū)块储存的交易以时间戳界定储存数据而不可(kě)纂改。黑客也认為(wèi)區(qū)块链理(lǐ)论上无法攻克。區(qū)块链為(wèi)消费者提供了显而易见的效率。举例来讲,消费者不用(yòng)等待SWIFT交易或者担心中央数据中心泄露而产生影响。对企业来说,區(qū)块链代表节约成本以及极具竞争优势。
●机器學(xué)习最大化微服務(wù)影响 今年我们将看到机器學(xué)习和微服務(wù)的整合所带来的活动增量。微服務(wù)部署将专注于轻量服務(wù),其结合受限于“快数据”集成的机器學(xué)习,将应用(yòng)于窄频流媒體(tǐ)数据。2017年我们将看到很(hěn)多(duō)状态应用(yòng)发展转向以大数据结合机器學(xué)习的方式来处理(lǐ)大量历史数据,从而更佳理(lǐ)解新(xīn)增流数据的场景。
Hadoop服務(wù)解决方案厂商(shāng)Hortonworks预测
●智能(néng)网络引领数据云攀升 感謝(xiè)万物(wù)互联或全联网(Internet of Anything ,IoAT)的持续发展和机器端到机器端的连接性,数据孤岛将被数据云所替代。
●实时机器學(xué)习和分(fēn)析蓄势待发 智能(néng)设备将整合和分(fēn)析一切。现代分(fēn)布式数据应用(yòng)中的实时机器學(xué)习算法将开始发挥所長(cháng)-算法宣告了“端到端”实时决策的实现
●更前瞻性的分(fēn)析:从延时处理(lǐ)到实时分(fēn)析到提前分(fēn)析并采取行动 我们将看到一个从延时处理(lǐ)到实时分(fēn)析到前瞻分(fēn)析的演进过程,其驱动着各类交易而不是仅仅修订或者优化它们。这将带来变革性的影响,以数据為(wèi)中心的商(shāng)业能(néng)力将会迎来新(xīn)的营收流、节约成本和改善与客户的亲密度。
●无处不在的现代数据连接 对于那些以数据致胜的企业来说,应用(yòng)和数据需要连接到同一个平台或者架构,这是2017年现代数据应用(yòng)的基石。现代数据应用(yòng)非常便携、集成性高以及互联。他(tā)们将迅速取代那些垂直整合的独立软件。
●数据将成為(wèi)每个人的产出 数据将成為(wèi)可(kě)以購(gòu)买、销售或者损失的价值产品。届时将有(yǒu)很(hěn)多(duō)新(xīn)途径、新(xīn)商(shāng)业模式和新(xīn)公司将观望如何价值化这些资产。
开发和支持开源Apache Cassandra非線(xiàn)性数据库商(shāng)业版的公司DataStax预测:
●数据工程师的适时出现 “数据科(kē)學(xué)家”这个术语将不再流行,而被“数据工程师”取代。数据科(kē)學(xué)家专注于数据科(kē)學(xué)的应用(yòng)以及对关键业務(wù)问题的分(fēn)析结果。数据工程师则是设计、构建以及管理(lǐ)大数据基础架构,他(tā)们侧重在架构和保证系统执行。
●安全:物(wù)联网发展导致模糊地带 现今物(wù)联网发展很(hěn)大程度上有(yǒu)些失控。因為(wèi)缺乏标准和数据的爆炸,谁来对安全负责并不是很(hěn)明晰。最大的风险来自于互联网服務(wù)提供商(shāng)(ISP),这也是為(wèi)什么过去一年中主要是他(tā)们在安全领域进行探讨。
●企业级云应用(yòng)导致混合云致胜 很(hěn)多(duō)已有(yǒu)平台上建立了数据库的大型企业宁愿放弃也不愿交换其数据库。混合数据架构可(kě)以涵括已有(yǒu)数据库,同时允许企业同时利用(yòng)云应用(yòng),这将成為(wèi)这些企业的主要关注点。
●去服務(wù)器架构解除紧关连 DataStax认為(wèi)依靠第三方云应用(yòng)或者云服務(wù)来管理(lǐ)服務(wù)器端的逻辑和状态,或者说来运行在事件驱动的无状态计算容器,这种去服務(wù)器架构将变得更為(wèi)广泛。对去服務(wù)器架构的采纳将对应用(yòng)如何部署以及管理(lǐ)产生更為(wèi)广泛的影响。