大数据(英语:Big data),又称为巨量资料,指的是在传统数据处理应用软件不足以处理的大或复杂的数据集的术语大数据的特点
体积大
数据量很重要。对于大数据,将不得不处理大量的低密度,非结构化数据。这可能是价值未知的数据,例如Twitter数据供稿,网页或移动应用程序上的点击流或启用传感器的设备。对于某些组织,这可能是数十兆字节的数据。对于其他人,可能是数百PB。
PB是硬盘存储容量单位,存储容量:是该存储设备上可以存储数据的最大数量,通常使用千字节(kb kilobyte)、兆字节(MB megabyte)、吉字节(GB, gigabyte)、太字节(TB ,terabyte)和PB(Petabyte)、EB(Exabyte)等来衡量。1PB=1024TB=1024 * 1024 GB一部1080P高清电影 2G 左右,大概就是 50W部高清电影速度
速度是接收和(或可能)作用于数据的快速速率。通常,与直接写入磁盘相比,数据流直接进入内存的速度最高。一些支持互联网的智能产品会实时或近乎实时地运行,因此需要实时评估和采取措施。
多样性
多样性是指可用的多种数据类型。传统的数据类型经过结构化,可以整齐地放置在关系数据库中。随着大数据的兴起,数据进入了新的非结构化数据类型。非结构化和半结构化的数据类型(例如文本,音频和视频)需要进行额外的预处理才能得出含义并支持元数据。
真实性
它是指数据中的不一致和不确定性,即可用数据有时会变得混乱,并且质量和准确性难以控制。
大数据也是可变的,因为多种不同的数据类型和数据源会产生大量的数据维度。
价值
除非将其转化为有用的东西,否则大量没有价值的数据对公司没有好处。
数据本身没有用处或重要性,但需要将其转换为有价值的信息以提取信息。
大数据作用指引产品开发
Netflix和宝洁等公司使用大数据来预测客户需求。他们通过对过去和当前产品或服务的关键属性进行分类并对这些属性与产品的商业成功之间的关系进行建模,从而为新产品和服务建立了预测模型。此外,宝洁还使用焦点小组,社交媒体,测试市场和早期商店推出的数据和分析来计划,生产和推出新产品。
预测性维护
可以预测机械故障的因素可能深深地埋在结构化数据中,例如设备的年份,制造商和型号,以及覆盖数百万条日志条目,传感器数据,错误消息和发动机温度的非结构化数据。通过在问题发生之前分析这些潜在问题的征兆,组织可以更有效地部署维护并最大化零件和设备的正常运行时间。
提升客户体验
客户竞赛在进行中。现在比以往任何时候都更可能更清晰地了解客户体验。大数据使您能够从社交媒体,Web访问,呼叫日志和其他来源收集数据,以改善交互体验并最大程度地实现交付的价值。开始提供个性化报价,减少客户流失并主动处理问题。
机器学习
机器学习现在是一个热门话题。数据(尤其是大数据)是原因之一。现在,我们可以教授机器而不是对其进行编程。大数据的可用性可训练机器学习模型,从而使之成为可能。
推动创新
大数据可以通过研究人员,机构,实体和流程之间的相互依赖性,然后确定使用这些见解的新方法来帮助您进行创新。使用数据洞察力来改进有关财务和计划考虑因素的决策。检查趋势以及客户希望提供什么新产品和服务。实施动态定价。有无穷的可能性。
引申现在社交媒体(微信,微博,短视频),电商都有海量数据。头条可以根据用户行为进行精准推送内容或是广告。电商可以根据数据推送有购买意向的产品。
当前大数据时代只要是有海量用户,就可以根据用户的行为进行分析从而衍生出新的价值信息。
人工智能的前提就是通过海量数据,进行模型训练从而形成自己的计算方式。16年时谷歌人工智能机器人阿尔法狗大败世界围棋冠军李世石。围棋是人类引以为傲的高智商游戏,但最终败给了机器人。机器人就是前期通过海量数据进行计算不断的完善。
大数据的快速发展,也带来了很多问题。例如鼎鼎大名的脸书用户隐私泄漏事件。大数据中含有很多用户隐私数据,不正当的使用会造成灾难事故。
大数据未来还可以在更多的领域中使用,未来也将会出现更多的技术弥补大数据的漏洞。
请点赞支持下吆,留言关注交流。