2021-12-30 22:52:57|已浏览:258次
什么是大数据?
“大数据”这个词相信大家都十分熟悉。从字面理解,这不就是很多很多的数据吗?
那什么是很多很多的数据呢?战国时代,五辆马车装载的竹简就是很多很多的数据。到宋代,垒起来跟人一样高的书籍就是很多很多的数据。到我小时候,1.44MB的软盘里就承载了很多很多的数据。时至今日,256GB基本是手机存储容量的标配,1TB硬盘里的存储空间也经常捉襟见肘。经常谈论到PB和EB(1PB=1024GB,1EB=1024PB),才让人感觉到数据量确实很多很多。
对于大数据,很多机构和学者都给出了不同的定义,例如研究机构Gartner给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。
那我们怎么来理解大数据呢?实际上我们可以从大数据的3V特征来剖析。
Volume指的是数据总量大,一般来说其数据量起码超过一台计算机的内存和硬盘容量。例如2020年12月的微博月活跃用户数为5.21亿,微信月活用户数则为12.25亿。其产生的数据总量是巨大的。
Velocity指的是数据产生和变化的速度快。例如世界上平均每分钟就会有2亿封邮件发送出去。一个传统车载毫米波雷达每秒钟就可以产生100MB的原始数据。
Variety指的是数据的多样性。例如一辆智能驾驶汽车上需要采集的数据可能就包含了视频数据、毫米波雷达射频原始数据、环境声音数据、GPS定位数据和V2X网络连接数据等。这些数据都有不同的数据格式和特征。
正因为具有这3V特征,大数据的处理难度很高,亦因此衍生出云计算、数据挖掘、边缘计算等技术手段。
本文由培训无忧网AAA教育专属课程顾问整理发布,希望能够对想参加北京大数据分析培训的学生有所帮助。更多大数据分析培训课程资讯欢迎关注培训无忧网大数据人工智能培训频道或添加老师微信:15033336050
注:尊重原创文章,转载请注明出处和链接 https://www.pxwy.cn/news-id-11385.html 违者必究!部分文章来源于网络由培训无忧网编辑部人员整理发布,内容真实性请自行核实或联系我们,了解更多相关资讯请关注人工智能频道查看更多,了解相关专业课程信息您可在线咨询也可免费申请试课。关注官方微信了解更多:150 3333 6050