大数据

556

大数据是“转方式”的抓手

中国信息产业网

大数据更需要强调数据挖掘利用,而针对目前存在的技术应用、人才、**与隐私等问题,*关键的是要有国家大数据战略,使其成为转变经济增长方式的有效抓手。不要被大数据(Big Data)的“Big”误导,大数据更强调的不是数据之多,而是数据挖掘。数据大与价值大未必成正比,例如将一个人每分钟的身体数据记录下来,对了解该人的身体状况是有用的,但如果将他每毫秒的身体数据都记录下来,数据量将较前者高6万倍,与按每分钟记录的数据相比,其价值并不能增加。大数据的价值在于样本数的普遍性。统计一个人每分钟的身体状况数据与统计60个人每小时的身体状况数据相比,可能后者在统计上更有意义。大数据往往是低价值密度。大数据中的多数数据可能是重复的,忽略其中一些数据并不影响对其挖掘的效果。因此可以说大数据的价值好似沙里淘金和海底捞针。大数据的量越大处理难度就越大,就需要更多的服务器或更高速的服务器。实时性是大数据挖掘面临的挑战,而非结构化是大数据挖掘的主要挑战。目前国际上大数据处理技术主要集中在结构性数据,但是大数据中80%以上都是非结构性数据。目前国内外都有很多大数据应用成功的例子,但基本上还是结构性数据,对结构性数据

看“大数据”如何帮我们寻找爱情

长江商报

回顾过去的一年,“大数据”**是国内出版界的一个热词。从年初的《大数据时代》《删除:大数据取舍之道》,到年中的《数据统治世界》《数据化决策》,及至年尾刚刚由浙江人民出版社推出的《大数据云图》,关于大数据的热浪始终未息。美国**风险投资人、《大数据云图》的作者大卫·芬雷布在书中用大数据解读商业与生活,告诉我们关于大数据的各种实际应用——从大数据如何改变我们的生活方式、教育方式,直至我们寻找爱情的方式。大数据江湖正群雄逐鹿作为该书的核心部分,芬雷布绘制的一张关于大数据应用程序及各种角色的“大数据云图”,为读者展示了“大数据的大好河山”,吸引了无数的商界、IT界等精英人士关注,据说曾放在IBM 高管们的案头被研读。从这幅大数据云图中,我们可以看到在目前大数据应用产业格局中,世界500强企业分据的角色,以及还有哪些领域正亟待填补。从大数据应用基础设施、软件开发、服务维护,到数据综合分析、商业智能,以及广告运作,在大数据产业链上,各企业的分工正日趋精细,合作越发紧密。在大数据的蓄水池中蕴含了太多的秘密,如今单凭一个公司的力量再难以应付从基础设施、网络维护、数据分析,到综合应用方面的所有难题,我们

大数据

557

高速驾车**门事件与大数据应用

比特网

对于高速驾车**门事件相关的报道已经很多了,其中,以律师的分析结论*为合理:由于当事人身处公共场所,又是因为超速被拍,所以从照片获得的手段上讲并没有构成对当事人隐私的侵犯。但监控拍照本是为交警处罚驾驶员提供依据,而无论任何单位和个人都没有权利将其监控照片进行上述目的以外的用途,亦或通过网络进行公众传播,所以,相关交警部门无疑存在着对监控照片管理疏漏的问题。简单来说,视频监控并没有侵犯公民的隐私,但将照片通过网络进行公众传播就是违法的行为,问题是传播者的违法行为得到追究了,所有转发该信息的个人和网站得到追究了吗?法不责众,这不能够用来判断是非标准。如果有是非判断的标准,所谓“**门”就不会成为事件。这和大数据有什么关系呢?这也是我恰恰想说明的。公安卡口每天都会产生大量的数据,所谓行业大数据。这些大数据蕴含着怎样的商业价值,对于城市的智慧交通会产生怎样的影响,其价值是不言而喻的。问题在于,如何通过大数据应用发挥其应该有的价值?从掌管大数据的交警部门来看,单纯依靠其自身的实力,还没有能够很好驾驭大数据的能力,否则我们的交通就不会这样的拥挤了。智慧在民间,需要依靠社会的力量,换句话说,交管部门

企业社交网络大数据云计算是2014主要IT趋势

论坛

据微软全球企业和合作伙伴事业部副总裁苏珊·哈瑟(Susan Hauser)称,2014年IT行业将有新的挑战和机会。她说,微软预计在新的一年里有些方面将对企业如何利用IT资源产生重大影响。哈瑟在微软TechNet博客网站发表的文章称,企业社交网络正在成熟。机构正在认识到支持员工协作和客户沟通等社交模式促进业务的潜力。同两年前企业冷漠对待社交网络的情况相比,我现在几乎每一次开会都在社交网络上讲话。对于许多客户来说,商业差异化来自于以有意义的方式对不断变化的客户情绪迅速作出回应的能力。哈瑟例举了饭店连锁店Red Robin公司的例子。该公司成功地引发了公司所有级别的员工之间的对话。哈瑟说,像这样增强内部沟通能够节省资金,使公司反应能力更强和更迅速地改变路线。当广泛进行沟通的时候,一些公司甚至显著增强了士气。大数据将继续对企业提出挑战。这一次,日益增长的物联网将对企业如何管理数据增加新的紧迫性。物联网能够帮助企业收集改善投资回报的数据。但是,哈瑟警告称,同样重要的事情还包括保证企业正在分析正确的数据集、实时获取数据并且把其它数据留在设备上或者允许机器与机器之间的通讯。哈瑟称,一些智能是恰当的

大数据分析中的描述性、预测性和规范性三者区分

比特网

如果企业原始数据是未加工状态,一般不会产生价值,尤其对于大数据而言,更是如此。但如果采用数据分析工具,我们就可以把碎片化的数据进行管理,挖掘出有价值的信息。“在大数据处理中,获得大量的数据信息是**步,没有捷径可走。”来自美国的一位专家表示。有了数据,就可以做分析。但是分析要从哪里开始?哪种类型的数据分析*适合企业的大数据环境?该专家解释了描述性、预测性和规范性三个关键数据分析类型的不同,以及这些数据分析如何为企业提供价值。有了足够的数据后,你开始想该以怎样的形式看到这些数据。所以,你首先要建立一个数据模型,通过数据模型,了解这些数据是如何运行的,并通过数据模型做预测。**、 描述性的数据分析。这是数据分析中*简单的一个类型,企业把大数据通过压缩变成容量更小,或者更有价值的信息。描述性分析的目的是总结发生了什么事,超过80%的业务分析,特别是社会分析信息是描述性的。比如:通过一定数量级的帖子或页面浏览量可以说明某球星有多少球迷。但仅有这些指标是没有意义的,这只是一个简单的计数器。**、 预测性的数据分析。预测分析是利用各种统计、建模、数据挖掘工具对*近的数据和历史数据进行研究,从而对未

大数据

558

《大数据时代》――揭示“大数据”带来的变革

论坛

这本书,预测了大数据给我们带来的改变:就像互联网通过计算机加通信功能而改变了世界,由于大数据为我们生活创造了****的可量化的维度,并且把数学算法运用到海量的数据上来预测事情的可能性,因此也必将改变我们生活中*重要的方面。大数据正在改变我们的生活和理解世界的方式,成为新发明和新服务的源泉。书中讲述了大数据时代将会和正在引发的思维变革、商业变革和管理变革。其中关于思维变革的论述,尤其值得我们关注。作者指出,大数据将从三个方面转变我们理解和组建社会的方法。**个转变是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理某个特别现象相关的所有数据,而不再依赖于随机取样。其二,数据如此之多,以至于我们不再热衷于追求其**度。由前两个转变促成了第三个转变:我们不再热衷于寻找事物之间的因果关系,而是注意寻找事物之间的相关关系。然而,当世界由探求因果关系而变成挖掘相关关系,我们又怎样才能既不损坏建立在因果推理基础之上的社会繁荣和人类进步的基石,又取得实际的进步呢?人们也在关心,在大数据时代,我们生活在无处不在的“第三只眼”下面,“监视炼狱”给我们的隐私带来严重威胁。这些,既是本书关注的问题,也

大数据时代有奖收视或许可以培养用户行为

论坛

现在电视台的有奖收视大多被视为骗局。更多人接触到的都是手机短信假借知名节目送上的陷阱,诸如风行一时的“非常6+1”、“砸金蛋”等。可以说,现在流行的电信诈骗的祖师爷,就是这些假借媒体名义出现的**骗局。其实,电视在中国的竞争相当地残酷,几十家卫视和央视已经打得不可开交,地方上的小频道们也在夹缝中想寻得生存之路。越是竞争激烈,促销推广的手段应该玩得更加的有想象力和吸引力。电视台不做有奖收视,节目制作方可不干,他们为了收视率和竞争力,不遗余力,亲自上阵,出手救视。在手机短信风行的时代,发条短信就可以**的活动在各地风靡,连央视春晚这样的国家晚会也不能免俗,当然它一夜的收入也是相当可观。可是因为高额话费,产生了多少家庭纠纷和运营商扯皮的事情,在不知不觉中,短信互动又沦为鸡肋,得不到观众的回馈反应。电视是一个社交性很强的娱乐设备。过去大家沉浸在合家收看,甚至邻里共看的融融环境中,如今却都各自看着各自的媒体设备,享受前倾、后仰、背景等不同的观看情境。电视的社交性被手机和其它社交媒体工具取代。大家发现,60%以上的观众在观看电视时在玩手机,这也被称为“双屏战略”或“**屏”。于是很多人开发与之相关

大数据

559

智能精准大数据助力百度搜索优化

论坛

近年来,大数据已经成为了信息技术*为关注的热点之一,各行各业都在探讨如何利用大数据创造商业价值,一时间众说纷纭,各种关于大数据的应用方案接踵而来。作为全球*大的中文搜索引擎,百度每天响应来自138个国家和地区的60亿次搜索请求,它是一家真正拥有大数据的企业,在这个数据为王的信息时代,百度搜索如何应用大数据?大数据在搜索引擎效果测试和优化中有哪些应用价值?在百度**届开放研究计划中,百度网页搜索测试部的阮星华和南开大学的张建忠合作,共同承担了“机器学习在搜索引擎效果测试和改进中的应用”这一IT主题研究项目。据了解,这个项目就是百度利用大数据分析搜索引擎缺陷并优化搜索引擎的成功案例之一。据阮星华介绍,参与“机器学习在搜索引擎效果测试和改进中的应用”这一项目的成员,主要是来自百度网页搜索测试部的张鑫、李卓、张敏等,以及南开大学的研究生张文、朱晓曦,他和南开大学的张建忠教授作为合作双方的接口人,对项目实施具体负责。“互联网上的网页数量巨大,内容样式多种多样,少量网页还存在内容**,用户的需求表达方式也各有不同。因此难免会出现一些检索结果不好,不能满足用户需求的情况,这种情况我们称之为Bad C

大数据

560

交通拥堵指数大数据时代如何有大作为

中关村在线

12月28日开始,广州市民可以通过广州交通信息网、手机客户端软件“行讯通”等途径,查询广州市中心城区以及中心五区的道路交通拥堵指数。这是广州市**公布拥堵指数,也是继北京之后**个公布的城市。拥堵,已成为部分大城市不能承受之重。上下班高峰期长长的车龙,已成为每天定时上演的壮观剧目。拥堵对个人生活及城市发展的负面效益无须赘言。治堵,已成为当前城市管理者不得不面对的棘手问题。在这个大背景下,此次推出的交通拥堵指数,通过数字化模式,让民众“察言观色”(不同颜色提醒拥堵状况)知路况信息,从而优化出行路线,不得不说是一项民心工程。通过20000辆出租车及4000辆公路客运车辆回传的GPS数据得出的交通拥堵指数,完善了广州的交通信息系统,提高城市交通信息化水平,不仅与智慧城市遥相呼应,而且对于辅助政府决策、服务广大群众都良有裨益。且不论成效怎样,解困堵城,提速广州,每份努力都值得尊重,每跨出一步都值得期待。大数据时代,通过数字量化分析,能掌握*大程度贴近事实,有效避免盲目臆想与感性决策,对症下药,少走弯路。回到拥堵问题,数字化能否为优化交通铺路,还须在数字化的基础上,做好后续功课,以拥堵指数收集为

大数据

561

拥堵指数,大数据时代如何有大作为

大洋网-广州日报

12月28日开始,广州市民可以通过广州交通信息网、手机客户端软件“行讯通”等途径,查询广州市中心城区以及中心五区的道路交通拥堵指数。这是广州市**公布拥堵指数,也是继北京之后**个公布的城市。拥堵,已成为部分大城市不能承受之重。上下班高峰期长长的车龙,已成为每天定时上演的壮观剧目。拥堵对个人生活及城市发展的负面效益无须赘言。治堵,已成为当前城市管理者不得不面对的棘手问题。在这个大背景下,此次推出的交通拥堵指数,通过数字化模式,让民众“察言观色”(不同颜色提醒拥堵状况)知路况信息,从而优化出行路线,不得不说是一项民心工程。通过20000辆出租车及4000辆公路客运车辆回传的GPS数据得出的交通拥堵指数,完善了广州的交通信息系统,提高城市交通信息化水平,不仅与智慧城市遥相呼应,而且对于辅助政府决策、服务广大群众都良有裨益。且不论成效怎样,解困堵城,提速广州,每份努力都值得尊重,每跨出一步都值得期待。大数据时代,通过数字量化分析,能掌握*大程度贴近事实,有效避免盲目臆想与感性决策,对症下药,少走弯路。回到拥堵问题,数字化能否为优化交通铺路,还须在数字化的基础上,做好后续功课,以拥堵指数收集为

舆情如何与大数据“共舞”?

红网

2013年,“大数据”这一概念以夺目之势走进了我们的视野,学者在介绍,政府官员在谈论,世界互联网企业则纷纷启动“大数据”竞争,有媒体将今年称为“大数据元年”。大数据,正由技术热词变成一股社会浪潮乃至国家战略。(12月26日《长江日报》)随着互联网技术的迅速发展,信息量大、类型繁多、价值密度低、速度快、时效高的大数据吸引了越来越多的关注目光,大数据带来的信息风暴正在改变我们的生活、工作和思维。毋庸讳言,舆情服务在进行行业规范和整合的同时,正面临着大数据的挑战。大数据时代,对信息的“加工”是基础。据互联网专家介绍,大数据体量巨大,非结构化数据的超大规模和增长分别占总数据量的80%至90%,比结构化数据增长快10到50倍。从舆情产品服务的角度看,浓缩海量信息,抵抗“数据爆炸”已成舆情工作基本要求。故此,掌握数据抓取能力与舆情解读能力,通过“加工”实现数据的“增值”,将是未来舆情分析的必备技能。目前,国内很多舆情服务机构甚至没有专门的数据管理、分析部门和专业分析团队,分析人员对信息的鉴别力、萃取力、掌控力仍有待提高。在信息广度上大作文章的同时,未来需要一批有较高学习能力、分析能力、知识水平的数

大数据时代,中小企业如何应对?

论坛

据悉,2013年十大管理实践已揭晓,其中大数据挖掘榜上有名。大数据时代下,将精准营销提升到新高度。以往,再精准的营销,对象也是某一类人, 而在大数据环境中,每一个人都可以被区别对待,提供个性化的营销方案。 随着企业数据和相关信息的不断累积,数据挖掘将成为企业获得正确决策信息的重要工具。如今,大型企业已经充分认识到大数据的重要性,并以将其运用到生产、营销乃至战略制定层面。以亚马逊为例,有人说,它已经不是传统意义上的商务公司,而是大数据公司,因为它拥有日益成熟的云基础设施、海量数据流和内容。对亚马逊而言,它的目标并不在于通过出售时髦消费电子产品和昂贵设备获利,而是通过数据挖掘,搭建零售、出版和企业服务的综合平台。 那么,对于中小企业而言,如何做数据挖掘呢?笔者有幸调研过几家中小企业的管理层,这些中小企业的管理层一致认为:面对大数据的时代,哪一个中小企业可以*大程度的挖掘和管理企业数据,那么就意味着在这个竞争激烈的商业社会抢占了有利位置,而挖掘和管理大数据*有效的办法就是依托于一款专业的内容管理软件。 一般来说,一款专业的内容管理软件,不仅可以帮助企业实现各种商业文档的**控制和整个生命周期

大数据试验之上海样本:有应用才有动力

论坛

在上海举行的各色有关信息化的论坛上,“大数据”三字不绝于耳。而作为中国的经济中心,上海的数据资源之丰富亦让“大数据”在这座城市的应用留有更大的空间。2013年7月,上海发布《上海推进大数据研究与发展三年行动计划(2013-2015年)》(下称“计划”)。《计划》称,上海已经积累并将继续产生庞大的数据资源,例如,上海拥有世界*大的医联数据共享系统,有4800万张交通卡、亚洲**的证券交易额等。这些数据基础使得上海在城市治理中已经尝试运用大数据进行决策,例如世博会期间通过对天气、交通等综合因素的数据分析而进行的人流预测,以及在医疗资源管理和居民健康管理方面所进行的尝试。但这还只是起步。上海市科学技术情报研究所研究员缪其浩在接受21世纪经济报道采访时指出,对于上海而言,目前大数据的推进需要的不仅仅是在技术领域的推进,“还应当**推进各个领域数据驱动的**,而当务之急是解决数据**以及数据应用人才的问题。”上海医改与大数据试验医疗卫生是被《三年行动计划》列入公共平台建设重点选取的领域之一。《三年行动计划》称,将会针对临床质量分析、医疗资源分配、医疗辅助决策、科研数据服务、个性化健康引导的需求,