大数据和云计算紧密相连,云计算是大数据寻找轨迹和实现真正价值的关键。然而,大数据并不是飘在天上的虚无,它需要依靠数据共享这个“根”。
什么是大数据呢?维基百科给出的定义是指无法用常规软件工具在可承受时间范围内进行捕捉、管理和处理的数据集合。大数据有海量的规模、快速的数据流动和动态的数据体系、多样的数据类型以及巨大的数据价值。如果把单个或局部领域的数据视为小数据,那么大数据就是由成千上万个相互关联、相互交织的小数据汇聚而成的。小数据的融合是大数据形成的基础,这种融合就是共享。没有小数据的共享,就没有大数据的“根”。
为了能够快速从海量数据中分析和挖掘有用的信息,单台计算机已经无法应对,必须采用分布式架构和云计算技术。云计算通过分布式处理、分布式数据和云存储、虚拟化技术将庞大的计算处理程序分成无数个子程序交由多部服务器处理,并将结果返回给用户。显然,如果没有数据的共享,云计算也无法运行。
然而,数据共享涉及到很多实际问题,包括数据的开放性、法律边界和数据价值的实现等。在现实世界中,许多政府公共信息仍然是零散、分割和封闭的状态。各级政府部门掌握大量的数据信息,其中涉及企业和个人的数据最为丰富。目前,有用的企业信息可以归纳为基本情况、真实经营状况、资信状况和融资情况等。然而,这些信息在不同的政府管理部门之间分散且孤立,没有实现数据之间的共享、连接和融合。数据共享的难题影响了大数据的发展,并且妨碍了相关主体的发展。银行业在为小微企业提供信贷服务时面临着信息瓶颈,信息不对称使得银行在贷款时难以把握企业的真实情况。
信息共享难的根源在于部门利益。相关部门在参与公共信用信息平台建设时往往叫得响、做得少。一些部门将自身拥有的公共信息视为“私有财产”,只提供有偿的信息,或者以保护商业秘密为借口不共享企业信息。有些数据拥有的部门缺乏主动提供数据的动力。此外,个别地方政府也可能因为局部利益的考虑,阻止负面信息的公开,影响信息数据的共享。这种信息割裂状态的深层原因是社会信用体系建设法制化步伐缓慢,相关政务信息的征集机制不健全,对信用信息使用在公开与保密之间的法律边界不明确。
总之,数据共享是大数据发展和云计算实现的关键。当前存在的数据共享难题阻碍了大数据的应用和相关主体的发展。政府和部门应加强合作,推动信息共享,共同开创大数据时代的未来。
版权说明:
1、特别声明:以上文章内容仅代表作者本人观点,不代表建米软件观点或立场。如有侵权、违规,可直接反馈本站,我们将立即删除;联系电话:400-8352-114
2、文章版权:原文来自海客宝网站,版权归原作者所有。
添加专属销售顾问
扫码获取一对一服务