在2017的春晚上,央视主持人董卿称“利用大数据,统计目前总共有超过1.04亿观众观看了2017年春节联欢晚会,而移动端用户所占比例超过70%。”
听到这些话的时候,我是一脸惊(meng)讶(bi)的,一方面是因为似乎大数据已经成为了一个“热词”,连央视春晚都要把它挂在嘴边;另一方面则是因为,这样单纯的统计数据,是否能称作“大数据”,我在心里仍然留有疑问。
事实上,大数据的热潮兴起的时间已经不短了,现在大多数国内的企业,都已经过了“把数据留下来”的阶段,转而进入了“把数据用起来”的阶段。而相应的,在大数据产业的各个领域,也逐渐出现了一些行业格局。
目前,大数据产业可以粗略地分为了三类公司:底层基础设施类公司,通用技术服务类公司,以及垂直行业内的大数据应用公司。
数据堂CEO齐红威曾表示:“这三类公司其实数量上呈倒三角形,底层技术类的公司最少,而直接与行业接轨的公司占多数。”
底层基础技术类公司主要解决大数据的存储、计算上的硬件和软件问题。这部分公司虽然很难定义为大数据公司,但他们带来的数据存储量的飞跃、计算速度的提升,对大数据行业的发展功不可没。
这之中的很多公司从互联网时代和移动互联网时代就在为客户提供硬件解决方案。因此,行业中盘踞一些提供服务器、处理器等硬件的公司,以及云存储、云计算解决方案提供商。前者包括IBM、EMC、微软、联想等,后者则包括亚马逊、阿里云、华为云、七牛云等。
随着数据量的增加和业务需要,国内大型企业和机构面临设备更新换代的需要,底层架构市场可能依然巨大。2016年前三季度,根据gartner的调查报告,中国服务器出货量为181.4万台,同比增长10%,销售额为71亿美元,同比增长12%,中国是唯一还在增长的服务器市场,扮演了全球市场发动机的角色。
另外,在去IOE的趋势下,国外巨头的生存空间也在变小,并因此逐渐让路给国内民营公司。以X86服务器市场为例,浪潮、华为、曙光,在2016年第三季度出货量均有同比增长,而惠普等国际巨头则出现了同比下降。
在数据架构上,如虚拟化计算和分布式存贮这样的新技术更多被使用,一些初创公司依靠技术脱颖而出。
通用技术服务类公司
这也是我们一般所说的大数据技术公司,它们提供数据源、数据处理上的技术和资源支持。由于数据在整合收集和进行挖掘应用中间,还需要经过一系列粗处理过程,而在这个过程中,就形成了几种类型的公司。
产业链中主要的通用技术类公司,以数据本身或者数据的粗加工产品作为交易的对象,以赚取数据产品差价;同时,它们也会对数据进行清洗整合,将跨行业、跨领域的数据进行打通,从而为特定的客户提供特定的数据支持。
以聚合数据和数据堂为例,这样的公司通常被称为数据平台服务提供商,他们既拥有优秀的数据源整合能力,也拥有庞大的数据处理技术团队,更像是数据源和数据应用之间的一个桥梁。
对前者,通过搭建数据平台体系,不断吸收新的数据源来扩充自身的覆盖范围和种类;对后者,通过建成数据服务平台,支持很多数据解决方案提供商来做各行业的解决方案。
在通用数据服务中,还有一类特殊存在的数据源公司。目前,大数据行业的数据来源共有四种:政府公开数据、网络爬取数据、行业内合作伙伴数据和大数据公司生产的数据。除此之外,一部分行业数据由BAT这样的互联网巨头所掌握(搜索数据、电商数据、社交数据等)。不过这些年,随着移动互联网的异军突起,移动大数据也成为数据源中的重要组成部分,因此也崛起了像Talking Data和极光大数据这样的,进行移动大数据整合的数据服务商。
另外,在大数据通用技术中,还存在着许多其他细分领域领先的公司。有专门为不同类型、不同结构的数据进行打通的公司,如翱旗科技;有在数据可视化领域独树一帜公司,如海致BDP;有专注于数据安全处理的公司,如同盾科技、深信服等。
这些公司共同组成了大数据行业的通用技术服务领域格局。部分业内人士认为,大数据通用技术服务领域的公司,一般都发展了3-5年,也得到了资本市场的不断支持,现在格局基本已定,剩余的空间和机会并不是很多。
垂直行业的数据应用类公司
这是目前大数据产业离“钱端”最近的领域。
这类公司共同的特点是对于大数据行业和所处行业的双向专业性。既知道国内各个数据源的状况,做过大量的数据处理类项目;也贴近市场和所处行业,了解客户需求。知道使用什么样的数据,用什么样的数据处理方法来帮助用户解决什么样的问题。一般,这类公司都会锁定某一行业进行深耕,并与这个行业进行深度整合。
目前在国内,比较成熟的大数据应用领域是 商业智能、金融风控和广告营销。在这些领域中,也都出现了不少规模较大的公司。如百融金服、通付盾、帆软软件、秒针系统等,这些公司大多成立了3年以上,完成了B轮或C轮融资,估值超过10亿人民币。
当然,除了这三个方面之外,也有公司专注在医疗、工业、农业、泛娱乐等领域的大数据应用。如专注工业大数据的美林数据、昆仑数据,专注农业领域的佳格大数据,专注医疗领域的碳云智能、医渡云,专注泛娱乐领域的Dataeye等。
但目前来看,由于数据源整合程度差、大数据与行业结合性人才稀缺以及行业内对大数据应用认识不充分等原因,这些领域的大数据应用依然发展缓慢。这些领域的大数据应用想要有进一步的发展,既需要行业内数据量和数据源的积累,同时也需要加强数据应用推广,让更多行业内人士看到大数据带来的好处。
关于数据源的开放性和优秀数据源拓展
目前来看,大数据公司通常采用的都是2B或B2B2C的经营模式,因此也就不存在2C公司的爆发性增长期。因此,虽然大数据的概念现在十分火热,但对于行业的发展速度依然要有一个清醒的认识。
优秀的数据源和大量的数据,依然是大数据行业发展所需要的关键因素。目前,优秀数据源有向几家较大的数据服务平台聚拢的趋势,行业数据正在逐渐进行整合,这有利于大数据产业的发展。而单纯网上爬取的公开数据可以挖掘的价值已经很小了,需要多维度的数据才可以进行进一步的数据应用。
而政府的数据公开,同样是拓宽数据源的重要措施。不过虽然政府对于可以公开的数据一直保持着开放的态度,但政务数据的流通速度实际上比较缓慢。
此外,数据孤岛也是制约大数据行业发展的因素。例如BAT所掌握的数据虽然可能开放后价值更大,但经过前些年的发展,它们在内部已经形成了比较完整的数据收集、应用、反馈的闭环流通模式,因此开发的可能性也比较小。
随着时间的推移,大数据行业的进一步发展,优秀数据源的瓜分,未来人工智能公司有可能成为新的数据源入口。因为在现如今,虽然大数据已经形成了一定规模,但还有大量的低价值密度数据(如出行记录、交通监控、语音信息等)还没有被开发,一旦这些数据能够被结构化并进行应用,很有可能为大数据行业再注入新的活力。
我认为虽然不能称之为爆发,但大数据产业,现在正在处于一个高速发展的时期。越来越大的数据量,越来越开放的态度,越来越智能的数据处理方式,都在推动着这个行业的进一步发展。
而在这条跑道上的公司,大可以抛开外界的追捧和热议,把自己的事情做到极致,积累经验和资源,自然能等到量变产生质变的一天。
本文作者李基祥,亿欧专栏作者;微信:ligi_avd(添加时请注明“姓名-公司-职务”方便备注);转载请注明作者姓名和“
欢迎大家继续关注慧邮件邮件营销平台,也可以在我们的慧邮件官网了解更多邮件营销技巧,大数据知识,也可以通过电话:400-666-5494联系到我们,更多精彩知识、活动等着你。