当我们需要知道一家公司的背景时,我们可以到当地工商局网站查询这家公司的注册信息、到工信部网站查它的备案信息、到新闻网站查询关于这家公司的报道,这些基于法律原因对外公开的信息可以让我们初步了解一个公司的基本情况。但是在专业领域,例如法律和投资,我们有时不得不选择付费查询一家企业的非公开信息。相比之下,这些公开信息的价值似乎是低于非公开信息的。
但随着大数据时代的到来,网络上的公开信息俨然成为了一个个信息富矿,亟待被大数据工具开发,这正是工商信息查询系统“天眼查”正在做的事情。
基于对大数据和企业信息的这种深刻认识,曾经在微软、腾讯和搜狗等科技公司任职的大数据专家柳超于2014中创办了“天眼查”。天眼查是一款能够为用户提供商业关系发现功能的产品,通过数据服务功能,用户在天眼查专业版中输入某个人名或企业名称,就可看到该主体下所有关联体的直观呈现,同时发现出更多隐藏在背后的商业利益关系,自动生成关系图。
例如在上个月引起诸多讨论的“《叶问 3》票房造假”时间上,如果在“天眼查”App上选择几家相关公司和个人名称的话,用户就可以直接得到一种错综复杂的利益关系图,包括投资、控制、商业合作等信息都能被一目了然地展现出来。
图片来自:“天眼查”截图
另外“天眼查”的网站和App还能为用户提供单个企业的工商注册、备案、股东、对外投资、法律诉讼、年报(上市公司)等信息,这些来自公开渠道的信息被“天眼查”以评分的形式直观地变现出来,让用户非常方便地进行判断和比较。
针对互联网公开信息如何与大数据结合、公开信息如何产生价值等问题,上周创界(公众号:ChuangDaily)采访了“天眼查”创始人柳超,以下是此次采访的实录:
创界:为什么想从搜狗出来做天眼查这样的产品?
柳超:说起来话会稍微长一些,为什么选择做天眼查?我以前没有想过做“天眼查”这个名字的项目,但是做这个事情是早就有这种想法,因为如果大家有兴趣看一下我在2011年有一篇学术论文,那时候还在美国微软研究院。我当时在研究院带一个实习生做项目,当时我们做了一个有关于美国一个网站TechCrush的项目,在中国比较类似应该是IT桔子。它里面有一个数据就是初创企业的信息,类似于工商信息,里面有关联的人,投资机构等。我们当时做的是,能不能通过公司之间人实体之间关系的投资结构,以及新闻上的信息预测哪些公司得到投资,如果得到投资会得到谁的投资?当时理念就是说我们处在一个由人组成的社会,所以很多决策在于人,所以人是决定因素,依据这样一个理念做了一个预测模型效果很不错的,当时发了几篇文章,当时把这个当做常规的学术论文处理了,后来又过了大概几个月,美国的《商业周刊》转载这篇学术论文并且做了评价,说这个是很有趣的工作。当时我看了这个很受触动,我研究跟商业价值联系比较紧密的,当时我就开始思索这个事情是不是在中国可以做。我2012年回国就想做这件事情,但是当时很多数据公开没有开始,所以当时几年在腾讯、搜狗工作,主要就先学习了一些中国互联网的产品化的脉络。后来觉得时机成熟了,就下定决心开始出来做天眼查。和之前的那篇论文相比,虽然做的事情不一样,但是里面结构和思路是一样的,组建人、实体这样一个关系网看清这个世界。
创界:为什么选择做数据挖掘这个事情?
柳超:我之前的经历一直在做数据挖掘方面的科研。我觉得很多人定义“大数据”元年都不一样,其实早到2002年2013年每一年都说是元年。大数据火了这么多年,其实面临一个困境,到底什么样的数据我们才能对它进行挖掘并且产生价值。这就有两方面,一种是公开的数据,你有我有大家都有,你去挖掘别人也去挖掘,在数据源上没有任何竞争力,所以我不去挖掘。另外一个就是大型的企业,不论是传统行业还是互联网行业,由于自身的业务积累有很多私有数据,这些私有数据不会拿出来,它们自身可以做挖掘,外边很难说挖掘一下你的数据,那些叫做特权数据,就是私有数据。私有数据看不到,高价值数据,业务数据看不到,公开数据挖掘又怕没有核心竞争力做,所以大数据搞得无而形比较虚。我们觉得公开数据大有所为,不敢去做觉得这种实力和思想没有达到那种,觉得做不出来有壁垒的事情,但我们现在到了已经能做出这个壁垒的事情出来的水平,所以我们才有底气这么说。
创界:根据介绍,天眼查的信息是互联网上公开的信息,能不能说具体一点,除了工商登记信息,还有一些其他的信息吗?
柳超:刚才我说的是公开,我没有说具体的来源,政府上有一些公开的公示信息,例如:最高人民法院的裁判文书、企业网站备案信息等,这都是国家机关出来的公开信息。公开信息并不是说只有国家出来的才是公开信息,新闻媒体上的新闻那也是公开的信息。它虽然不是政府的但是也是公开的。
创界:目前天眼查主要应用在哪些领域?
柳超:天眼查的网页版、专业版是2 C的。企业版和定制版,区别在于说都是企业客户,只不过有一个标准化的,另外一个定制的。标准化的产品——企业版的就最大应用范围就是金融行业,要做风控,要做审计,它要查关联交易,这是逐步缩窄的过程,金融行业都是需要查关系的,再往下审计要查关连交易,所以企业版那边做得是金融行业以及大的律所,他们查的东西比较多,并且还有提醒这属于风控。定制版更多是融合他们自己自有的数据。对很多业务来说他们有价值的数据是他们自己的业务数据,也就是说私有数据,跟私有数据结合起来能产生更大的价值,因为我们把它组织成一张网,所有数据过来以后可以拼接出更多连接更加有价值,定制版着眼点就是把企业业务数据和私有数据结合,更好的服务他本身的业务。垂直领域的企业其实还是属于金融、律师、咨询,精英化的。
创界:我注意到现在这些创投媒体也在做数据方面的项目?请问天眼查和他们有什么区别?
柳超:这个行业越多人来做越好,这样大家都可以合作共赢,我们一直都是以这种开放的态度去做的。这个也是我们是中国唯一一个不去注册不去登录也没有验证码的企业服务平台的工具,我们受益于政府的数据公开,我们同样以开放态度服务我们的用户。我是从腾讯出来的我非常敬佩马化腾的一句话:“我们走开放之路,开放不仅是一种态度,更是一种能力。”数据是公开的,大家都可以访问的,为什么要让别人注册登录有各种限制呢。
创界:就您在对大数据观察理解上,您认为大数据在商业范围内还有哪些更多的应用?
柳超:我们接触这些客户最大商业价值就是各个企业他们自有数据和公开数据的结合,他们自己的业务数据。好比一个公司是造汽车的,它需要螺丝,它有很多供应链的信息,做同样一个螺丝好几家都能做,到底用哪一家,有很多交易数据信息,再看看外部对公司的评价,他们其实都是一个集团的,这个东西借助外部的信息来做,这家公司口碑怎么样?大数据在商业范围内的更多的应用场景,需要借助外部数据和内部数据结合。
创界:什么样的人会用免费的网页版,什么样的人会用专业版呢?
柳超:可以这样说各种各样的人都会用网页版,网页版大家都会查,甚至你要找工作,甚至有一些小孩子在北京、上海打工,在家父母查一下这家公司看这家公司怎么样,这是天眼查的意义。可能对于老人来说可能也看不出来它有什么,但是可以看到你的分数,最直观的感觉,高分就是好公司。网页版面向更广阔的人,包括寻找合作伙伴、找工作之类的。甚至一些券商他们没有下载APP的时候,用天眼查网页版,就在网页版查到了他们想要查到的信息,就停止了相应的上市计划。高端精英人士用的是专业版,精英背后都是企业,律师背后是律所,金融界精英最后是投资机构。如果是企业使用的化,就是企业版,如果跟自己业务绑定就到定制版了。
创界:您对天眼查未来有什么规划预期?
柳超:未来预期成为大数据标杆性高科技企业。我们首先是有大数据积累的,我2003年毕业去美国读的就是数据挖掘,当时去了UIUC,在美国排名第五的学校,从那时候开始做数据挖掘,所以很多人问大数据是什么?大意味着什么?我觉得大并不是意味着有多大硬盘多大集群能够存储,大在于影响力。有些数据可能天生比较稀缺,但是从稀缺性并不能变现出来多大的影响力。我经过十几年数据挖掘的训练,具有一个较为严谨的科学思维,知道在大数据里面什么是可用的,什么是不能做的,并且也有实际经验,所以我相信我们会跟其他很多大数据企业是不同的气质。现在我在创业,同时担任在国际上很多顶级学术委员会的委员,最近今年国际上最好的数据挖掘会议KDD,我是高级委员。同时我借助以前学术上的积累能够知道在国际上现在数据挖掘方面做什么样的事情。
我是来源于学术我们也会反馈学术,去年我们作为白金赞助商,赞助国际上另外一个数据会议ICDM,做一个白金赞助商,同级的还有百度和阿里。我来源于这个团体,我出来做创业,有了一些力量还是希望反馈回去,希望能够资助更多的有志青年做研究,做更多的发现。当时,我们投资人非常支持这样的反馈。今后,我们将会以更加开放的心态来去做。
创界:最近有没有融资计划?
柳超:现在有比较多的投资者找到我们,觉得以前没有听说过,现在看到产品了,通过网页版的查询发现很好。我们现在刚开始接触,我们也没有市场推广,也没有烧钱。所以有什么相关消息的话第一时间通知大家。
欢迎大家继续关注慧邮件邮件营销平台,也可以在我们的慧邮件官网了解更多邮件营销技巧,大数据知识,也可以通过电话:400-666-5494联系到我们,更多精彩知识、活动等着你。