在某一个真实的脱敏区域中,给你 30 分钟内的订单信息,如何利用算法预测接下来的 10 分钟会发生什么。然后与真实的情况进行对比,谁的算法更优秀?
对于非技术专业的同学来说,可以简单理解为,给你一堆看起来毫无规律的数字序列,然你猜出接下来的 10 个数字应该是什么。当然这只是个比喻,上面的题目比那个更难一些,因为所有的数据都是动态的,随时有不确定的因素加入,10 分钟后时间不长,但预测非常不容易。
这是今天结束的滴滴 Di-Tech 算法大赛的赛题,经过三个月的角逐,Inferrrr 队、一剑风吼队、Blitz 队分别以富于创新的模型建构、细致独特的特征工程以及深入的观测分析获得一、二、三等奖,一等奖获得了本次比赛最高奖项,10 万美元。
为什么要举办这样的比赛?对于滴滴创始人程维来说,滴滴筹备算法大赛更多代表其对人才的渴望和滴滴发展人工智能的决心。在当下, 滴滴出行可以用人工智能来提高出行平台的供需匹配效率,在未来,人工智能与滴滴出行将有更多契合点,将改变出行、交通相关的更多领域。
你平常在滴滴出行叫一辆车,车是如何匹配到你的,这个关系看似简单,但在背后滴滴研究院的众多数据分析专家做了大量的工作想要让它更准确、更有效率,而不仅仅是表面上的「拉郎配」。比如在有一个需求的时候要考虑附近乘客和司机,要考虑乘客和附近的乘客,要考虑这个乘客本身的喜好,不同乘客的喜好不一样,要考虑司机的喜好,要时效很高,如果一秒钟之内不能做出最优的解,这个车往前开一点就回不来了,信息是不挑人的,但是人和乘客两边都是有自己的判断,没过一秒情况都会有不同。 搜索一个人搜和一百个人搜区别不大的,但是一个人叫车和附近 5 个人叫车,那就完全不一样,这就是滴滴的复杂性。
原浙江大学教授、现任滴滴研究院院长,大数据领域顶级专家何晓飞认为「大数据是燃料,算法是引擎。」滴滴拥有海量的数据,要解决非常复杂的出现问题,对于科学家来说,有非常大的吸引力。
迄今,筹备了半年多的滴滴研究院把机器学习技术应用到了地图领域,使滴滴地图 ETA 误差率达到业内最低水平。经过算法完善后的滴滴专快车平均接驾时间低于 5 分钟,司机每小时接单数、每小时收入都有了显著的提高。
滴滴出行 CTO 张博说,现在对于未来 15 分钟全程需求分配预测准确率是 85%,然而对滴滴,对乘客最理想的状态是在需求发出来的前一秒,已经调了一个最适合这个需求的座位到这个需求的旁边,需求发出来了以后 100% 成交,成交距离为 0。而对于司机来说,最理想的状况就是司机只要接入滴滴的平台,立刻会把 4 个座位全部售卖掉,一直到他离开滴滴的平台下线。
而且如何把对主观性特别强的「服务」维度用算法来量化也是很有挑战性的一件事情,这个需要很多大数据分析每一个司机的服务怎么样,一个车的服务品质怎么样,最理想的状态是提供好的服务的座位的司机,能够获得非常合理的,稳定的,比较高的收入。提供比较差的服务的司机,它的收入要比好的司机低一点,并且他非常清楚,他在哪几个点需要改进,而且他改进了以后,就可以获得更高的稳定的收入;对于长期不改变的司机,通过大数据分析会把它识别出来。
除了以上,人工智能要解决的不仅仅是人车匹配以及服务的事情,比如在业内普遍用「动态调价」来调节供需的时候,滴滴出行想要从供需预测加运力调度来消除「动态调价」。如果平台可以预先知道区域的供需情况,并且提前把空余运力引导到这个区域,那么不需要用价格调控,就可以实现平衡。优化行程后,司机不用空驶,收入亦会提高。
很多经验丰富的司机师傅总觉得自己的经验更靠谱一些,然而大数据表现出来的结果很轻松就能打败「多年来的经验」,比如在路线的选择上,我们经常会遇到一些自信心特别强的司机师傅可能凭借自己的经验觉得某一条线路堵车的概率不大,但实际上这条路虽然不堵,但是却有大量的红绿灯耗费更多的时间,这时候大数据反而可以从更大的区域和路线中预测出一条效率更高的路线,所以现在很多司机都变得乐于听从导航路线的建议。
再比如运力调度的问题上,在空车的情况下,有些司机师傅会根据自己的经验决定去一些区域拉活,或者自己更熟悉的区域。但是他可能不知道,去另外一个冷门的方向订单虽然少,但是到达区域之后下一步的订单会更多。
经验和大数据的区别就在于经验只能预测到未来的一单或者两单(可能都不会准),然而大数据可能会预测到一整天的安排,而且准确性会更高一些。
基于这样的愿景,滴滴研究院召开了 Di-Tech 算法大赛,希望从世界范围内筛选人才和算法。
尽管机器学习、人工智能的概念已经被提出很多年,但何晓飞人认为,人工智能时代已经拉开帷幕。随着大数据的积累,比如滴滴每天可以产生 70TB 的数据量,运算能力的提升,GPU 取代 CPU 成为处理数据的工具,再结合经过训练的算法,最终迎来的是更加接地气、更加聪明的人工智能。
欢迎大家继续关注慧邮件邮件营销平台,也可以在我们的慧邮件官网了解更多邮件营销技巧,大数据知识,也可以通过电话:400-666-5494联系到我们,更多精彩知识、活动等着你。