首页  /  要闻  /  要闻
阿里数据天团解密
2015-11-16 14:59:33
1823浏览
随着生意参谋一统数据江湖,阿里数据团队的神秘再次被大家所关注,此次,对话阿里副总裁、数据委员会会长车品觉,一起走进这个神秘的团队,并且看看数据部门都在忙什么。

图为阿里副总裁、数据委员会会长车品觉


  问:数据团队很神秘,是个怎样的团队?都在做什么工作?

  车:团队大概是400人左右,主要有四种岗位,当中有很多分析师,基本全集团各个部门的分析师都在这里,分析师聚在一起能做出东西并且不会太零散,很多部门发现分析师打散了会没有凝聚力,会变成打杂,不是去想分析的部分。

  另外有很多数据工程师,这些同事最主要是让数据进来稳定,对数据进行规范、计量,然后每天输送出去;他们下面就有产品经理,开发产品,一种给小二使用一种给卖家们使用。所以不会因为双11,卖家们就看不到数据,有独立团队。

  此外,还有数据科学家,当每一个部门需要算法的东西,他们会去协同,一些未来的产品都需要数据科学家做算法。总结一下他们的工作,有些是做数据服务,有些做产品服务,还有些做分析服务和算法研究。

  问:解决问题需要用多少数据?如何用大数据来解决问题?实际运用场景是怎样的?

  车:我是个实用主义者,我要解决一个问题,一般来说都会找一个最简单成本最低的方法,除非不能解决,才会使用一些更转折的方法。这个时候就需要更多数据量来解决,甚至还有一些今天没有准备好的数据。

  其实大数据应用是商业问题,不是技术问题。商业应用上,如果有一些很简单的结构性数据,大概能解决这个事情的80%,就不要寻找用很难的方法去解决另外20%。我不需要用阿里那么多数据来解决,我用很简单的方法都能解决这个事情,我觉得可以了。
  
  当然,一部分困难问题,我们需要用比较复杂的方法来解决,分为两种,一种使用很复杂的算法来解决,一个是用更多的数据来解决。以打车软件为例,打车软件如何更容易打车,那个时候就研究怎么样把算法提炼到很快找到出租车。在数据不变之下,算法可以更精准。等算法到了瓶颈,会发现有些情况是之前没有考虑到的,就要去搜集这些数据,可能包括天气,只要下大雨出租车就会减少需求就会增加。

  大数据其实是一个全局观的分析。需要全局观解决问题的时候,别人的知识对你很重要,不能只依靠自己解决,所以我们要和其他东西关联起来。关联性对大数据来说和物联网一样,不关联价值会降低,关联价值会增大,只是要考虑到个人隐私和数据安全两条维度,数据开放性会增加更多关联性,也会增加数据安全问题,需要注意平衡。

  问:数据部门在双11主要负责什么?数据如何保障?压力是什么?

  车:双11需要准备的数据和数据大屏都是我们负责。数据人的压力,就是数据要准确,数据不准其他都是浮云,最担心的是数据不能及时出来。双11整个数据的回传、计算,都要做很多方案去确保数据不要停滞。因为数据是实时计算的,卡在任何位置都是可能的。每年双11的每一秒都可能破记录,所以要提前几个礼拜模仿这种压力,以及在压力下会出什么问题,我们叫抗压测试。

  数据有个麻烦是需要归总,万一源头出错了,后续都出错,出错之后更正需要时间,更正回来再回去就慢了,所以我们要确保24小时的数据没出错,所以压力很大。去年很顺利,过去几年很顺利。今年新突破是我们在卖家端开通了数据作战室大屏,今年他们能看到的数据量大很多。

  以往只有阿里集团的屏幕,现在是这么多卖家这么多大屏,每个都可能卡住。数据实时就是最大的挑战,一旦实时就暴露了数据的不稳定,以往数据晚了15分钟进来你没感觉,但实时数据1秒不动我们都会有感知。实时挑战的是整个数据团队的合作性,哪个环节掉了链子,所有全盘就都不动了。


最新文章
光云科技(688365.SH)拟首次发行4010万股 15日初步询价
2020-05-19 11:27:40
2019义乌电子商务博览会,将于4月11日启幕
2019-04-04 15:39:52
2019义乌电商博览会亮点纷呈
2019-04-04 15:36:58
淘宝首发直播通:12个商品池包含约13万商品
2019-03-29 09:38:05
手机淘宝“特卖区”正在灰度测试
2019-03-26 16:15:32
京东购物圈招募超级合伙人 还配专属经纪人
2019-03-26 09:15:17
天猫国际发2019战略:海外仓与内容化成重点
2019-03-22 09:27:04
小红书上线“品牌号” 并进行五大模块升级
2019-03-21 09:25:05
精选专题
热门阅读
大家都在搜