本篇文章6404字,读完约16分钟

[领先]当大数据开启时代时,拥有大量交易数据的阿里巴巴意识到这是一个富矿,开始摸着石头过河。

大数据打开时代,拥有大量交易数据的阿里巴巴意识到这是富矿,开始摸着石头过河。

◎本刊记者崔婧|文

500多年前哥伦布环球航行时,最想的是航海地图。 否则,我就不会把美洲大陆当成印度了。

大数据打开时代,阿里巴巴集团(以下简称阿里)从大量交易数据中挖掘出有价值的数据,就像在海上航行一样,马云的鸿鹄之志也是其航海地图。 哥伦布的目的地是印度,马云的目标是大数据。

马云主张平台、金融、数据是阿里未来的三个战术方向。 其实,“阿里的未来本质上是数据企业”,电子商务越来越离不开数据,金融的核心也是数据。 阿里设立首席数据官,将首席数据官陆兆禧提升为ceo,收购移动app数据企业友盟等,标志着马云的大数据战术萌芽。

“阿里“玩”大数据”

当几乎世界上所有的企业都还在大数据面前徘徊的时候,马云即使有大数据的宏观指令,具体操作层面也只能摸着石头过河。

25事业部战术调整完成后,阿里巴巴成立数据委员会,由淘宝网商业智能部负责人车品觉担任首任董事长。 在微软、ebay担任产品经理,在支付宝( Alipay )、淘宝担任数据业务的香港人,半生沉迷于数据迷宫。

“我来淘宝是因为喜欢那个数据,所以想好好整理数据”车品觉对数据非常兴奋,在接受《中国经济与新闻化》记者三个小时的采访后,必须对同事进行大数据方面的培训。 这个时候已经是晚上十点多了。

车品觉是马云大数据战术局面过河的卒子,负责为阿里寻找打开大数据之门的钥匙。 马云给他一个非常宽松的工作环境,连具体的kpi评价都没有。 在接受《中国经济与新闻化》记者采访时,他并不重视所谓的大数据盈利模式等问题。 “阿里和别人不同的地方是想尝试不同的产品,连领导都控制不了部下在做什么。 如果热爱数据的人们玩出很多产品,偶尔出现蚂蚁金融这样的产品就好了。 允许他们玩的是允许他们脱颖而出。 做数据现在急于赚钱就没有机会了。 ”。

“阿里“玩”大数据”

“玩数据”其实没那么简单。 特别是自从车品觉成为阿里数据委员会的安全负责人之后,他总是很不安。 他认为,未来一段时间内,数据质量、数据安全、数据化运营将是阿里必须跨越的三座“大山”。

从“提取数据”开始

有人预言,2003年的淘宝还是个“孩子”,是个无形的购物平台,不像当时的ebay那么有名,18个月内就会死去。

18个月后,淘宝取消预言,淘宝交易量基本呈指数增长,2006年上半年注册客户数超过易趣。 从某种意义上说,兴趣的存在是淘宝数据业务起步的外部动力。 随着兴趣爱好的销量,淘宝开始收集每日交易额、客户拜访数等数据,提高了从开始到数据的粘性。

“阿里“玩”大数据”

淘宝严格意义上的第一个数据产品是“淘数据”,表示这是经营数据报告。 “各企业需要了解经营状况,即使淘宝业务扩大了,也需要根据经营状况来决定未来。 《淘数据》是用于内部报告服务的工具,于成立约2年后的2005年开发。 ”。 淘宝商业智能部元老级数据观察者告诉《中国经济与新闻化》记者。

“阿里“玩”大数据”

这一年,淘宝迎来了第一个数据观察者。 半年后,淘宝成立了第一个数据观察者团队,成立了第一个数据部门—。 —; 商业情报部( bi )。 他们每天的业务是统计日交易额、到访客户数等数据纳入报告,让淘宝决策层清楚了解业务情况。

“阿里“玩”大数据”

此时的淘宝不再是卖家吊打商品、买家购物的购物平台,而是开始关注数据产生的意想不到的价值。 当然,马云当时还没有把数据提升到企业战术的高度,但是敏锐地发现:“数据很重要,未来的世界是数据的世界。”

多家媒体转载了以下故事: 2008年,中国多家公司遭遇国际金融危机,但阿里随买家咨询数量急剧下跌,及时向中小制造商提供预警新闻,为应对国际金融危机做好准备。 车觉偶然总结了这次经济警报,阿里确实在数据观察中尝到了甜头。

“阿里“玩”大数据”

随着数据的增多,传统的解决方案无法进一步扩展,淘宝早就在用数据库的方法解决数据问题时遇到了麻烦。

“我们早上9点上班必须看数据,但是以前传来了数据解决技术,9点之前给所有人看结果不容易,数据解决的价值成本非常高。 前面提到的解体师告诉《中国经济和新闻化》记者说:“如果再急速发展下去,就扛不住了。”

这个问题引发了淘宝第一次技术水平架构的变迁,以oracle为中心的之前将数据库转移到了大数据技术hadoop数据库,正式开始了阿里大数据实践的应用。

用两条腿走路

淘宝的数据视野不局限于企业内部的决定,2009年数据应用和开发开始向外拓展,让淘宝商户共享数据。

在这一背景下,淘宝商业智能部的一部分人受到“排挤”的影响,开发了淘宝商家可以共享的数据产品。 这是淘宝的大胆尝试,在进行技术架构调整后,为了发掘越来越有价值的数据空之间移动,将数据做成产品为企业赚钱。 当然,此时淘宝并不是从赚钱的角度开发数据产品,而是希望整合数据为商户提供高质量的服务。

“阿里“玩”大数据”

年3月,淘宝“数据立方体”产品正式发布。 麦兜包的网上购物中心是首先接触到“数据立方体”的甜度,从而品尝到的商家。 麦包运营总监毕志鹏说:“在《数据立方体》提供的数据的支撑下,麦包能够及时准确地把握市场动态,销售业绩迅速提高。” 随着淘宝数据正式对外开放,更多的商家、公司可以共享淘宝的大量数据,并得到有价值的数据支持。

“阿里“玩”大数据”

而且,淘宝内部对数据的渴求也越来越强烈。 商务智能部留下的团队继续为企业内部提供数据支持。 这时“淘数据”开始从单纯的报表系统扩展到内部数据产品的总称。 2009年4月和12月,商业智能团队开发了可警告的“kpi系统”和提供给商业部门的采用的“数据门户”。 一年后,为了配合淘宝的大促销活动,及时显示实时数据,这个团队又开发了“活动直播间”。 为了让卖方更好地运营,年2月,“卖方云图”诞生了。 两个月后,“页面点击”诞生了,可以监视各页面的各个位置,用不同的数字和颜色显示页面点击的状况。

“阿里“玩”大数据”

此时的车品觉在阿里已经有了很好的口碑,“找数据找品觉”已经成为惯例,很多管理层都以车品觉提供的数据为习性。

阿里首席人事官彭蕾找到了车品觉,他说:“马云认为应该考虑如何从数据运营转向运营数据。 回去好好想想这个案子。”

“黄金策略”是一种擅长车货,可以说是运营的数据产品。 车觉带领团队解决1亿多人活跃的客户数据后,可以取出500个变量,2秒钟内计算出结果。 “黄金策略”最初由支付宝( Alipay )成型,现在与淘宝数据对接。

“支付宝( Alipay )快速发展大数据的目的与淘宝系略有偏差。 支付宝( Alipay )为了越来越多的内部服务,淘宝和天猫越来越强调商业化。 ”车检是这样说的。 逐年,车品觉来到淘宝。 当时,淘宝网首席执行官姜鹏邀请了车品觉,兼任淘宝商业智能部负责人,此后,车品觉成为阿里巴巴集团级数据委员会首任会长。

“阿里“玩”大数据”

的感觉很重视淘宝的数据。 因为淘宝的数据更丰富,不仅有业务数据(交易行为数据),还有流程数据(买家在某个页面停留多久等)。 据他介绍,淘宝的这些数据是sns相关的数据,这样的数据脉络看起来像社会关系,并不是普通的b2c模型可以比较的,这对他来说特别有吸引力,套用马云的话这就叫生态链。

“阿里“玩”大数据”

来淘宝后,车品觉相继开发了两种产品—; —; 无量神针和类别360。 通过“无量神针”,淘宝的管理者可以判断萌芽状态的可疑行为,并迅速做出决定。 另一方面,“类别360”对淘宝的类别非常细致,只要销售额增加10%,就可以知道是哪个类别、哪个顾客对收益增加的贡献较大,集团内的员工是否有效率,这些部门将全力以赴。

“阿里“玩”大数据”

之后,淘宝有了自己的“黄金策略”,锁定客户群后,很快就可以对这些客户进行对比营销,营销后的效果又回到“黄金策略”,形成闭环。

比车品觉团队开发“黄金策略”晚了一点,淘宝对外团队开发了“淘宝指数”。 这是中国顾客行为数据的研究平台。 无论是淘宝卖家、媒体工作者还是市场研究者,都可以利用“淘宝指数”,了解淘宝搜索热点,调查成交趋势,确定资费人群,细分市场。

“阿里“玩”大数据”

在此期间,阿里一直双脚行走,对外团队为外部服务,商业智能部为内部服务。

年阿里又推出了“聚石塔”产品。 这是阿里首次联合全集团大数据力量打造的大数据商用产品,可提供数据存储、数据计算两种服务。

“聚石塔”的平台没有辜负马云的期望。 天猫ceo张勇表示,“双11”狂欢节大促销当天,“聚石塔”解决的订单超过了天猫总量的20%,比平时增加了20倍。

“聚石塔”的顾客不仅包括淘宝上的商家,还包括淘宝外的电子商务公司。 在淘宝和天猫平台上,拥有erp系统(公司资源规划系统)的商家可以直接找天猫对接“聚石塔”,不具备erp系统的商家可以找提供第三方软件服务的电子商务服务公司,然后他们的erp

“阿里“玩”大数据”

数据平台战术

大数据部门应该放在运营团队还是技术团队? 这是车的品觉经常被其他企业听到的话。 问这个问题时,车品觉感到“这些人已经不行了”。 其实是因为他们不重视大数据战术。

在汽车的感觉上,如果一家公司真的想制造大数据,大数据必须成为首席执行官直接指导的一级战术部门。 如果数据部门想在结构复杂的公司内部提高地位,数据产品必须刺激决策部门和业务部门,直到促使前端业务环节的调整。

“阿里“玩”大数据”

年1月,阿里被调整为25个事业部,首席执行官陆兆禧管理的数据平台事业部团队是由“数据立方体”派生的团队。 数据平台事业部有实力的员工空无(淘宝员工的假名),是那一年做“数据立方体”出来的人。

在数据战术框架内,蚂蚁从3年前就开始布局了。 阿里拿出了网络,目标是在2010年建立网络购物的各搜索引擎。 年收购了cnzz互联网技术服务企业,次年cnzz发布了“云推荐”文案推荐引擎。 淘宝联盟今年重启了“阿里妈妈”企业品牌名称,以服务淘宝类商家为中心,转移到了全网广告发布者。 阿里和青岛新闻网微博还在继续谈判,近期有传言称阿里将收购移动开发者服务平台友盟等。

“阿里“玩”大数据”

在阿里设立首席数据官岗位( cdo )之前,马云意识到数据产品如果不建立在平台上,就没有更大的价值。 年7月,阿里任命陆兆禧担任首席数据官职务,全面推进阿里的“数据共享平台”战术。

事实上,马云希望囊括所有与费用相关的数据平台,包括实体类商品费用数据、服务类商品费用数据、金融相关数据等,并围绕自己的数据平台建立数据交易中心。 也就是说,谁想得到数据,就是上这个平台,用货币交换,还是用数据交换。

“阿里“玩”大数据”

融资是大数据衍生产品研发的案例,通过分解淘宝、天猫、支付宝( Alipay )、b2b上商家的各种数据,阿里建立了信用工厂,为平台上的卖家提供了小额信贷服务。

马云这招很准,小微型公司的资金困境影响着公司的快速发展。 目前我国有近4200万家中小企业,在影响公司快速发展的因素中,资金占96%,考虑到银行风险太大,很少向中小企业贷款。 融资如何通过大数据规避风险呢?

除了容易标准化的交易数据外,非结构性的数据也一起被登录到数据库中,类似于卖方和买方的聊天记录、评价、店铺信用等。 然后,蚂蚁金融通过数学模型,观察和解决上述数据,可以自动明确贷款申请人的贷款限额。 发放贷款后,阿里通过实时监控贷款商家的交易、退货、评分等经营情况,很容易了解客户的还款能力,一旦客户交易情况下降,系统会自动发出警告。

“阿里“玩”大数据”

这是一个基于阿里金融打造的纯互联网信用小额贷款的平台。 截至年底,阿里金融累计服务的中小企业超过20万家。 同年11月初,阿里金融放贷率仅为0.9%,低于多家银行。

让爱数据的人玩

“今年你给我的表演是什么? ”

“开心就好了”

这是阿里数据委员会成立后,车品觉和姜鹏的对话。 但是,我觉得车货不容易变得开心。 担心得越来越开心了。

对汽车品味的担心是有理由的。 阿里数据委员会是一个虚拟组织,虚拟如何管理实体? “打太极拳,有四两千斤的感觉。 ”。 他的品味苦笑了一下。

年在香港特区过年时,车品尽量让自己休息。 他知道今年数据委员会的工作一定会千头万绪,他要建设数据挖掘工程师、分析师等协会,为大数据业务培养足够的人才。 他对记者说:“数据人才是最大的竞争力。 今天看到大数据的时候,怎么让他们玩,不是一个人管理。 ”。

“阿里“玩”大数据”

阿里的大数据团队有分析人员、业务分析人员、数据挖掘工程师、数据科学家、数据产品经理、数据开发者、数据库前端开发工程师和数据基础平台构建者。 车检的想法是让爱数据的人玩。 “如果就这样走下去,我相信会出现知道数据的人。 我们需要找到出口,但不一定现在就能看到出口。 所以我们邀请了数据科学家,很多事件不能说今天就受益。 要是能偶尔做蚂蚁金融之类的产品就好了。 ”。

“阿里“玩”大数据”

车的感觉对数据观察者的评价有自己的标准。 每个月的最后一周,数据观察者都进行了考试。 如果拆师的观点出现在每月的经营拆报上,证明这个拆师的拆报有价值。 报告提交管理层讨论时,如果一位分解师的观点能改变业务部门领导的看法,可以得到3.75分。 并且,如果拆师的观点被企业领导接受,最终促进相关业务的调整,将会是4分。 4分是普通数据观察者能得到的最高点。

“阿里“玩”大数据”

数据数据

在一次大数据会议的讨论中,车品觉向姜鹏提出了以下问题:做数据的人,为什么没有数据的数据? 正是这次提问,淘宝才开始制作“数据的数据”,也就是数据图。 “所有的数据都是由很多数据产生的。 数据的数据表示今天的数据是如何进行的,创建数据图,深入到数据源,提高数据的质量和价值。 ”车觉说。

“阿里“玩”大数据”

为了保障数据质量,必须在大型数据源的获取方法上下功夫,从源上保证数据的正确性。 “就像挖掘信用卡持卡人的费用记录一样,必须弄清楚这些费用行为是否来自持卡人,一部分是否是持卡人的妻子花了钱。 ”。 根据车的感觉,必须尽量保证数据的精度。 不这样做的话,数据的质量会不正确。

“阿里“玩”大数据”

大数据与个人最密切的关系是潜在的隐私入侵,数据安全是阿里大数据前面的第二座山,也是第二座核心。 “有些人不知道数据的危险性,但制作数据的人知道其利弊。 数据的安全得不到保障,迟早会发生事故。” 根据车的感觉,为了数据的安全,他可能在支付宝上得罪了很多人。 “但是,个人隐私绝对不能泄露。 这是底线”。

“阿里“玩”大数据”

目前在阿里内部,淘宝系的淘宝、天猫和一淘宝在数据上是共享的,b2b的数据是独立的。 支付宝有金融牌照,法律要求数据独立。 集团的某个部门需要一点数据时,要查看数据就必须提交权限申请。

事实上,车的品觉刚开始安全的时候也失败过。 那时,他第一次建设了支付宝的安全架构,直接应用了银行物联网的安全架构。 “我想定义所有的数据层。 完成后就做不到了。 ”。 支付宝第二次制造安全时,他使用了case by case (范式法)的做法成功了。 现在,在淘宝上,他也采用了范例法,逐渐积累了安全经验。 他说,安全是开放的前提,如果国家将来考虑数据管理,现在蚂蚁的经验将会值得借鉴。

“阿里“玩”大数据”

为了确保数据安全,车品觉的团队在研究客户行为时,框定的最低数据量是1000名客户群的购物行为,不能再减少这个体数。 不允许比较某个特定客户的数据观察。 车觉说:“阿里在数据挖掘解决方面有包括后台数据表示在内的自律指导方针,详细情况尚不清楚。 这样封闭的目的是维护顾客的隐私,防止数据被滥用”。

“阿里“玩”大数据”

阿里内部专门成立了小组,数据是否公开首先由他们进行评价。 评价小组没有具体统一的标准,数据应该公开、公开到什么程度,都是基于各自的例子本身。

到今天为止,成立了数据委员会安全组和数据质量组,与年初相比,汽车的品觉内心平静了下来。 根据“数据开放现在太早了,不太容易掌握”的车的感觉,从某种意义上说,数据开放考验数据人的良心和经验。

蚂蚁对还在路上的车的品味和同事现在走的路是新的路,可以参照的东西不多。 从海外企业来看,拥有阿里这一数据量级的企业很少。 在大数据的途中,蚂蚁还有很多事情要做。

(中国经济和新闻化)

标题:“阿里“玩”大数据”

地址:http://www.ygfootball.com/ynjj/12961.html