中国教育在线 中国教育网 加入收藏 设为首页

北大光华MBA王汉生:数据和隐私将是我们面临的最大挑战

http://mba.eol.cn  MBA中国网    2015-08-19    

  8月15日下午,“收官之战——2015北大光华MBA全国公开课北京站”在北大光华管理学院阿里巴巴报告厅圆满落下帷幕。作为压轴之站,现场人气爆棚,四百多名各界精英共同聆听了来自光华管理学院张影和王汉生两位教授的精彩演讲。

  王汉生教授

  以下是王汉生教授的演讲实录:

  王汉生:各位同学,大家下午好,非常高兴认识大家。我想跟大家简单分享一下我们自己最近做的一些研究,有一些更像半成品一样,但这个跟赵龙凯老师说的一样,反映了老师自己思考的过程。知识从哪里来?知识来自于自己对社会的思考和自己的研究——网络结构数据和互联网征信,一个是数据类型,一个是数据分享。现在是“大数据世界”,我从来不认可这个名词,它在我眼里存在很多年了,跟大和小没有关系,只分价值。

  什么是网络结构数据?这张图片是Facebook全球网络结构图,在这个世界上,如果有两个Facebook用户,他们互相之间是好友,点一个点,他们连在一起。我第一次看这张图很震惊,我们是这么紧密相连,这张图有一个遗憾,如果把微信补上去就全亮了。点和线把人和人联结在一起,它能给我们带来什么场景,这是博士研究生做的,她的主页里有一个广告叫“战死纱厂,魂魄不灭”,这是典型的网游。

  在网络中无论怎么挣钱,无论你的营收靠什么,你会发现,突然之间,世界变得好无聊,都是在依靠游戏来投放广告,厉害一点的,像腾讯卖个表也能赚钱,同样对新浪微博来说,这一块二很重要,主要的营收来自于它的广告。我常常告诫自己千万不能点开去玩,玩了就不容易收手,这容易让我想起大四同学玩红警,一会儿用电脑玩,一会儿说没意思,同学告诉我们可以去网吧,一个宿舍三对三对打,你会发现再无聊的游戏,和真人玩就会变得其乐无穷,这是非常非常好玩的事情,这样一个广告给优雅女孩看的话,她不感兴趣。

  这在背后有什么故事?曾经有一年,阿里巴巴入股新浪微博,购买18%的股份,从那个时间段开始,大家体现到一个变化,什么变化?如果你在淘宝收到鲜花,你回到微博看到的就都是鲜花。有人说淘宝是万能的,上面有没有骨灰盒,有,后来他搜索一下,回去一看,天天给他推荐骨灰盒打折的,最后他受不了了。Facebook上市给投资者讲了这样一个故事,他说,我这里有大量用户在我的平台上沟通交流,他们通过文字记录下来,我们可以解读他的偏好,因为我对他偏好的理解,可以使广告效果更好。

  那一年,有人在互联网发起问卷调查,那一年,在互联网上最悲崔的语言是什么?是“呵呵”。但是这个过程中,我们发现一种人本信息特别特别有价值,帮助我们回答很多价值,就是这个标签,这个颜色非常非常浅,在用户下面一点,这个标签是用户自己给自己打上去的,空间有限打不多,我们看的话,这能告诉我们什么?也许我们的朋友能给我们很多很多关于自己的信息,这是网络特别的一点。

  这是我个人的微博主页,你不管它,粉丝数也上升,有一天我实在忍不住说,你们是机器人还是真人,后来他们回答说我是真人,我自己主要感兴趣的应用是在社交网络和社会隐性营销上,我没有告诉你其他爱好包括职业也没有告诉你,你可以从我好友当中看到,看他的关健词有一个很小众的地方,有一个关健词叫做“R语言”,然后你再看到我,还关注其他用户,他们身上都有R元素标签,我可能心里有一个小小秘密,没有告诉你,我跟这个标签也是有缘分的。我用I代表我自己,在这个基础上通过另外一个指标,我到底有没有加这个标签成为R语言,给我们一个好的模型刻画相关的关系,有了这个之后我们来猜,什么人没有打这个标签,其实是应该有的,比如说在我们案例中找到这个案例,但我们反过来看,这个人在另外渠道上是强调商学院的,相信他身上一定有的标签是长江商学院,因为在朋友中这个人标注了,这个人也标注了,这个人也标注了,基本他小小的秘密都被朋友泄露出来了。

  网络结构给我们在分析上独特的机会是什么?跟我们平常讲的数据有什么不的地方?它让独立个体联系起来了,开始流通了,在网络结构中,将判断跟你紧密相连的人是什么样子。我们的运营商移动、联通、电信,如果好多年前,跟我们的伙伴讲客户关系管理的时候,真正在工作中的,没有人认为工作很重要。在那个时间,主要营收增加来自于发卡量增加。那么到今天为止客户关系管理非常非常重要了,光华MBA同学他告诉我说,现在大会、小会都要讲客户流失,因为我发卡量不增加了,我还要增加营收。以前我们怎么做?以前我们这么做,我们自己有系动发现,有一人的电话费下降了,麻烦有人给你打电话“王老师你电话费怎么下降了”,背后缺一套完整模型去理解它。我们把指标放在一起,很多来自于我们从事这个工作的同事和朋友,但这个地方,我们有一点点小小的补充,传统指标里面有大量集中在你的月度帐单上。

  我们发现一个事情,人和人在社交网络上能不能形成特征变量,帮助我们在原来基础上,更好判断一个人会流失的?有没有这样的可能?我从来不相信一件事情,大家把数据挖掘,过分觉得这一堆数据放在那儿挖啊挖的,不是这样的。数据分析是有边界的,这个边界在哪里取决于你的视野,你看多远,你的数据分析大概就能挖多远。

  一个团队拍脑袋说这里有两个小人,一个小人网络中有五个好朋友,反映出他的五个不同电话号码,对应这边这个人只有两个好友。是不是好友数目越多的人,他流失的可能性越小?我说瞎猜。第二种可能也是两个小人都是有三个好友,但是第一个好友跟每个好友打一百分钟电话,第二个小人跟每个好友打20分钟,我们大概用了半年数据,尝试理解故事到底怎么样的,所有解释变量来自于当期,我们看一看,这是地市级企业,这些人加入这个网络使用这个服务大概三到四年,第二个每年花费150、160这么一群人每个月话费情况,第一个在网时常,我们看到,中间黑线对比出来,坏孩子在网时长的高度比好孩子高,没有流失客户在网时长更长一些,在网时长越长的时间人流失可能性小一些,说明这个指标对人们是否迷茫?有帮助的肯定帮助有限,一般花钱多的人对价格不太敏感,也不吸引价格转网。我们再看一下我们猜测的三个社交网络,第一个是给我们比较震惊的指标,最左边盒子被压扁了,来自于社会网络中的指标,也就说明了他的电话号码个数。这个告诉我一件事情,我自己就在想我为什么不改码,说太麻烦了,没有这个勇气,轻轻松松换一个电话号码,我们人人都处在各种各样的社交网络中,社交网络对我们来说是重要的资产。

  当我第一次讲这个报告的时候,腾讯小微信贷推出一个服务,根据你的QQ等级决定信贷,在评价你的社交资产,短期快速形成信贷合同,而其他人不行。阿里巴巴和京东为典型代表,电商网站有很强帐号体系,但没有关系,你也产生不了数据。曾经有朋友说,他们自己做大数据,公司能够采集到很多很多电商消费者的购买数据,给他原来的信息,购买行为能不能改进,信用评估没有看到过,非常正向的例子,我花多少钱跟信用关系,恐怕不是那么强烈。QQ微信是属于腾讯帝国的,不对任何人开放。运营商是有非常非常多的数据,因为运营商的日子一天不如一天,压力非常大,全世界都知道运营商有非常宝贵的数据。还有一个数据就是邮箱,邮箱数据太宝贵了,只要看你的邮箱地址就知道了。

  理想数据平台应该长成什么样,当我们评价一个人的性格,一定有响应变量,在银行借贷关系中,有人赖帐。什么是信誉?真正的信誉是一种嘱托和托付,而解释性变量中最有力量的数据平台应该是购买数据,比方说地理数据非常非常有用。有一个校友做小额信贷,朋友告诉我说,位置数据有两个重要的作用,第一个作用是在催收中非常重要,不还钱是一个信念,你找不着我,现在我能够找得着你。居住地点飘忽不定的信誉差,主要有两类人,一类是建筑工地工人,后来我有一个同学在深圳做车险做很多很多年,他告诉我,说我们在车险中也一直理解数据是如何来改变我们对于未来出险的影响?经常在夜场活动的人出险很大。

  使用的好为这个社会造福,使用的不好会造成麻烦,这就是隐私授权问题,在信用卡借贷这个领域,相对来说这个问题比较好处理,因为你找我借钱的话,我会跟你商量,你又说改借一万能不能捎带卡,你说不行,我就不借了,这是双向授权沟通的过程,不像其他场景下你不知道,数据就被别人用了,这里面涉及另外一个问题,比方说我要向赵龙凯老师借钱,我们俩商量,但是这里面保证我透露信息是我专有的,我透露这个信息不会伤害到任何第三个人,涉及信息所有权是谁的,我的年龄应该是我的,收入是我自己的,有一天我给我老板写一封信说某某某,我最后了解到小道消息,大家看整个过程中邮件是我发的,收是他收的,他处在被动位置,这个信息可不可以算我专有的,我没有清晰的答案,我相信这事是非常有争议的。例如这位先生正好是上市公司董事长,然后我给他写封信说,张总你们是不是搞停牌,停牌的话,我先买一点你们的股票,还没来得及回信,这封信便被公布到网上,这是谣言,有人真的去买了,买了什么也没发生,还不敢卖出去,这种事情在信息过程中,数据产权是谁,可能需要我们整个社会、企业大家一起去理解,数据产权到底是什么。

  再给大家举几个特点典型的,我去京东转一圈,数据算谁的,如果是京东的,京东可以任意使用它,然后产生算法,如果是我的那就不可以。欧盟认为数据是我的,所以你啥也不能干,欧洲产生不了一个体量不大的互联网企业。那我们国家产业怎么去?我想是工信部和企业非常关注的,而且是摇摆不定的。我们再看看数据叫喊是怎么一回事,我自己是京东非常忠实的用户,首先跟京东的一些合作彻底被他们忽悠了,然后我自己是京东重度用户,我自己我去京东浏览,会留下浏览数据,我的信用卡没有问题,不给京东提供数据,京东没法收款,没法送货的,但是谁可以用呢,京东可以用吗?对我来说应该可以用,这是我跟京东之间的行为。腾讯可以用吗?这事就有争议了,腾讯是京东的大股东,但毕竟不是100%是它,它可不可以用,但是京东可不可以拿去卖给XXX.com,对我来说不行,如果现在没有说得清楚数据,产权哪来的数据交换,我们这个世界有股票交易所,成就那么多梦想,我们是不是要成就数据交易所,这背后的依据是什么?没有清晰界定上面在交易啥,真正的数据交易和合并的时候,有一个前提是要产生最大的数据价值,这一定要有一个前提,IP要对得上。数据和隐私是未来我们在去往这条路,碰到的最大挑战,需要整个社会去理解,我们的边界在哪里。要定义清晰,恐怕才能处理好,才能成长为蓬勃向上的行业,如果定义不清楚,就会爆发天津这样的灾难一样,这个行业就没了。

  给大家看一下征信案例,比较受关注是微众银行,2014年12月12日正式开业。2015年1月4日,李克强为微众银行完成第一笔放贷业务。给大家总结一下我的观点,主要三大方面,第一个,对征信而言,网络结构数据是数据最核心的地方,其他所有数据都是在做加法,比方说以前我有银行数据,后来我有微信、微博数据,网络数据在做乘法。第二个是,网络结构中数据能够反映出你的重要资产,是可以定价的,而所有美好梦想的实现过程中,对于隐私的保护是我们面临的最大挑战,谢谢大家。

推荐给好友    我要收藏    我要纠错    分享到

免责声明:

① 凡本站注明“稿件来源:中国教育在线”的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本站协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国教育在线”,违者本站将依法追究责任。

② 本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。

商学院查找
地区
费用
性质
分数线
学校
内容推荐
eol.cn简介 | 联系方式 | 网站声明 | 京ICP证140769号 | 京ICP备12045350号 | 京公网安备 11010802020236号
版权所有 北京中教双元科技集团有限公司 EOL Corporation
Mail to: webmaster@eol.cn