2009年3月23日星期一

群体智慧的力量——发现SNS中的“靠谱之人”

SNS已经成为网络的主流,一时间好像你还没有上过校内、开心、饭否、facebook、Twitter,没有几个网上朋友,就已经“out”了。虽然这些未必能够让所有的网民接受,但是在web2.0类型的网站中,几乎都有SNS的影子,我们可以姑且把它学术化的称为“以用户为中心”的理念。许多传统的网络服务,甚至数字图书馆,也在如火如荼的讨论如何加入SNS功能了。“存在即合理”,SNS确实从很大层面上满足了用户在获取互联网信息的同时,渴望进行交流和沟通的需要,从而能够打破死板的由管理人员定义的内容空间,实现信息在人际关系网络上的流动。在1.0时代,人们上网,注册为用户;在2.0时代,用户之间建立了朋友关系。
比较有意思的一个话题是,我们如何通过网上的人际网络中发现靠谱之人。在用户看来,天天在twitter上叽叽喳喳的不一定靠谱。很少说话的人反而值得信任。这样的话题目前看来越来越热,人们希望通过发现这些人从而找到仔细希望的内容。比如twitter 上的应用http://twitter.mailana.com/



















在饭否最新的应用上,也有一个有趣的内容——饭否牛人榜(http://www.netcrowd.cn/labs/nclabs.php),在上面你可以输入个人的ID,查看你在饭否上的影响力和排名,饭否影响力Top20的人物,以及靠谱的人们正在谈论的内容,相对于饭否本身的“随便看看”,这种方式更能帮助用户了解的重要的,值得信赖的信息。在每个人的旁边也有一个衡量影响力的值——crowdrank,这个值的计算基于“牛人的朋友也是牛人”这样一个简单的道理。通过有效的利用群体智慧,我们可以准确而方便的发现靠谱之人。
恰好,同样在牛人榜推出几天之后,饭否又出现了一个应用——饭否名人榜(https://docs.google.com/Doc?id=dfqdhrwn_4dft47fdwe.com/Doc?id=dfqdhrwn_4dft47fdw),这是由kevin Deng 同学整理的一个在饭否上注册的名人。我们不妨来看看他们通过饭否牛人榜计算出来的影响力是多少呢?

李开复(Google 全球副总裁、中国区总裁 )
http://fanfou.com/kaifulee






马化腾(腾讯公司执行董事、董事会主席兼本公司首席执行官)
http://fanfou.com/马化腾
Sorry,由于马总不太Open,没有公开自己的信息,所以无法获得准确值。

李彦宏(百度董事长兼首席执行官)
http://fanfou.com/RobinLee





马云(阿里巴巴集团创始人兼首席运营官)
http://fanfou.com/jack.ma






王兴(校内网、海内网创始人,饭否网总裁)
http://fanfou.com/wangxing

穆荣均(饭否网开发团队,原百度搜藏的负责人)
http://fanfou.com/moon

郭万怀(饭否网开发团队、原校内网创业团队)
http://fanfou.com/wanhuai

杨俊(饭否网开发团队、原校内网创业团队)
http://fanfou.com/yangjun


张悦然(现代女作家,中国最具影响力的青年作家之一)
http://fanfou.com/zhangyueran


试试看,群体智慧能帮你发现不为你所知的靠谱的人。

2009年1月5日星期一

个性化不是什么——关于个性化的几个误解

个性化技术常常与“Data Mining”,“Web Mining”, “统计”等等词汇联系在一起。与其他人聊天的时候也常常会听到“个性化啊,不就是看了什么什么的用户还看了其他什么什么吗?”
很难一句话概括出个性化技术或者互联网个性化是什么,但是可以说明的是,个性化不是指以上的任何一种解释,至少不完全是。

首先,“DataMining”顾名思义就是对数据本身的处理,它是一种以数据为中心的流程。目的是利用统计以及规则来发现数据中的规律,指导业务的进行。因此它主要面向后台决策支持,多是针对群体用户。个性化技术中尽管使用了许多数据挖掘方面的技术,比如关联规则分析,决策树等等,但是其目的是不一样的。
统计是一种数学工具,它也是个性化技术的基础,但是仅仅靠统计只能实现针对群体用户的行为分析,就像是我们可以获得某个音乐网站的排行榜,流行趋势等等。但是无法针对个人产生符合其口味的结果。

“看了A的用户还看了其他B”这样的方式是目前各类网站最常用的形式,也是很多人对个性化或者推荐系统最直观的认识。但确实这是一个天大的误会。一般来说,“看了A的用户还看了其他B”简单的可以参用类别,关键字匹配,复杂点的可以参用关联规则(也就是那个啤酒尿不湿的把戏)或者采用内容之间的交互correlation,但这些都是以数据为中心的,而不是以单个用户为中心,任何一个用户看到该内容,不管他之间做过什么,他所看到的导航都是一样的,这怎么能是个性化呢?这可以算作一种轻量级的推荐系统或者导航服务。至于推荐系统,准确地说应该是个性化推荐系统,它确实是个性化一个非常成功应用代表,当然也有非个性化甚至人工的推荐系统。

2008年12月20日星期六

“个性化”的Myspace与Myspace的“个性化”

本周参加08移动互联网大会,有幸听到了Myspace技术总监谭晓生关于个性化的介绍。想写点什么感想。写下这个题目的时候还斟酌了半天,到底是“个性化的Myspace”呢,还是“Myspace的个性化”呢?谭先生的介绍中提到了Myspace在去年5月份开发的一个个性化信息搜索的项目,我想这个项目应该不仅仅是个性化搜索一个产品,应该是Myspace中国(聚友网)的一个战略性动作。也许未来,每个用户就会看到一个不同的主页、不同的朋友圈、不同的内容展现——一个“个性化的Myspace”,这是一个前端产品。

而为了实现人人一个“个性化的Myspace”,就必须实现“Myspace的个性化”——需要在后台技术上做很多研究和积累,从谭先生的介绍中我们可以看出,“这个项目是在去年5月份立项的,今年年初我们开始和国内一家机构进行合作”,“在这里面包括了要建用户检索的信息空间模型,在做这种个性化信息检索里面,还会挖掘人和人之间的关系,挖掘人的社会属性,他的朋友是什么样子的,他的朋友的信息也会当做他检索模型里面的信息要推送过来”,Myspace充分利用了用户主动提出的信息和交互信息,进行挖掘,从而产生最适合用户的信息内容。从这方面看,Myspace确实在个性化方面下了很大的功夫,SNS的个性化也确实是一个难题——“从科研项目来说,时间是五年,我们还有四年时间,只是一个初步的,所以它仍然在发展。但是在企业上,在商业上的应用应该是已经基本上能够用了,成熟期还谈不上,但是应该是可以用了。”

提到个性化,就不得不提起豆瓣,豆瓣之所以从国内众多web2.0网站中脱颖而出,其特色就在于个性化推荐。虽然其定位中高端人士,难免有点曲高和寡,但正是这样的定位和以书会友的SNS特色,帮助豆瓣在很短时间内聚集了大量的“黄金数据”,从而可以很快地实施个性化产品,而个性化技术又提高了技术门槛,防止“豌豆”、“蒜瓣”、“花生仁”之类的山寨行为。基于豆瓣的个性化推荐,用户可以很快地形成小的“圈子”,而整个豆瓣就是由这样的一个个或大或小的、缓慢增长的、彼此重叠的小圈子组成的,SNS以用户为中心,这也正是所谓的web2.0所宣称的与1.0的不同,从这个意义上来说,豆瓣确实是目前最好的SNS网站。而Myspace不同,它的定位不同、用户不同、这也就造成了它的数据不同——有更多的但是也更多垃圾的数据,用户之间的交互目的和粘性不同——谭先生不止一次的提到了Myspace上的“419”:)。为此它所采用的个性化方法就不同,前端产品的展现也不同。Myspace的个性化决不是豆瓣化,Myspace还会是Mysapce,只不过它已经个性化了。

Myspace之所以会进行个性化,除了谭先生提到了为了更好的适应中国用户比较懒的特色,不被“骂得狗血淋头,砖头满天飞”,更重要的还是因为它看到了个性化的这一趋势,先走一步就会赢得更多的时间,而个性化具有一定的技术门槛,可以有效防止竞争对手在前端产品的模仿。另一个原因也不言而喻,个性化是Myspace进军中国移动互联网的重要一步,移动互联网两个特点就是移动终端+互联网的内容,而不管是运营商进军互联网,还是互联网公司拓展到移动设备上,都必须满足用户的个性化需求。

希望Myspace的个性化会越来越好,为每个用户提供一个惊喜的个性化的Mysapce,毕竟我们不能总是简单的“C2C”(Copy to China)。

2008年12月14日星期日

为什么我们需要个性化

在一个物质贫乏的社会里,你发愁的是如何“获取”而不需要“选择”,所以不需要个性化,也无法个性化。互联网也是如此,当每个站点内容都有限时,没有更多的选择,每个人所看到的内容都是一样的。但随着现实世界的信息化,特别是由用户创造内容的“2.0”化,人们可访问的信息越来越多。据最近,Google在官方博客中称,其搜索引擎索引到互联网上的网页数量超过一万亿。这也是迄今为止,统计出来的最大数字。当然,Google索引的网页只是全体信息的一个子集,因为网页只是信息表现的一个方式,但不是最小的粒度,人们真正需要的不是网页,而是网页上承载的信息。如果我们要在网上购买一件毛绒玩具,我们首先会输入“毛绒玩具”作为关键词,找到含有毛绒玩具的网页,间或找到销售毛绒玩具的网上商店,然后再细细的比较外形、价格、商家信誉等等。因此,通常我们访问信息的方法就变成了一个“搜索”+“选择”的过程。
对于用户和网站来说,在这种场景下,如何去访问和管理这么庞大的信息,都是一个挑战,而个性化是应对这个挑战的有效手段。所谓个性化,是指根据每个用户的特征,产生适合该用户的信息。说起个性化,Amazon也许是最早成功应用该技术的公司,“如果我们有1千万个用户,就会有1千万个库存”,这也许就是个性化技术在众多电子商务网站成功应用的最好解释。个性化的魅力在于它可以同时让用户和信息拥有者受益:对于用户来说,可以最高效的定位到其所需要的内容,对于网站来说,个性化提供了一个最优化的组织和管理信息的手段——即使是生僻的内容也可以找到最需要他的用户,从而快速形成长尾,这意味着更多的浏览、更好的忠诚度、更多的销售、更多并且更精准的广告。曾经有人质疑个性化会不会只产生流行的内容,从而抑制长尾的产生。这正是对个性化的技术的误解,一个好的个性化技术决不是单纯的对每个信息单元的访问数量作简单的统计,与Google的PageRank方法相似,它会抑制某些流行信息的影响,从而提升长尾效应。
对于移动互联网,个性化技术尤其重要。无论如何进化,移动设备都无法改变其体积小的特点,因此相比于使用PC机访问互联网信息来说,用户寻找需要信息的所耗费的时间会大大上升,而其耐心会大大下降。因此,一个更小的信息访问窗口需要更加精准和快速的信息定位方法。2007年12月11日长尾理论作者安德森在广州举行的“中国移动集团用户大会暨移动信息化论坛”上接受媒体采访时也说道“……在无线互联网中还没有看到“长尾”,移动平台存在局限性,包括屏幕尺寸、控制等。只有这些问题得到解决无线互联网才能向前发展,……中国互联网企业目前需要做的一点是帮助网民找到想找的东西,一些新的东西。你知道,我们需要在所有地方都能够上网,人们希望寻找音乐、书等等。互联网企业需要测试一些更好的“发现型”工具,使用户找到他们希望的内容。正是这样的一套工具。我们目前才刚刚开始,我们必须对下一代进行教育,指导他们如何使用这些工具”。而个性化技术就是这样的一种工具!