2009年1月5日星期一

个性化不是什么——关于个性化的几个误解

个性化技术常常与“Data Mining”,“Web Mining”, “统计”等等词汇联系在一起。与其他人聊天的时候也常常会听到“个性化啊,不就是看了什么什么的用户还看了其他什么什么吗?”
很难一句话概括出个性化技术或者互联网个性化是什么,但是可以说明的是,个性化不是指以上的任何一种解释,至少不完全是。

首先,“DataMining”顾名思义就是对数据本身的处理,它是一种以数据为中心的流程。目的是利用统计以及规则来发现数据中的规律,指导业务的进行。因此它主要面向后台决策支持,多是针对群体用户。个性化技术中尽管使用了许多数据挖掘方面的技术,比如关联规则分析,决策树等等,但是其目的是不一样的。
统计是一种数学工具,它也是个性化技术的基础,但是仅仅靠统计只能实现针对群体用户的行为分析,就像是我们可以获得某个音乐网站的排行榜,流行趋势等等。但是无法针对个人产生符合其口味的结果。

“看了A的用户还看了其他B”这样的方式是目前各类网站最常用的形式,也是很多人对个性化或者推荐系统最直观的认识。但确实这是一个天大的误会。一般来说,“看了A的用户还看了其他B”简单的可以参用类别,关键字匹配,复杂点的可以参用关联规则(也就是那个啤酒尿不湿的把戏)或者采用内容之间的交互correlation,但这些都是以数据为中心的,而不是以单个用户为中心,任何一个用户看到该内容,不管他之间做过什么,他所看到的导航都是一样的,这怎么能是个性化呢?这可以算作一种轻量级的推荐系统或者导航服务。至于推荐系统,准确地说应该是个性化推荐系统,它确实是个性化一个非常成功应用代表,当然也有非个性化甚至人工的推荐系统。