分享到:

推荐引擎:从搜索到发现

[来源:] 2008-11-28 23:24:00 编辑:玉骨 点击:

公司CTO给我得一份资料。比较技术了一点儿,不过大家应该看得懂大概得意思。有点儿像搜索引擎的主动版其实发现搜索很多SNS以及VISTA的右边栏已经慢慢开始在做这件事情。很多人在做一件事情得时候,往往不一定有特别清晰

公司CTO给我得一份资料。

比较技术了一点儿,不过大家应该看得懂大概得意思。有点儿像搜索引擎的主动版

其实发现搜索很多SNS以及VISTA的右边栏已经慢慢开始在做这件事情。很多人在做一件事情得时候,往往不一定有特别清晰得概念。

再发现搜索中,有一点我们B2C在用得是交互式推荐。

也就是说,我们通过分析用户的动作,对用户进行总结与归类

这需要强大得数据库支持,也需要很长得时间才做得精确。这种技术本质上属于数据挖掘。

现在很多B2C得推荐其实可以做得更细致。包括有得B2C在植入SNS,那么SNS也可以植入B2C作为其一种盈利模式,或者说以合作的形式。

用户得行为分析与用户购物,我个人得想法还是觉得,这终归是一个大势所趋。

现在SNS做得好得校内,对于用户得归类大都是在学校专业班级上,其他得SNS更加粗,公司与城市,行业,或者是所在楼盘等等。

其实我们可以做得更加细致。

SNS就相当与在做这件事情得初级阶段,不过需要数据库与时间得支持,到一定时刻,就可以植入商业模式。这个还要思考,还要摸索,还要花很多事情,有很多事情要做。

这么说来,能够坚持久得SNS必然值得我们关注。如果植入合适得商业模式,其中的价值我们可以畅想。

对于B2C来说,最简单直接得就是交互式推荐。

更多更细致得分析用户购物动作,产品已经评价等,做出更细致,交互性更强得脑式网络关联推荐。而这也仅仅是这门技术得浅层实现而已。

技术最底层的是collaborative filtering技术,加上dna推荐和神经网络技术。在国外做得很好,也算是比较前沿性得技术了,并没有发展到相当成熟得阶段。我们国内还是会落后1-2年。

 

好了好了,啰嗦半天。。。。。我没有太多逻辑性,想到哪儿说忽悠到哪儿~

还是看文章来得真切~

不知道出处跟作者,拿到就是一个文档

有冒犯请说哈~嘿

 

推荐引擎:从搜索到发现

搜索是你明确地知道自己要找什么东西时所做的事情,而发现是你并不明确地知道一些好东西存于世上的时候,这些东西主动找到了你。

以“发现”为主要功能的网站正如雨后春笋般在互联网上崭露头角。许多公司推出了能够帮助消费者找到新网站、新唱片或者新朋友的推荐功能——不管想要什么,去互联网上都可以发现那些你闻所未闻却又注定会一见钟情的东西。

这种功能并不是互联网时代的专利。早在互联网出现之前,在那些用钢筋混凝土搭建起来的小店面或者大卖场里,个体业主们就已经在靠自己敏锐的目光和三寸不烂之舌,根据你的个性特点把货架上的商品源源不断地放进你的购物篮。 

走进任何一条商业街上的某间服饰专卖店,流露出一点购物的倾向,导购人员就会走到跟前,指着不远处说:“那款是最近刚上架的新品,看起来与你的气质比较搭配”。这时你很可能会继续和导购人员交谈,多透露一些自己关于衣着打扮的看法,让他或她继续给出建议,帮助选中最心满意足的款式。

这就是我们所说的“逛”街。在走出家门的时候,你的脑中或许有买衣服的计划,却并不知道应该买哪种品牌、款式、颜色、布料、价位的商品。走进商店之后,顾客面对未知的货架开始了自己的“发现”之旅,而商店向顾客提供的“推荐”机制随即开始运作——虽然在多数情况下,你并不会意识到它的存在。

我们不仅仅是在买商品,我们还和商品紧紧地捆绑在一起。我们和它们之间存在着千丝万缕的联系。看看架上收藏的无数影碟、iTunes播放器里的曲目列表、躺在橱柜里那些用过的手机,从每一样东西身上都可以看出来——你是怎样的一个人,或者说,你想成为怎样的一个人。

每个人都通过所购买的东西把内在的自己呈现出来。从另外一个角度说,人们每天都把个性穿在、戴在、挂在身上,刻意或无意、直白或含蓄地告诉外界:“喏,这就是我。”

在真实的世界中,我们通过外表所蕴含的信息以及所处的环境和既有的经验对他人做出判断。这种直觉通常情况下十分管用而且立竿见影,但是有时候它却会失算,毕竟感觉在很多时候是说不准的。但是如果换到互联网上,这件事情就会变得容易和清晰得多。

“发现”在网上的兴起

日复一日,消费者都会在互联网上以数字化的形态留下自己的心得体验。比如豆瓣网上有一半观众觉得《满城尽带黄金甲》看着“还行”,两成观众打分“力荐”;比如大众点评网的用户对北京川办餐厅的打分是:口味26、环境13、服务12;又比如人们在网上对各张专辑做出的评论、贴上的标签。每当用户留下这样的标记,除了能够让其他人知道这些东西看起来如何、听起来怎样,还在不知不觉地向外界描述自己的口味。

对于那些可以获得、储存并且分析这些信息的公司而言,商机大得惊人。这些公司比传统商店里的导购人员更了解你,更进一步说,指不定比你的闺中密友更清楚你的兴趣所在。这些公司可以精准地描绘你的口味——在专家的帮助下,他们可能比你还更容易说清你自己属于哪类人群——以此判定你最可能会在现有的产品选项中买下什么。这些在过去听起来像“第六感”的东西,现在正以10为载体被保存在网络服务器上。

对于那些以推荐功能为核心的网站来说,他们再清楚不过地知道,互联网正在从搜索的时代进入发现的时代。两者的区别在哪里呢?搜索是你明确地知道自己要找什么东西时所做的事情,而发现是你并不明确地知道一些好东西存于世上的时候,这些东西主动找到了你。

在搜索领域,胜负已经非常明显——在国外,Google遥遥领先,在国内,百度一枝独秀。但是,起码到目前为止,还没有哪个推荐引擎是当之无愧的市场领导者。

建造个性化的发现机制需要对目前网上所有的表述、分类及评价方式进行深入研究,这绝非易事。但是如果有公司可以把这样的东西做到手机上,那么,这样的发现工具不仅仅可以改变营销,甚至整个商业社会。“推荐系统将会成为接下来十年中最重要的革新之一。”曾经在90年代中期开发出第一批推荐引擎的米尼苏达大学计算机科学系教授约翰·里德(John Riedl) 说过,“社会化网络将会被这些系统所驱动。”

亚马逊网络商店(Amazon.com) 很早就意识到了一个优秀的推荐系统可以带来什么,直到现在依然是同类网站效仿的对象。亚马逊通过数据挖掘算法和比较机制将用户的消费偏好与其他用户进行对比,借以预测用户可能感兴趣的商品。

这样的推荐系统建立在对商品深入了解的基础之上。看看亚马逊网络书店上的书籍和影音制品,即便是再偏门的品种,他们也被管理员赋予了多种类型(Genre)和关键词(Keyword),而且用户还可以为它贴上自己中意的标签(Tag)

但是亚马逊“相关图书”和“相关唱片”的推荐机制依然没有做到足够的个性化,它看起来更像是一个固执己见的推销员,而非熟识并且值得信赖的小店老板。亚马逊的系统倾向于向用户推荐那些显而易见的的相关产品,却对用户缺乏更深入的了解,并因人而异地推荐商品。新一代的发现型网站正在弥补这方面的缺失,搞清楚用户为什么选择了某些商品,为用户也贴上复杂的属性标签。

为了建造更好的推荐系统,美国最大的DVD租赁网站Netflix设置了100万美元的奖金,准备奖励给可以让推荐机制性能提高10%的人。在这个竞赛公布之前,Netflix负责推荐系统的副总裁吉姆·贝内特 (Jim Bennett) 曾经怀疑是否能够有人在十年之内完成这个目标,但他也坚持,这个目标确实值得公司付出100万美元。但是在五周之后,已经有37人提交了改进方案,其中有两名选手成绩离获奖标准并不遥远。

两种“发现”

而电影推荐网站“What to Rent (意为“租点什么”) 已经在发现机制的完善之路上迈出了更大的步伐。该网站的两位创始人马修·库尔克 (Matthew Kuhlke) 和亚当·盖特吉 (Adam Geitgey) 对电影极为痴迷,他们俩用自己在电影方面的知识和分类海量电影的经验来武装自己的电影数据库。

而同时,他们让初次光临的用户回答一系列随机的问题,有的甚至和电影看起来关系不大,比如说:“你最喜好哪一类体验——精神、智力还是身体上的?”或者“给你多少钱才能让你在下半辈子里每天都穿一些滑稽古怪的装束?”他们通过心理测试来了解用户,以推荐合适的电影。“看一部电影的时候,你就与这部电影产生了互动。这种互动和你与人打交道并没有多少区别。”库尔克说,“你都是在建立一种关系。”

“工欲善其事,必先利其器”。换到发现型网站上,那就是想要推荐给用户最有效的结果,那么就必须先了解自己的用户。如何了解自己的用户,成为此类网站首要解决的问题。

显然,“What to Rent”网站两位创始人的敏锐目光给他们帮上了大忙。在网站上,他们用许多问题来了解用户的特质,并且推荐DVD。在现实生活中,他们会去公司附近的饭店里挑战一些更有难度的推荐方式。他们随机地挑选一些人,不和他们进行交谈,只是根据对行为举止的观察来推测他们最喜欢的某部电影。

他们会在人群中选中端水送饭兼收盘子的伙计,然后开始描述这个观察对象:“破烂的牛仔裤、金属手镯、各部位有若干纹身”,“20岁以上接近30岁”,“在一个年轻化的餐馆里工作”,“在这里的年轻人很多没有念完高中,因为他们很难集中注意力,但是却花了大部分时间用来阅读一些由艺人兼作家——比如尼克·凯夫 (Nick Cave) ——撰写的哲理书籍”。由此,库尔克认为《星河战队》(Starship Troopers) 这样有点轻微反政府情节又有点刺激动作场面的电影最适合他的口味。果然,他们从对方嘴里得到这个答案。

这种了解内容和用户的特质,送上合适产品的做法,被称为“基于内容的过滤” (Content Based Filtering) 。正如“What to Rent”需要在事前对用户做一个问卷调查,他们同样要对内容产品贴上各种门类的标签并且写入数据库。?

在这类发现型网站中,国内用户最熟悉的是音乐推送网站“潘多拉” (Pandora) 。只要在“潘多拉”网站首页的播放器中输入用户最喜欢的歌手名字或者歌曲标题,网站就会自动建立一个网络电台,源源不断地播放最符合用户口味的曲目。用户喜欢或者不喜欢一首歌,可以点击相应的反馈按钮,让系统更明白自己的喜好。

这种有趣的体验建立在惊人的“音乐基因工程”(Music Genome Project)基础之上。45位音乐分析师——其中大部分拥有音乐方面的学位——以每月15000首歌的速度完善“潘多拉”的曲目数据库,每首歌都拥有400字左右的详细介绍。在播放每一首歌的时候,点击“为什么选择这首歌”的选项,就可以得知目前播放的曲目与用户输入曲目的所有相似之处。

而随着社会化网络(Social Network) 的大规模兴起,另一种被称为“协同过滤”(Collaborative Filtering) 的推荐方式也得到了越来越广泛的应用。如果说“基于内容的过滤”可以被视作由机器完成的推荐,那么“协同过滤”就可以被看成由人完成的推荐。

以“协同过滤”推荐机制为核心,网站并不需要做出如同“What to Rent”的“性格—产品”匹配,而只需要了解“用户都在同哪些人进行交往”、“用户加入了哪些组群”、“用户都在看谁的页面”这样的问题,然后根据“物以类聚、人以群分”的思路为用户推荐他的伙伴都感兴趣的事物。

国内以图书推荐起家的“豆瓣”就是这方面的代表。从建站以来,豆瓣就只是提供给用户关于图书、电影和音乐的基本信息,而不需要由网站员工对用户或者产品做出“贴标签”式的逐一了解。用户在“豆瓣”上发现新的产品,完全以他们参与的小组和关注的对象作为切入点,在网站上的参与度越高,发现的效果也就越好。

无论从用户还是服务提供者的角度出发,这两种推荐方式都有各自明显的优劣。如果采用“基于内容的过滤”,那么在完成内容和用户互相匹配的过程中,就可能出现“越读越窄”、“越听越窄”、“越看越窄”的问题,提供的内容完全与用户兴趣点相吻合,而没有发散。

“协同过滤”在很大程度上避免了这个问题,但是他需要用户达到一定数量级之后才能发挥出网站创建者预想的效果,这种“网络效应”使得同一市场上的后来者很难找到切入的机会。而用户一旦不能得到“好处”,可能迅速离去,而来不及提“利他”的后话。

推荐引擎机制的前提、基本方式和典型应用

推荐机制的两种方式:1、基于用户行为;2、基于产品基因;

推荐机制建立的前提:1、用户行为数据记录;2、产品特性基因构成;

1、基于用户行为:案例amazon(亚马逊)

亚马逊的推荐系统是程序自动化和用户相关购物信息天才集合的经典之作。亚马逊花了十几年的时间建立和完善了这个系统。这个系统基于产品和相关用户的巨大数据库;记录的信息包括你在过去几年或几分钟内做过什么。

所有推荐都基于用户个人行为,加上商品本身,或者是其他用户在亚马逊的活动。不管是因为你以前购买过相关产品,还是因为其他很多用户都喜欢,亚马逊每推荐给你一件商品,都增大你把它放进你的购物筐的可能。

2、基于产品基因:案例pandora(潘多拉)

音乐染色体组项目的推出,目的在于把音乐解析成为最基本的基因组成。它的基本想法是:我们因为音乐的某些特性喜欢音乐--那么为什么不能根据音乐的某些相似之处设计出一套推荐系统呢?这类推荐系统应该属于基于产品的推荐。但具有深刻创新意义的是,产品(音乐产品)的相似性,通过“基因”组成来衡量。

这种“即刻满足感”是很难抗拒的。因为pandora 了解音乐相似性背后的因素,它不需要了解用户的好恶,就可以把用户黏住。确实,pandora 需要把握用户的口味或记忆--但这正是蕴藏在音乐本身的dna中了。当然pandora有时并不完美,会播放不对用户口味的音乐。但这很少发生。

拓宽联想:音乐产品的基因组适用于其他产品吗?也就是说:标签(tag)是否就能代表产品的基因呢?案例del.icio.us

社会化书签网站中首屈一指的 del.icio.us (见译言有关del.icio.us的译文)则采用不同的办法--让用户自己来鉴定、标识。这种自组织的方式相当成功,del.icio.us 很快在最初的使用者中流行起来。今天,del.icio.us 已经不仅仅是一个书签网站--它还是一个新闻网站和搜索引擎。但del.icio.us是否也是一个推荐系统呢?答案是肯定的。这是一个非常简明的推荐系统,它指基于一个基因--那就是一个标签。

思考:每一个网站都有自己的一套为用户创造体验与价值的方式,而真正的“即可满足感”又有几家能做到。尤其现在的web2.0类型网站都首先标榜“用户体验”,在copy一个成功模式之后,以为就同样完整的copy了相同的“用户体验”的自我感觉其实是错误的。比如说:我们很多的digg类、书签类新网站,并没有发挥自己的创造力,甚至根本都没有结合国情。或许未来下一个更好的系统是完美地将用户行为与产品基因相结合的推荐模式,不管是商务网站的产品推销,还是社会化网站的服务,因为:

一个出色的推荐机制不光对netflix,对其他网络企业也非常重要。这是因为用户的网上活动分为两类:搜索和浏览。当消费者明确知道她想要什么的时候,她搜索。但当她不太清楚想要什么的时候,她浏览。浏览活动为推荐系统带来了绝好的机会。因为当用户没有集中注意力在找她想要的东西时,她对外来的建议是敞开的。

在浏览过程中,用户的注意力(和他们的钱),都等着你去抓住。通过向用户展示有吸引力的东西,网站可以使交易成功的可能最大化。所以如果网站能增加给用户提供好推荐的几率,就能赚更多钱。显然这不是一个容易解决的问题,但解决这个问题带来的好处是巨大的。

美国最大的网上租赁DVDNetflix去年公开了他们的数据库,并邀请有志者提出更新更好的算法,奖金100万美元,所有网站都在努力在这一领域领先对手一步,抢占未来互联网的制高点。

 

 

两句话加上:  淘宝得跳出框也在做这个事情,最简单低级的,我上次浏览得啥,下次登陆相关推荐。

第二个,现有sns,还是现有B2C

分享到: