首页 新闻 论坛 小组 Blog 文档 下载 读书 Tag 网摘 搜索 .NET Java 游戏 视频 人才 外包 第二书店 程序员

logo

您的位置:CSDN 首页−>新闻频道−>正文

谷歌中国研究院副院长眼里的“天涯”

2007.08.28  来自:TOM科技      共有评论(0)条 发表评论    收藏

日前,Google(谷歌)中国研究院副院长张智威在博客中谈到了与天涯的合作以及谷歌对社区搜索的一些看法。

他表示,近年来,“上网社交”成为互联网发展的又一热潮,这一变化给个性化搜索带来新的曙光。

“用户们不仅可

以上网查找信息,而且也会在不同程度上参与网络社交活动(打牌、聊天、购物或者约会等等)。”

“我们可以通过他们的行为很好的了解用户。例如,一个经常和大学生交流的用户很有可能就是一位大学生。同理,经常光顾迪斯尼企鹅俱乐部网站的很可能是孩子。”

他也承认,个性化社区搜索有两个很大的挑战性,一是如何根据大量的网络活动信息了解用户;二是如何在保护个人隐私的同时利用收集到的信息去支持个性化服务。

以下为博客全文:

与天涯合作的谷歌社区产品上线,使谷歌向建立支持个性化服务的下一代互联网搜索迈出了的重要一步。

在今年年初新成立的谷歌研究院,作为重点研究方向之一,我们已经研发了几个并行算法来发掘海量的数据,以及在保护隐私的前提下,检测垃圾信息。

当然,虽然这些优点无法立刻在我们的社区产品中得到体现,但是我们的平行算法将很快在根据用户匹配个性化的搜索结果方面发挥强大威力。

门户网站,作为互联网第一代高速公路,将网上信息以类似图书馆的形式整理起来。在最初的门户网站中找寻信息,用户通常需要多次点击才能找到答案。

举一个在北京机场附近找别克经销商的例子。用户需要打开一个个类似这样的树状分支:汽车->别克->经销商->北京,然后再查看在北京机场附近是否有这样的经销商。

所以搜索引擎的迅速崛起正是因为搜索引擎仅需一次点击即可更快速地找到相关信息,大大提升了用户使用的效率。

早期的搜索引擎技术是基于传统的信息采集模型,依靠词频来排序。Google(谷歌)通过引入 Pagerank 机制,引发了搜索引擎的变革:一个网页如果被多个重要页面引用,那么它在搜索结果中将有较高排名。

但是,至今仍没有搜索引擎能够真正的将个人偏好引入到排名体系中。为了将用户使用习惯引入排名标准,下一代搜索引擎必须研究、学习每位用户的真实信息,将这些信息转化为可扫描的模型,并利用这些信息来协助搜索。

不幸的是,个性化搜索面临至少两大技术上的挑战:首先,个人资料经常缺失或准确性较低;其次,相对于互联网中的信息,收集到的用户信息太少了,以至于我们无法有效的处理数据。也正是因为这些原因,个性化搜索已经被讨论了很多年,但至今仍未见到一个卓有成效的解决方案。

有趣的是,近年来,“上网社交”成为互联网发展的又一热潮,这一变化给个性化搜索带来新的曙光。用户们不仅可以上网查找信息,而且也会在不同程度上参与网络社交活动(打牌、聊天、购物或者约会等等)。我们可以通过他们的行为很好的了解用户。

例如,一个经常和大学生交流的用户很有可能就是一位大学生。同理,经常光顾迪斯尼企鹅俱乐部网站的很可能是孩子。当前,以下技术难题很具有挑战性:

1. 如何根据大量的网络活动信息了解用户;

2. 如何在保护个人隐私的同时利用收集到的信息去支持个性化服务。

与天涯合作的谷歌社区产品上线,使谷歌向建立支持个性化服务的下一代互联网搜索迈出了的重要一步。在今年年初新成立的谷歌研究院,作为重点研究方向之一,我们已经研发了几个并行算法来发掘海量的数据,以及在保护隐私的前提下,检测垃圾信息。

当然,虽然这些优点无法立刻在我们的社区产品中得到体现,但是我们的平行算法将很快在根据用户匹配个性化的搜索结果方面发挥强大威力。

发表评论 0条】
其他文章
相关文章
最近评论
正在载入评论列表...
热点评论

     
    网站简介广告服务网站地图帮助联系方式诚聘英才English问题报告
    北京创新乐知广告有限公司 版权所有, 京 ICP 证 070598 号 世纪乐知(北京)网络技术有限公司 提供技术支持
    Copyright © 2000-2008, CSDN.NET, All Rights Reserved