李开复:希望做完整的搜索引擎
本文来源于《财经网》 2009年07月23日 11:37【《财经网》北京专稿/记者 明叔亮】6月18日之前,谷歌中国正见起色。搜索市场份额第一次出现提升,新产品如地图搜索、移动搜索、MP3搜索等相继推出,针对中国市场的产品线逐步丰富,与竞争对手相比不再那么单薄。按照谷歌全球副总裁兼大中华区总裁李开复的计划,接下来将是谷歌开始发力的阶段。但是,一场风暴多少打乱了李开复的步伐。
6月30日,李开复接受了《财经》记者采访。采访在李开复位于北四环外的家中进行。由于刚刚完成手术,李开复回答问题时,大部分时间只能躺在沙发上。访谈部分刊登于刚刚出版的《财经》杂志2009年第15期。以下为更详细的访谈内容。
反低俗举措
《财经》:6月18日之后,对于谷歌网络搜索含有低俗信息的争议一直在持续,你们对此事是怎么看的?
李开复:无论在任何国家,我们都希望在不触犯法律的前提下,给用户更多的选择。在任何一个领域里搜索,我们都希望给用户提供的结果是最全面的,我们自己的使命就是整合全球的信息。
处理互联网色情的内容难度很高。第一,对于色情内容的界定缺乏统一的标准。仅仅通过搜索引擎公司自行设定关键词或bad URL,由于人力、脑力限定,不可能做干净。第二,色情网站使用很多技术,在其网站被搜索引擎屏蔽时,自动跳转到新生的URL,防不胜防。
在这个问题上,我们是花了很大精力的,在此问题上的投入只会比其他公司更多。谷歌相对其他公司来说,还有一个困难在于我们的索引是最大的。我们全球抓取了几千亿个网页,我们的原则是在人工辅助的基础上,尽量使用技术来实现过滤。因为如果光用人工过滤数千亿个网页,假如我们雇佣一万人,每人每天审核5000个网页,这样十年才能做完。这个工作量是巨大的,我们不可能雇这么多人去这么做。
《财经》:无法使用人工过滤,怎样从技术上去实现,谷歌做了哪些工作?
李开复:从十天前到现在(注:6月30日),还是做了不少工作。我们的工程师已经做了一个“机器学习”系统,能够根据网页上的文字还有用户的使用习惯,挑出“可能是黄色网站”的网站,再经过人工审核,来过滤黄色网站信息。这样,我们的编辑不必看几千亿个网站,只要看我们机器挑出的一百多万个网页就可以了。今天,谷歌能搜到的黄色内容已经比其他搜索引擎少很多了,半个月之后会少更多。
上面提出的技术对文字网页很有用,但是图片不是机器能够做出精确辨识的,虽然我们也有图片的“机器学习”。我们想了一个办法,正在做一个网民举报系统,当网民看到了不合适的图片之后,点击举报。一张图片,如果被多次举报,就会进入我们人工审核筛选的流程。这个技术一两周之内就会上线。
最后,针对青少年上网的人群,我们在探索是否有可能做一个专门的搜索引擎,但是有一定的难度,还在评估中。
《财经》:谷歌一直坚持减少人工干预的价值观,谷歌总部对谷歌中国实行这样的过滤机制是否认可?
李开复:我们希望做一个既合法、又完整的搜索引擎。这点,谷歌总部是有共识的。
《财经》:联想词机制当中所出现的那些低俗内容,是谷歌刻意为了流量所做的吗?
李开复:当然不是。联想词是根据用户的搜索频率产生的。大家常搜什么,什么就会出现在联想词里面。我们确实可以审查得更好,但确实不是流量的问题。
《财经》:6月24日晚上,谷歌在国内服务出现了中断,此次事件是否会动摇谷歌对在中国市场持续发展的信心?
李开复:不会。谷歌的承诺没有改变。另外,我补充一下,谷歌中国的Google.cn服务并没有中断。我们在中国的Google.cn服务一直非常稳定。
《财经》:这会降低谷歌对中国市场的期待吗?
李开复:不会。经过这次事件,我们发现网民非常关心我们,而且我们看到了他们的期待。这证明中国是一个值得赢得的市场,我必须争取更多的资源来做我们该做的事情。
- 上一篇: 刘绍勇:受益最大的将是上海
- 下一篇: 李东生:TCL国际化决定没有错



视频
手机《财经网》
Linkedin
Facebook
Mixx
Yahoo Buzz
Twitter
校内网
豆瓣网

朝鲜经济出了什么问题?
谁偷了经济数据








