搜索引擎正纷纷涌现,以筛选Twitter和 Flickr那样不断更新的网站以及博客,但他们仍然任重而道远。
作者:Jessi Hempel
随着伊朗镇压跟踪其最近竞选的新闻记者,国际注意力转向了Twitter,公民记者们向该网站发布140字的报道以及照片和视频链接。问题在于,很难区分有用且可靠的信息与许多包含大量垃圾邮件、无用评论以及零散意见的tweet。
少数事件更清晰的定义了网络上最新的问题:如何弄清从Twitter、Facebook、Flickr和博客——实际上是网络空间中其他任何自助出版平台——上不断涌现出的实时信息。这实在令人不知所措。
谷歌(Google)——十年来,消费者一直依赖其组织互联网——在这方面表现不佳。5月,在谷歌的时代精神会议上,该公司联合创始人拉里•佩奇(Larry Page)承认谷歌已经落在了Twitter后头,称谷歌“在做即时更新的东西这方面表现不佳”。
一个迅速壮大的新创企业队伍希望通过提供实时搜索结果弥补这个漏洞。这些名为Collecta、OneRiot和Scoopler的公司试图回答这个问题:现在网络上正发生什么事情?几乎每周就有一家这样的新公司出现。IDC分析师哈德利•雷诺兹(Hadley Reynolds)解释道:“雅虎(Yahoo)、微软(Microsoft)和谷歌可能需要一段时间才能想出对策。这对新创企业而言,绝对是一个空白的商业机会。”
但提供这些结果并非易事。在最近的信息、最受欢迎的材料以及最重要内容的主观概念之间必然存在紧张局势。不存在完美的解决方案。
只靠时间过滤的信息几乎与数据流本身一样不易操作。然而一旦你开始增加过滤选项,例如根据出版者的权威性加权结果,或是信息正在网络上传播的速度,你可能会错过重要的趋势和信息珍闻,因为它们不流行。
这批不断更新的信息大部分来自Twitter。该网站的搜索引擎——其于2008年收购的名为Summize的新创企业——获得仅按时间过滤的结果。Collecta是一家于本月创立的搜索公司,也按时间来过滤结果,但从网络上其他博客和社会性媒体网站获取信息。
时间排序恐怕不是搜索结果的魔法过滤选项——也不是弄懂信息流的最佳方法。其中很多新创企业——例如Scoopler——开发的算法试图不仅搜寻到最新的tweet,还有最受欢迎的tweet。迄今,OneRiot是较著名的公司之一,该公司所依赖的系统名为PulseRank,该系统综合考虑某信息的新鲜程度、其发布者的权威性以及其当时的传播速度来确定其排名。
然而,迄今为止,上述搜索引擎都不算特别出色。其界面大都花哨俗气,且其结果都不够可靠、有用。伯尼•麦道夫(Bernie Madoff)被判入狱150年后的第二天,在少量此类网站上快速搜索获得的结果包括:一段“伯尼,再见!”的YouTube视频,一个链接到一段《每日秀》(Daily Show)视频的tweet,还有一个tweet问假如将伯尼•麦道夫的事迹拍成电影应该由谁来扮演他。
或许果真如此,即便短暂的滞后也能使网络挑选出最终有用的那类信息。麦道夫被判刑后一天,用谷歌搜索可得到《洛杉矶时报》(Los Angeles Times)一篇关于其听证会的新闻报导,其后紧跟的是这位骗子的维基百科(Wikipedia)词条。
译者:小熊