-
您的位置:首页 → 精文荟萃 → 搜索研究 → 搜索引擎2004,山雨欲来风满楼
搜索引擎2004,山雨欲来风满楼
时间:2004/10/15 1:23:00来源:本站整理作者:蓝点我要评论(0)
-
2003搜索引擎年
2003不愧为互联网的“搜索引擎年”。国内有百度,慧聪,3721三大中文搜索引擎的角逐,先是百度的举行的“万人公开评测”活动,得出了Baidu.com首次超越Google这一皆大欢喜的结果。其后慧聪也举行了“超越GOOGLE,体验第三代智能搜索”中文搜索引擎大测评的活动,而3721则是更是结盟Yahoo,似乎大家都有据Google于国门之外的决心。而Google,Yahoo,MSN 国际三大搜索引擎巨头的竞争更是火药味十足,微软、Yahoo和Google先后解除同城之约,开始自己的搜索引擎研究。Yahoo购买了Overture等搜索引擎公司,以加强自己实力,而微软收购Google的传言更是闹得沸沸扬扬。搜索引擎市场2003的滨彩纷呈使人们对新的一年有了太多的期待。众多世界级公司的介入,巨额资金的投入,我们不禁要问:搜索引擎2004,究竟谁主沉浮?搜索引擎 技术为王 暂且不提关于搜索引擎市场的太多预测, 和搜索引擎市场激烈竞争的场面相比,用户实际体验到的检索性能到底有了多大改观呢?我们依旧是面对几十页的搜索结果茫然不知所措,而且还不时冒出一些广告,我们似乎也看不出来Google、Yahoo还有Baidu的搜索结果到底有多大的差别。事实上目前搜索引擎的表现与用户的期望值相差依然很大。1998年Google的出现标志着以“超链接分析”技术为主要特征的第二代搜索引擎代替了以人工目编目为主的第一代搜索引擎,而时至今日已经5年有余,互联网搜索引擎却一直未有任何明显的改进。CPU已从M级升至G级,操作系统也从win98升级到win2003,而主干网的升级也大有赶超“摩尔定理”之势。但我们依然享受着和5年前几乎完全一样的信息检索服务,尽管Internet的主要目的就是为了信息检索和信息交换,尽管IT技术的更新换代的速度使我们经常有落伍之感。随着网页资源的急剧扩张,搜索引擎的性能却有逐渐下降的趋势,目前各搜索引擎数据库的平均更新周期已经到达一个月。而从覆盖率来看,目前没有一个搜索引擎可以涵盖60%上的互联网网页。用评价信息服务质量的三个标准“全面、准确、及时”来判别当前的搜索引擎,其还应有很大的改进余地。而网页资源仅仅是互联网信息资源的一部分。大量的多媒体信息,PPT、Word、PDF等等各类资源依然流落当前搜索引擎检索范围之外。面对瞬息万变而又规模庞大的Internet,仅仅做个网页搜索引擎已经力不从心,而作“整个互联网上信息的管理者”或许永远是个梦。 事实上无论是Google还是Baidu,其基本技术都是完全一样的,大家仅仅是在细节上方面略有差别,很难判定那个是最好那个不好,即使在Google的开放型实验室的未来研究项目也看不到“能改变人们观念”的技术革新。Google技术最强,而微软和Yahoo在用户群和资金上则有较大的优势,但在搜索引擎研究方面还刚刚开始,三大巨头的竞争可能一时还难分胜负。而下一代搜索技术的到来似乎还是遥遥无期,但技术的突破随时都会令这个技术致胜的领域变换格局。第二代搜索引擎并不完美,可搜索的文件格式单一,结果不准确,应用不符合个性化的趋势,因此整个互联网都在期待下一代搜索技术早日成熟。无论那是什么样的技术,到时候,检索信息的方式和结果都将是一种根本性的变革,但是这场新的变革到底会发生在何处?最近刚刚召开的IETF59届全会为我们带来了一点好消息。在此次全会上IETF第一次组织了关于信息问题的专题讨论,主张建立一个Internet信息检索基础框架(Internet information retrieval infrastructure),并提议成立专门的工作组。IETF是指导互联网发展的最重要组织,目前几乎所有的Internet技术和协议都是由IETF研制或改进的。作为互联网最重要的信息检索服务显然也在IETF视线之内,而在IRTF这个IETF的内部工作组中已有一些相关的讨论。在IETF看来,目前基本上所有的Internet技术都是基于公共协议的,从底层的路由传输协议到E-mail、Ftp等各种应用服务莫不如此。Internet上不应有技术机密,更不用说专利,而这也是Internet作为一项公共事业获得长足发展的基础。但作为互联网上最重要的信息检索服务由于各种原因却成了搜索引擎公司的独有产品,很多核心技术都是公司的最高商业机密,而搜索引擎的基本技术PageRank竟然还是一项专利,尽管还没人说要为此专利收钱。现有搜索引擎的一些不足以及相关技术的严格保密性促使IETF寻找一种更好的公共信息检索平台。而在众多媒体上对商业化搜索引擎的各种指责也屡见不鲜,对Google排名不公正的抗议接连不断,但Google显然不能把他的排名规则公布于世;互联网信息作为一种公共资源却在很大程度上被少数搜索引擎公司控制着,而一旦这种绝对的控制权和金钱利益挂钩产生的后果也让大家担忧。所以很多学者也建议将搜索引擎应该成为一种互联网的公共设施。说归说,做归做,如果说公众媒体对商业搜索引擎的一些微词也只能表达一下不满而已,IETF则会去实际地改变这种现状。IETF事实上起着Internet上游戏规则制定者的角色,虽然实上它的技术文档都称为RFC(Request For Comments, 请求注解)。这场变革由IETF来主导倒也十分合适。而从IETF此次提出的解决方案来看,其完全针对当前搜索引擎中的一些主要问题,在个性化、准确率等关键技术指标上都有较大的改进。整个方案的改进和相关协议的制定也只是时间问题,而对新的信息检索解决方案的迫切需求可能使此方案得到迅速实施,要知当前IPV6的实施恰恰需要这样一个“杀手级应用”,而此方案的一个重要特征就是要获得IPV6的一些底层支持。这对每个互联网用户来说都是一个好消息,但是一个公共的“互联网信息检索基础平台”可能使一些专业搜索引擎公司不得不另谋生路。 值得一提的是这次IETF讨论的公共信息检索方案是由华中科技大学数字图书馆研究课题组提出的。搜索引擎之战主战场一直都远在大洋彼岸,但而这次我们不用再隔岸观火。搜索引擎之王Google也恰恰起源于斯坦福大学的一个数字图书馆研究项目,如今图书馆建设也在经历着以纸本图书资源为主的传统图书馆向以整个互联网为资源核心的数字图书馆的转变,而Internet信息检索问题在这里显得更加突出,一个全新的搜索引擎解决方案由此而生也不足为奇。谁是互联网的上帝?如今的搜索引擎市场早已是山雨欲来风满楼,但对普通的互联网用户来说硝烟散尽,留下的总是更好的。我们将从新的互联网搜索系统中获得更为准确而详尽的信息。在任何市场经济规律存在的地方,用户都将是永远的上帝。而在任何年代里,只有哪些更能满足人们实际需求的技术才能生存和发展。
相关阅读
Windows错误代码大全 Windows错误代码查询激活windows有什么用Mac QQ和Windows QQ聊天记录怎么合并 Mac QQ和Windows QQ聊天记录Windows 10自动更新怎么关闭 如何关闭Windows 10自动更新windows 10 rs4快速预览版17017下载错误问题Win10秋季创意者更新16291更新了什么 win10 16291更新内容windows10秋季创意者更新时间 windows10秋季创意者更新内容kb3150513补丁更新了什么 Windows 10补丁kb3150513是什么
-
热门文章
没有查询到任何记录。
最新文章
百度搜索特效有哪些 百
开机电脑指示灯红色常亮是怎么回事?vmware强制卸载批处理提升SEO效果,网站URL设计应注意的八个要点告诉你原创、伪原创 方法
人气排行
开机电脑指示灯红色常亮是怎么回事?vmware强制卸载批处理百度搜索特效有哪些 百度搜索特效关键词大全如何彻底删除电脑自带中的输入法百度图片搜索引擎使用技巧批处理shift 命令详解用WinRAR加密文件很安全为什么电脑没有声音了
查看所有0条评论>>