Jonathan Fletcher:鲜为人知的现代搜索引擎之父

标签:搜索引擎产品

访客:37673  发表于:2013-09-06 09:10:53

Jonathan Fletcher:鲜为人知的现代搜索引擎之父

Google 迎来了它的 15 岁生日,它成为了信息检索的代名词。可能许多人都没有听说过 Jonathon Fletcher 这个名字,如果将它键入 Google 的搜索框,没有直接的结果会告诉你他在万维网历史中所发挥的作用,以及他作为现代搜索引擎之父的角色。但正是在 20 年前,他在苏格兰斯特灵大学的一个计算机实验室里发明了世界上第一个采用网络爬虫技术的搜索引擎——该技术奠定了今天 Google、Bing、Yahoo 等搜索工具的基础。

1993 年,网络刚刚起步。历史上首款大众浏览器 Mosaic 才出现不久,而网页的总数量也仅有数千个,人们还不知道如何在网上检索信息。Mosaic 当时推出了一个叫做 What's New 的页面,可以对新创建的网站进行索引。问题是,这些站长若要 Mosaic 的开发者获知其新网站,须向 Mosaic 所在的国家超级计算机应用中心(NCSA)写信通知。

在同一时期,Jonathon Fletcher 刚刚以优异成绩从斯特灵大学毕业,并获得了格拉斯哥大学提供的 PhD 学习机会。不幸的是,格拉斯哥大学终止了 PhD 研究经费,他顿时无事可做。“突然间我非常想去找一份工作,”他回想道:“所以我回到了母校,在那里得到了在科技部门工作的机会。”正是这份工作让他第一次接触到了万维网,以及 Mosaic。

在建设一个网络服务器的过程中,Jonathon 意识到 Mosaic 的 What's New 页面是存在本质缺陷的。由于需要手动添加网站到 What's New 的列表上,网站内容的变动无法被追踪,最终导致的后果是,许多列表上的链接很快就会过时,或者被错误标注。“如果你想知道发生了什么变化,你必须亲自回到网站上去查看,”他说:“我拥有计算机科学学位,认为应该有更好的解决方式,我决定编写一个程序来帮助我进行查看。”而这一程序正是世界上首个网络爬虫(web crawler)。

Jonathon 将他的发明取名为 JumpStation,他将一些网页放在一起,提供给一个网络爬虫进行搜索,接下来它会自动对经过的所有网页上的所有链接进行访问和索引,直到访问完所有内容。十天之后,也就是 1993 年的 12 月 21 日,JumpStation 完成了它的任务,总共索引了 25000 个页面。Google 到目前为止页面索引量已逾万亿。

很快 Jonathon 就为索引创建了一个易于使用的搜索工具,并将之置于 Mosaic 的 What's New 页面,世界上首个现代搜索引擎诞生了。“我认为他是网络搜索引擎之父,”研究信息检索历史的 Mark Sanderson 教授说:“很长一段时间里,都是由计算机完成搜索工作,在网络出现前肯定也有搜索引擎,但 Jonathon 的发明第一次具备了现代搜索引擎的所有要素。”同 Google 一样,其创始人塞吉布林和拉里佩奇的名字家喻户晓,而现居香港的 Jonathon Fletcher 却没有为其在互联网发展历史所发挥的作用得到应有的认可。这可能也与他的项目被最终抛弃有关系。随着 JumpStation 的成长,它需要越来越多的投资——而斯特灵大学当时并无此意愿。“它在一台共享服务器上运行,”Jonathon 解释道:“当时没有很多磁盘空间,而且那时候磁盘空间小、造价昂贵。”

到 1994 年 6 月,JumpStation 页面索引量达到了 27.5 万个。由于存储空间限制,Jonathon 无法对页面的所有内容进行索引,只能退而求其次,对标题和页眉进行索引。即便如此,JumpStation 依然不堪重负。Jonathon 也开始觉得力不从心。“那不是我的本职工作,”他说:“我的工作是维持学生实验室运行,做些系统管理和技术方面的零工。”来自日本的一份工作邀请也让他难以拒绝,斯特灵大学方面对他也无意挽留。JumpStation 也没有引起足够的重视,“显然我没有成功说服他们 JumpStation 所具的潜力,”Jonathon 说:“那时候我做了我认为对的决定,但在过去 20 年里,我也曾数次回首那段往事。”斯特灵大学计算机科学和数学主任 Leslie Smith 教授承认 JumpStation 事后被证明“领先于时代”,她说“大学的同事很高兴看到 Jonathon 正在获得他应得的认可”。

尽管 JumpStation 的最终结果让人唏嘘,但 Jonathon 的这一发明依然是随后很多网络搜索引擎的基础。“1993 年时的网络社区规模还很小,”Sanderson 教授说:“当时任何与网络沾边的人都知道 JumpStation。到 1994 年中,大家逐渐意识到网络搜索引擎将变得非常重要,Google 直到 1998 年才出现,而 Jonathon 在 1993 年就在干这事儿了。”

Jonathon 在数周前作为嘉宾参加了在爱尔兰都柏林举办的一个会议,与他同座的是来自微软、雅虎和 Google 的代表,他在演讲中谈论了未来。“以我的观点,网络总有一天会消亡,”他说:“但搜寻信息的难题将一直存在。从内容中搜索和发现信息的需求并不受媒介的限制。”

许多搜索引擎正是在他发明的技术基础上发展和崛起来的,对此他没有后悔:“我父母以我为荣,我妻子以我为荣,我的孩子们也以我为荣。这些对我来说很重要,所以我很快乐。”

原文载于:36Kr 作者:



评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");