bwin必赢官网登录IMDb互联网最受欢迎的电影网站离不开它背后的超级用户
发布时间:2023-04-16
 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。  编者按:你想找点东西会去问谷歌,你想找一些知识会去,但如果你想找电影方面的知识,最后的目的地必须是 IMDb,没有比这个由痴迷的电影爱好者支撑起来的众包网站更全的地方了。本文记录了其中一些超级贡献者的努力,只是最近人工智能开始要抢夺这群主角的位置了。文章来自编译。  1960 年代,当 Le

  神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

  编者按:你想找点东西会去问谷歌,你想找一些知识会去,但如果你想找电影方面的知识,最后的目的地必须是 IMDb,没有比这个由痴迷的电影爱好者支撑起来的众包网站更全的地方了。本文记录了其中一些超级贡献者的努力,只是最近人工智能开始要抢夺这群主角的位置了。文章来自编译。

  1960 年代,当 Les Adams 来到德州的伊斯特兰(Eastland)时,该镇的石油繁荣已经过去了大约 50 年。但 Adams 来这里是为了寻找另一种宝藏。在一家保龄球馆,他的前老板给了他一条内幕消息。这名叫做 Preston Smith 的政治家说,伊斯特兰的一家印刷公司正在变更业务。多年来,这家印刷厂一直是电影业宣传材料的主要来源,但最近这家工厂开始转战餐厅菜单这个新市场。Smith 说,那家印刷厂还剩下一点印刷品——是电影发行商为推销新电影而制作的小册子——说不定 Adams 会感兴趣。带着 Smith 手写的便条,Adams 在主街的办公室找到了印刷店的老板 Victor Cornelius。Adams 告诉我:“我至今都不知道 Smith 对 Cornelius 说了什么。但有一点可以肯定,我拿到了那些小册子。他把那些小册子放在楼上一个封闭的房间里——堆满了一个接一个的架子。这些小册子最早的印刷时间是 1930 年,它们是按字母顺序排列的。”Adams 借了辆皮卡车,一连跑了五趟,最后才将 30 年的电影史运回了他自己收藏的地方——拉伯克(Lubbock)距离这里大约有四个小时的车程。他回忆道:“最后我快被埋在纸里了”。

  Victor Cornelius 的公司后来成为美国最大的菜单印刷公司之一。Preston Smith 后来成为了德州第 40 任州长。但 Les Adams 将会成为领袖——可以说是一件更宏伟、影响更深远的东西的领袖。

  在接下来三十年的时间里,Adams 利用业余时间不断丰富自己的电影收藏以及这方面的专业知识,尤其是 1930 年代到 1960 年代的电影。后来到了 1999 年,Adams 了解到当时还颇为崭新的万维网上有个地方可以保存所有这些知识。他对 Internet Movie Database 的第一印象并不好——“一个果园,到处是唾手可得的果实,但是果园的样子很丑陋”——但他也看到了它的潜力,有成为“唯一一个为电影研究人员及历史学家提供一站式服务的网站”的可能性。他决定参与这个众包项目。

  现年 88 岁的 Adams 已经为互联网电影数据库 ( IMDb ) 上列出的电影撰写了近 7000 部剧情简介。他总共贡献了超过 890000 条关于电影和电视的信息,其中很大一部分直接来自他从伊斯特兰运来的文件。他告诉我说:“如果数据可称重的话,IMDb 欠 Preston Smith 先生以及 Victor Cornelius 先生一小吨的感谢。我只是个信使而已。”

  不过,截至 2023 年初,Adams 给数据库补充的大量内容也只能让他在高产贡献者排行榜中位列第 41 位。其他人撰写了超过 35000 篇剧情简介;还有一位,尽管存在一些争议,则贡献了惊人的 2200 万个条目。贡献的范围涉及从纠正错误的标点符号到撰写新演员传记。

  全球有超过 8300 万的 IMDb 注册用户,但其中只有一小部分人曾经给这个数据库添加过信息。这个群体包括添加演职人员名单的演员;给自己的作品提交内容的制片公司;最重要的是,在他们认为合适的地方做出了贡献的个人志愿者。该网站的名人堂每年都会列出来自巴西、印度、德国、挪威、菲律宾、西班牙、瑞典、叙利亚、土耳其和美国等国的前 300 名贡献者,以表彰他们为了帮助建立一个卓越的电影和电视参考资源而付出的大量时间和精力。但除此以外,他们得不到公众的认可;他们大多是匿名的,不会在网站上透露太多关于自己的信息。他们也得不到报酬。(Adams 说他曾经收到过 IMDb 的领带别针。)但是,他们的贡献在 web 的影响力无法估量——数百万人光顾过 IMDb,这里的东西被拿到和 TikTok 上重新使用,或者复制到电影活动清单上,被学术文章引用。

  在一个许多人对互联网现状持悲观态度的时代,常常被奉为一个罕见的携手合作的奇迹,为了公众的利益而收集众包的知识——一个对早期互联网乌托邦理想的孤独坚持。但 IMDb 做同样事情的时间比还早了五年。它的成功以及寿命可以说是一个更为奇怪的现象。它来自群众,但这些群众个个都是独立工作。这是一个草根项目,但它的所有者却是全世界最大的公司之一。这是一个建立在“该赞扬的就得赞扬”的基础之上的知识库——但它自己的故事却鲜为人知。

  争论名人谁比谁更火在青少年当中是一种经久不衰的消遣——有时候也是一位已经 30 岁的 web 巨人的内核。1989 年,在一个 Usenet 讨论组上,有人发起了一个话题,让大家评价一下哪些女演员最有魅力。后来有人将这个话题变成了女演员及其演过电影的列表;又有人每个月都会组织对这份清单进行更新,并分发给其他人,他们还给这份清单起了个名字,叫“THE LIST”。另一位成员又另起炉灶,创建了一份在世的男演员名单,然后则是一份包括去世的男演员名单(演员的热度已经不再重要)。之后又有人建立起导演名单。1990 年 10 月,有位名字叫做 Col Needham 的英国程序员兼电影爱好者参与了该项目,他发布了一个脚本(script)——作为代码的脚本而不是剧本(注:两者英文都是 script)——这个脚本可让用户搜索所有的列表,就这样,互联网电影数据库的第一版就面世了。数十名志愿者,再加上两所大学,开始为创建和管理更多列表提供支持,他们还建设了贡献、管理和访问数据所需的基础设施。 1996 年,Needham 与他的同事将 IMDb 并入自己的公司,并转移到上,此时网站已有超过 65000 部电影的条目,并立下了一个崇高的使命:“从世界各地收集与电影相关的一切信息”。

  这个使命在今天听起来也许好像算不上多么的大胆无畏,但两年后谷歌才正式启动“整合全球信息,使人人都能访问,并使人人都能从中受益”的目标,IMDb 比也早了五年。获得免费的、无穷无尽的信息是一种启示,而不是期望。如果你想知道点什么,你还得知道去哪里找——得找对参考书、杂志回溯目录(magazine back catalog),或者,也许bwin必赢官网登录还得找到对的宣传册档案。 IMDb 把所有的东西都凑到了一起,为电影发烧友以及普通影迷提供了一个查找资料的地方。这是一个罕见的由用户驱动的互助企业与商业产品组成的混合体。1998 年,亚马逊收购了 IMDb 并扩大了其内容的覆盖面,但这个电影知识生产的臭鼬工厂基本上没有受到影响。

  IMDb 的出现几乎让 Gary Brumburgh 浪费掉了十年的人生。1980 年代,Brumburgh 开始从事电影研究,并撰写了一本覆盖率达到 1000 名演员的参考书,同时他自己也在努力在好莱坞站稳脚跟。第一次访问 IMDb 的那一刻,他已经意识到至少自己的文学项目没有前途了。他告诉我说:“我非常沮丧,因为 IMDb 差不多像是抢走了我的书,现在它已经过时了”。但经历了最初的失望之后,他给自己的所有这些工作找到了新的目的:两年多来,在每天结束自己在洛杉矶县的日常工作之后,Brumburgh 会再花五个小时写作,然后向 IMDb 提交迷你简历(虽然不是他自己的简历)。 他说:“这变成了一种强迫症。我很长一段时间都与人隔绝,但我做到了我认为需要做的事情。”

  Brumburgh 的痴迷让他成为 IMDb 有史以来第三多产的传记撰写人,撰写了超过 1200 篇传记,他的文字涵盖了某个对象的生活和职业,有时候篇幅可接近一千字。他记录了很多演艺界的一流人士,包括 Clive Owen(克莱夫·欧文)、Forest Whitaker(福雷斯特·惠特克)、Jeff Bridges(杰夫·布里吉斯)、Jennifer Hudson(詹妮弗·哈德森)、John C. Reilly(约翰·C·赖利)、Kathy Bates(凯西·贝茨)、MarkRuffalo(马克·鲁弗洛)、Tilda Swinton(蒂尔达·斯文顿)等。不过,他的大部分贡献都是关于 1930 年代至 50 年代演员的传记,以及最近时代一些鲜为人知的演员的。Brumburgh 现在已经 72 岁,人已退休,他会在纳什维尔演奏一下爵士乐。他说:“我希望参与 IMDb 的年轻人知道当年的这些演员,而不是忘了他们”。虽然 IMDb 让他的书一文不值,但他随后对该网站的贡献帮他找到了打零工的机会,作为电影杂志作家为《Films of the Golden Age》以及《Classic Images》等撰稿。总而言之,一切顺利。他说:“我喜欢 IMDb 。我一直在努力”。

  Brumburgh 搞砸的出书项目以及每天坚持写 5 小时的习惯也许独一无二,但他对激励自己的原因的解释却并非如此。就像其他所谓的超级贡献者一样,他相信自己正在为一种艺术形式以及所有看到它的人服务。完整、准确会让自豪感油然而生。

  截至 2022 年 12 月,IMDb 上面已经放置了超过 625000 部电影以及超过 230000 部电视剧的页面。这个站点现在还放有关于播客、音乐视频与视频游戏的参考信息,以及各种预告片、原创内容、放映时间与观看列表。从冗长的电影概要,到准确的放映时间,这些页面总共包含了超过 4.84 亿条数据。

  任何开设 IMDb 帐户的人都可以给网站添加内容或者进行编辑。但不是所有的提交都一样。从如何列出电影所属国家(基于拍摄电影的资金来源,而不是拍摄地点)到假发是否属于服装部门(它们不是),网站受到了贡献者章程以及 109 项指导指南的约束。贡献需要由 IMDb 进行审查,尽管该公司对于这个过程究竟如何进行并不透明。IMDb 的代表不愿透露自己网站雇用了多少版主和编辑,也不愿透露他们自己收集或修改内容的程度如何——只是说他们“有团队和机制来审查数据以确保尽可能的准确可靠”。

  包括 CEO Col Needham 在内,至少部分员工也积极参与到 IMDb 的社区论坛(IMDb Community Forums),这套贡献系统本身也在不断受到审查,并经常通过投诉、建议以及辩论等方式进行修订。论坛专门用于“数据问题及政策讨论”的部分无疑是最活跃的,有近 40000 次对话。一篇受欢迎的帖子寻求支持“要让 UNIT PUBLICIST 成为 IMDB 的一个工作类别”,而不是将这个角色与“其他工作人员”混为一谈(编者注:UNIT PUBLICIST的主要工作是影片制作时记录拍摄进程,收集任何有可能作为宣传素材的资料,并准备剧组主要人员个人介绍、影片的剧情介绍以及其他公关文稿)。一份典型的员工公告解释说,在对贡献者进行成功的 Beta 测试之后,该网站现在已经可以对提交的播客系列做出适当的分类了。这些关于网站运作的公开协商显示了 IMDb 对于的谨慎和平衡的考虑:应该允许尽可能多的贡献者进来,但也鼓励当中的一些人做出多产的贡献。前 10 名用户去年成功提交了 22910419 个条目,占到该网站全部数据项的近 5%。要想跻身年终顶级贡献者排行榜,用户需要至少编撰 17000 个条目。

  贡献者的品味和专业领域各异,从修改标点符号到对印度肥皂剧情有独钟不等——这些多样化的兴趣才是决定 IMDb 的数据每年如何扩展和变化的决定性因素,而不是电影公司的计划。身为印刷出版业人士的德州人 Les Adams 估计,他为解决美国电影不完善的非美国发行商问题而发起的改革运动,可能是他得以跻身 2003 年杰出贡献者名单的原因。Christian 是西班牙的一名编辑兼翻译,他在IMDb的用户名是 Pegg1976,是截止 2022 年底 IMDb 史上排名第六位的贡献者。他做出了近 300 万次贡献,纠正了其他用户犯下的错误以及 IMDb 没发现的错误:重音、大写问题,尤其是角色名称写错的问题。

  其他的超级贡献者则努力确保自己国家的内容在网站上有自己的一席之地。Dibyayan Chakravorty 是印度加尔各答的一名 31 岁的工程师,当他看到来自印度的内容的详细信息非常少时,他开始往 IMDb 里面添加内容。(自那以后,他成为了 IMDb 民意调查当中最受欢迎的作者。)Miriam Vazquez Fraga 的职业是记者,她在 IMDb 撰稿人排行榜的排名是第 17 位。但在她开始利用业余时间开始往里面添加有关西班牙的电视节目及其演员信息时,她还是一名学生。不管是在罗马尼亚还是菲律宾,总会有像 Dibyayan 和 Miriam 这样的人给自己国家的影视信息添砖加瓦。

  部分贡献者被召唤进入更深奥的领域。当新泽西的 Joe Wawrzyniak 不再从事零售工作时,他开始努力寻找那些身为无名之辈的电影专业人士的信息,那些从未站在聚灯光下,或在任何地方出现过名字的人,包括早期的特技演员,小众的恐怖作家,出演过电影的小狗等。他告诉我说:“挖掘这些角色的信息很有趣,也很有挑战性”。他是撰稿人当中的佼佼者,已撰写了 3000 多份传记。为了获得鲜为人知的信息,Wawrzyniak 天天泡在在电影电视的小众在线社区以及 Facebook 群当中,比方说 1980 年代临时演员群,到那里联系演员并确认相关细节。

  Ulf Kjell Gür 则投身到斯堪的纳维亚半岛与德国的电影档案中,努力挖掘没有被网络记录的那些被遗忘的电影制作人。为了写好一个电影制作人的整个职业生涯,他说他“甚至会去打扰他们的朋友和敌人,试图去了解这些人,因为他们对我来说很重要。”这位 70 岁的瑞典人曾在剧院工作,他估计自己现在每天要花 6 个小时来撰稿:看电影、做笔记、阅读剧本,还有给 IMDb 撰写剧情简介以及迷你版的人物介绍。他看过 6000 多部影片,但他发现,给电影补充详细背景介绍的电影寻猎之旅给自己带来了额外乐趣。他说:“这才是推动我的真正动力,就像一样。”

  即便没有到斯德哥尔摩的皇家图书馆去搜寻,也没有到得州各地去搬宣传册, IMDb 的大部分内容的超级贡献者仍为该网站投入了数小时的工作。给演员或电影制作人写一份有说服力的传记既是一个范畴很广的研究项目,也是一次克制的练习;给节目或电影制作出清晰的回顾是当今杂志文化作家的核心工作职责。至少,大多数人都会看自己所添加数据相关的影视作品——我采访的超级贡献者每天都会看两部或更多的电影。

  与其他网站的超级用户不同,IMDb 的超级贡献者并没有把全部的热忱都倾注在一个在线社区上面。在我交谈过的人当中,只有 Dibyayan 曾试过与其他的 IMDb 贡献者建立联系。而且这个网站在设计之时也没有替建立这种联系行便利的考虑:用户的个人资料很少,而且也不能直接向其他用户发消息。IMDb 也许是一个积累项目,而不是一个集体项目。马丁·斯科塞斯的页面是经过数千次编辑的产物,而不是某位作者的个人努力;但他在 IMDb 的传记署名作者只有一个用户。这些是这个贡献系统的结果,它与这个网站在萌芽时候的格式非常相似,那不是一个网络——而是一幅散点图,里面的每一个节点都管理有自己的列表,或者维护自己的影视题材,然后直接连接到内核。IMDb 的模式之所以有效,是因为这套系统成功地利用了一种更抽象的联系:粉丝的团结。超级贡献者可能彼此并不认识,或者没有任何的共同喜好,但他们希望能为像他们这样的粉丝提供服务,也许还可以帮助培养出新的粉丝。

  Ines Pape 也许是有史以来最高产的 IMDb 贡献者。我采访的超级贡献者都不知道用户 inespape-1 是谁,他们之间也从未联系过。IMDb 并没有回答有关他们身份的问题。我试过上 Facebook、LinkedIn 以及 Twitter 去搜过叫做 Ines Papes 的账号,但均一无所获。Ines Pape 也许根本不是一个人:其贡献的条目数量超过了 2200 万——仅去年一年就贡献了 360 多万,这相当于平均每分钟就提交近 7 次——这至少不可能是靠一己之力所能完成的。超级贡献者可以通过写写简介进入名人堂,但要想登上榜首,他们必须写代码。

  虽然 Ines Pape 的做法不为人知,但去年的头号贡献者告诉了我他是怎么登顶排行榜的。在看到了该网站对挪威影片的评分后,Simon Lyngar 开始给 IMDb 补充内容,却发现相关电影的页面并不存在。作为一名学编程的学生,他很快意识到他可以将提交贡献这件事情自动化,从而节省自己的工作,同时还可以测试一下他的技能。他编写程序,通过 Spotify 以及挪威国家广播的 API 提取数据,尤其是播客节目数据,然后提交给 IMDb。他说:“我早上启动程序之后,它就会自己做完所有事情,当我下课回家时,我的名下就已做出了 100000 次贡献。” 2022 年,他以 Nomissimon10 的用户名作出了 8924424 次贡献,并因此赢得了年度贡献排行版的第一名。

  一些贡献者不大看得惯这种做法,他们在社区论坛上讨论起自动化的问题。他们认为用这种手段闯入排行榜是非法的。Lyngar 则反对说:“我认为他们当中有很多人都不理解,他们不明白我做出这个程序也是投入了大量时间的。毕竟,我们都不过是希望 IMDb 拥有更多数据来满足用户的需求罢了。”

  作为一家公司,IMDb 目前本身并不收集任何信息,但很难想象亚马逊的子公司会放弃这些工具,因为它们已经证明了自己的价值。将上传影视作品、演员、演职人员名单以及制作细节这些事情众包给人类的做法也许不会长久了。尽管如此,哪怕是 AI 的先驱也还没有做到自己看完新作品就能描述梗概的地步。你可以让 ChatGPT 写一个虚构的电视节目的剧情简介,但如果你让它写一下《弗莱斯曼有麻烦了》(Fleishman Is in Trouble)的摘要的话,它会告诉你那不过是一本书罢了,而不是剧。因为这部迷你剧 2022 年才首播,而那已经是这个机器人训练数据截止的数月之后了。也许未来的模型能bwin必赢官网登录更好地跟进当下的事情,但就算是最聪明的人工智能也没法像那些在现实世界追踪数据的超级贡献者那样找到稀有的电影胶片以及尘封的收藏品。只要线下还有电影史没有被搬到网上,或者还有新的但被忽视掉的内容,那些对记录这些东西足够上心的人就可以发挥自己的作用。

  而且只要 IMDb 的超级贡献者希望这个数据库的数据尽可能详尽,不断制作出来的新电影、电视节目与播客就意味着他们的工作实际上永远也不会有结束之日。绝对意义上的规模是一方面原因。人会犯错是另一个原因:Les Adams 称 IMDb 为“最准确的电影数据来源,同时也是错误最多的电影数据来源”。就算过去的每一部作品都被完美记录下来,每添加的一条新内容也会将目标实现推向遥不可及的远方。一份 Usenet 列表再加上几十位精通技术的电影粉丝跟不上内容的膨胀;一个网站的管理者也做不到,因为这个网站有数百万用户,这些用户做出的贡献也数以百万计。但是,仍然有人渴望能实现包罗万象,并在应对这一挑战中寻找到人生的意义。