仙仙 发表于 2013-3-13 17:33:28

IMDb:从一到无穷大

如今已经把畅快淋漓地享受互联网作为一种生活方式的人们恐怕很难想象二十多年前互联网的模样。那个时候,Windows操作系统尚在襁褓之中,鼠标“点击”这么习以为常的动作还要过几年才会诞生,而供公众使用的第一代“网页浏览器”也未出世。那是一个只有文本的蛮荒年代,早期的互联网用户只能通过E-mail或者Usenet新闻组来互通有无、交流信息。
前传
IMDb的前身就诞生于1989年。当时在Usenet新闻组rec.arts.movies上由热心影迷创建了两份名录。其中一份是由Hank Driskill创建的“美女眼”(Those Eyes),主题是女演员们的美丽双眸,他以此主题收集了一份性感女演员及她们出演过的电影的名录。这篇普通的新闻组文章由于其他人的参与,容量增长的很快,不久就被大家简称为“名录”(THE LIST)流传开来。另外一份则是由Chuck Musciano创建的“电影评分名录”(Movie Ratings List),旋即更名为“电影评分报告”(Movie Ratings Report)。他要求参与者给电影投票评分,导致这份名录也迅速扩充。
到1990年,Col Needham整理了这两份名录并制作出“名录与电影评分联合报告”(Combined LIST & Movie Ratings Report)。从此,这个项目像雪球一样越滚越大,相继推出了“男演员名录”、“导演名录”和“女演员名录”。由于这些名录只收录在世者,于是又推出了为已故影人立传的“死亡名录”(Dead List)。几个月后,这个项目已经收录了23,000个条目,包含近万部电影和电视剧。在10月17日那天,Needham发布了一套Unix shell脚本,用于检索这4个名录,于是这4个名录和脚本一起就构成了IMDb的第一版——“纯文本的Unix版”,当时被称作“rec.arts.movies电影数据库”。这一天也就成为了IMDb的诞生日。
成长
最初的检索脚本给早期的用户们带来了极大的乐趣,他们相继建立了编剧、作曲家和摄影师等新的分类名录,接下来是可以记录用户给每部电影评分的投票系统的推出。数据库一直把“尽可能多的提供在线、有用、最新、免费的电影信息”作为其最基本的目的。随着软件系统的不断更新,到1993年,数据库已经增加了其他的影人分类,并扩充了花絮、传记和剧情简介等资料,信息的深度和广度都得到了很大的提高。这一年的晚些时候,IMDb被移入了还处于测试阶段的万维网,最初的网页界面作者是Rob Hartill。接下来的几年,数据库靠捐赠的带宽在连接世界各地镜像的网络上运行着。
1995年,数据库的访问量从当初的每天100次增长到了成千上万次,每周录入的信息量比1990年全年还多,数据库被正式更名为“互联网电影数据库”。这个项目发展得是如此之快,以至于仅仅依靠捐赠带宽和空闲时间来维护它的运行已经明显不可能了。为了继续秉承信息免费共享的理念,数据库的商业化成为共识。一年之后,IMDb在英国注册成为互联网电影数据库公司(Internet Movie Database Ltd),Col Needham出任公司主管,数据库的主要维护者们成为其股东,依靠广告、许可证和合作获得收入。除了少数几位负责人是全职的,其他都是只在晚上或周末工作的兼职者。
随后,IMDb关掉了镜像站点,分别在美国和英国设立了自己的专用服务器。由于用户获得了更好的服务,所以几乎没有产生用户因反对商业化而造成的负面影响。不到一年的时间,公司就在美国安放了9台服务器。然而,没过多久,再次被数据库发展的迅猛势头赶超。1998年,公司发展遇到了瓶颈,收入的大部分被用在了设备上,剩下的还不足以支付员工的薪水,数据库的访问量和新资料的录入量的增长也显著放缓。一些大公司试图收购数据库,但股东们不愿将其出售给那些无法保证会继续提供信息免费共享的公司。
新生
Amazon.com的创始人Jeff Bezos的出现改变了这一切。他深知网络和它形成的社区并非只有潜在的市场价值。在这一点上,IMDb的理念与他不谋而合。“我们希望你们继续做正在做的事。”当IMDb的股东们听到亚马逊高层主动说出的这句有些难以置信的话时,两家一拍即合。有了IMDb海量的信息资源,出色的专家、股东和员工,和上百万的潜在客户,亚马逊网站计划扩展DVD、原声大碟和录像带方面的销售。
最终,Jeff Bezos与Col Needham及其他主要股东达成了协议,IMDb被完全收购并成为亚马逊的子公司,一直以来为数据库辛勤工作的人们换来了一份真正的回报。原有的主要股东也悉数留任,部分兼职员工做起了全职。另外一方面,很多热心的参与者不能理解自己对数据库所做的大量无偿的贡献被卖给私人公司,随即发起了一些抗议并导致部分人离去。
高水平程序员的加入使得在1998年的晚些时候,网站的界面旧貌换新颜。数据得到了更好的整合,导航服务得到了改进。并推出了一系列特色专题和栏目。2002年,它面向业内人士推出了一项名为IMDbPro的收费服务,这项服务提供了诸如票房详细信息、电影公司名录等专业资料,增强了信息统计和多重检索功能。同时,原有的服务继续免费向用户开放。
今世
这些年来,“尽可能多的提供在线、有用、最新、免费的电影信息”作为IMDb的基本任务始终未变,他们不仅要专心做最好的数据库,更要做互联网上最有用的数据库。它已经成长为一个关于电影、电视剧、电视节目、电子游戏和相关制作人员的专业在线数据库。截至2013年3月7日,IMDb一共收录了2,453,060个条目和5,109,810个人物,这些数字每天都在增长。
2006年1月26日,被期待已久的“支持全集”(Full Episode Support)上线,使得数据库可以支持每部电视剧中的每一集都有单独的演职员表。这项服务被Col Needham称作是“对IMDb数据模式前所未有的最大改动”,导致数据库的条目数从485,000陡增到了755,000。目前IMDb的全部条目中,电视剧更是占去了一多半。
2007年10月初,IMDb又推出了全新的角色页面,即把影视作品中的角色作为关注对象来设置独立页面,里面可以看到这个角色曾经出现在哪些影视作品中,“他”的“照片”和“语录”,以及“小传”。值得一提的是,角色的内容编辑引入了目前最为流行的维基模式。只要是被IMDb认证通过的相关用户,都可以直接参与编辑,而不需要像提交其他信息那样得到管理员的审核。
讨论版(Message Boards)也是IMDb非常火爆的一个栏目,开设于2000年。除了在每部电影和每位影人的页面下方都提供有单独的讨论版外,在专门的讨论版页面还设有140多个子讨论版。在这里讨论的内容虽然以电影和影人为主,实则气象万千无所不包。2007年5月9日,甚至专门开了“政治”版来对政治人物品头论足。
投票
IMDb的“最佳250部电影”(Top 250)名单可谓镇站之宝,这项主要由普通影迷通过投票经计算而自动生成的电影排名推出至今,已经逐渐得到了大众影迷的广泛认同。每一部已经公映的电影,用户都可以对其打分,从1分到10分一共十个等级,分值越高表示这部电影的口碑越好。IMDb在评分页面分别给出了一部电影所有评分的算术平均值和中值。这种直观的评分方法当然是很流行的,也易于大众接受。但是从心理测量和统计学的角度,它却存在着显而易见的毛病。
实际上,算术平均值和中值只是参考,IMDb采用的是经过滤和加权一部电影的所有原始评分之后得到的“加权平均值”作为其最后显示的得分,以避免大量垃圾票的出现。它并没有公布具体的计算方法,以防作弊的发生。除了整体得分,IMDb还分别提供不同年龄段、男女观众、资深用户(仅1000名)和普通用户、美国用户和非美国用户评分的结果,以便于用户根据自己的实际情形来进一步参考。总的说来,经过处理的结果比起直接算平均分要合理和有效得多。
必须是已经公映的片长在45分钟以上、投票数超过某一下限值的非纪录片电影,才有资格参与Top 250排名。注意,这些票数要全部来自所谓的“正规用户”(regular voters),为了保证排名的有效性,IMDb不会公开“正规用户”的明确标准,大抵是指那些经常参与投票的活跃用户。为了让这份名单更具有公信力,IMDb公布了其评分的具体计算方法。它是以贝叶斯统计的算法得出的加权分来作为排名依据的,公式如下:
W = (Rv + Cm) ÷ (v+m)                                 
W = 这部电影的加权平均值(Weighted Rating)
R = 这部电影的算术平均值(Rating)
v = 这部电影的总票数(votes)
m = 进入Top 250所需票数的下限值(当前是25,000)
C = 数据库所有电影得分的算术平均值(当前是7.1)
Top 1宝座争夺战一直是影迷们津津乐道的话题。当2008年夏天,《蝙蝠侠:黑暗骑士》上映时,狂热的影迷一举将它推上了第一的宝座,虽然好景不长,却也算搅局成功,将《教父1》拉下了王座,随后《肖申克的救赎》则稳居了第一。不过若是按在位时间来算,还是《教父1》更胜一筹。但要知道在十五年之前,前十名里可没它的影子!那时的前三名依次是:《星球大战》、《猜火车》和《肖申克的救赎》。由于当时短片尚能参与排名,我酷爱的《超级无敌掌门狗》居然占据了Top 10的两席!
值得一提的是,IMDb还有一份也是由贝叶斯算法得出的“最烂100部电影”(Bottom 100)名单。较之于Top 250名单的相对稳定,Bottom 100可谓是在频繁变动。据说这是因为一部在美国风靡了11年的大型邪典电视喜剧《神秘科学影院3000》造成的,该剧专门拿一些大烂片开涮,甚至在它的官方网站上鼓励观众注册IMDb专门给剧中出现过的大烂片打最低分。由于地域和文化的差异,这些电影大多都在国内难得一见,而我们所谓的很多大烂片都在榜单上不见踪影。
之最
作为世界上最大的电影资料库,IMDb绝非浪得虚名。随着数据库不断的扩容,哪怕躺在世界某个阴暗角落里无人问津的一部电影,有朝一日都会出现在IMDb。事实上,IMDb目前收录的电影就已经是无奇不有了,这里仅举出三部电影来,以飨读者。
世界上最早的电影——《朗德海花园场景》。据考证是由Louis Aimé Augustin Le Prince拍摄于1888年10月,片长不到两秒钟,共计24帧。纪录了一家人在花园里转圈嬉戏的场景。更为可贵的是,这段原以为失传的赛璐璐胶片已于近年重现于世。
世界上最长的电影——《治疗失眠》。John Henry Timmis IV拍摄于1987年。它纪录了一次为治疗失眠症患者而设计的实验的全过程,即诗人L.D. Groban朗读自己长达4080页的诗歌作品。此外片中还穿插了重金属摇滚乐的录影带和限制级镜头,使得片长达到了5220分钟合87个小时!光是首映就花了四天时间。
世界上片名最长的电影——《邪恶变种异形食肉地狱僵尸活死人之侵袭恐怖报复重返新娘的儿子的黎明的一天的夜晚第二部:骇人听闻2-D版》,James Riffel将George A. Romero在1968年拍摄的《活死人之夜》(Night of the Living Dead)于1991年重新配上了搞笑的对白之后,就把片名给搞成这样了,41个单词,连带空格在内有208个字母!可惜的是,经典被颠覆成了烂片。
说到名片,还有一点提醒。IMDb为了保证其数据库的国际性,所有电影片名都尽可能用的是出品国的原名,而对于非拉丁语系的名称则一律将原名做国际通性的拉丁化处理。所以如果你想查找日韩或者俄国电影,可以在网上先找到相应的拉丁化片名后再到IMDb进行搜索;至于国片则是汉语拼音、港片是粤语发音的威妥玛拼音。另外,由于很多非英语电影数据库都会附上其英文片名,因此搜英文片名也不失为一个办法。
时光如水,岁月如梭!距本文发表于《电影世界》已经过去五年,其间网站又遭封杀两年。值此春暖花开解封之际,特修订此文重发于豆瓣。如今的IMDb,早已成为“做你所爱,财富自来”这句话所指的出色典范之一,来自世界各地数以千万计的影迷从中收获着知识和快乐。影迷和IMDb一起,共同在一个梦想中,继续成长。

http://img3.douban.com/view/note/large/public/p8158494.jpg
页: [1]
查看完整版本: IMDb:从一到无穷大