声音被括起来以后
语言进入字幕时,通常像被记录。声音进入字幕时,却常像在过关。人的话可以一句一句排成字,房间里的声音要先说明自己为什么该出现,为什么会让一句话断掉,或被完全盖住。问题不在 [music] 太短,而在这只方括号像一扇窄门,决定什么声音能被交给眼睛。
所以屏幕角落跳出 [music] 的时候,我会停一下。听见的人也许正被一段很具体的声音包围:旧收音机漏出来的歌,低频从地板下面压近,餐厅音箱里一首不合时宜的情歌。字幕只递来一个被擦干净的词,像有人把整间房间拧成一张小标签,贴在画面边上。
如果只说这是损失,又太顺手了。对聋人和重听者来说,字幕不是附属说明,也不是听觉原件的残缺复印;它本来就是进入同一场事件的方式。没有 [music],那段声音甚至不会被交给眼睛。问题不在于字幕不够像声音,而在于声音一旦变成文字,常常被迫从气氛里退出来,变成一种有用的信息。
听见的人不必把每一声都变成信息。冰箱在墙边低低震着,杯底碰到桌面,走廊有人把钥匙放进碗里,这些声音可以没有用处,只是让一个地方继续像它自己。可声音一旦进入字幕,往往已经通过筛选。APPLAUSE DROWNS SPEECH,掌声淹没了说话;GUNFIRE,不必说明谁向谁开枪。那些标签冷静得近乎粗暴,却也诚实:有时字幕无法归还一句话,只能告诉你语言怎样被声音打败。
自动字幕把这件事暴露得更直。它太习惯先寻找人在说什么,至于房间、风声、远处的乐器,常常晚一步才被看见。但人工字幕也不是在一张可以慢慢写作的纸上工作。它面对的是几秒钟、两行字和一双正在移动的眼睛。粗糙有时来自懒惰,有时来自媒介必须做出的压缩。
反过来说,声音也不该被一股脑推到屏幕中央。字幕如果太爱解释,会替观看者抢先感动:把一段旋律写成 [gentle romantic music plays],可能比 [quiet violin melody] 更热心,也更武断。对只靠字幕进入影片的人来说,过多的声音说明也可能变成另一种噪音。更好的字幕不一定更文学,而是让观看者少一点被统一安排。
最动人的时刻,反而出现在方括号没有放弃触感的时候。[heart throbbing] thud-dub, thud-dub。它没有把心跳解释成紧张,而是把一小块节奏搬到眼前。[wet towel slapping] thrack,也不是动作说明,而是一声湿重的拍打。文字在这里不假装还原声音,只是在眼睛里重新造出一个可读的节拍。
后来我再看到 [music],就不只觉得它贫乏。它像一只贴在门缝上的小纸条,告诉读它的人:房间里确实有声音。只是门没有打开。纸条轻轻晃了一下。那声音也许很近,也许隔着雨和墙,正拖着一点脾气从屏幕外走过去。眼睛停在方括号上,等了一下,然后继续往前读。