跳轉到主要內容

聲音被括起來以後

語言進入字幕時,通常像是被記錄。聲音進入字幕時,卻常像是在通關。人的話可以一句一句排成字,房間裡的聲音得先說明自己為什麼該出現,為什麼會讓一句話中斷,或是被徹底蓋過。問題不在 [music] 太短,而在於這只方括號像一扇窄門,決定什麼聲音能被交給眼睛。

所以螢幕角落跳出 [music] 的時候,我會停一下。聽見的人也許正被一段很具體的聲音包圍:舊收音機漏出來的歌,低頻從地板底下壓近,餐廳音箱裡一首不合時宜的情歌。字幕只遞來一個被擦乾淨的詞,像有人把整個房間擰成一張小標籤,貼在畫面邊上。

如果只說這是損失,又太順手了。對聾人和重聽者來說,字幕不是附屬說明,也不是聽覺原件的殘缺影本;它本來就是進入同一場事件的方式。沒有 [music],那段聲音甚至不會被交給眼睛。問題不在於字幕不夠像聲音,而在於聲音一旦變成文字,常常被迫從氣氛裡退開,變成一種有用的資訊。

聽見的人不必把每一聲都變成資訊。冰箱在牆邊低低震著,杯底碰到桌面,走廊有人把鑰匙放進碗裡,這些聲音可以沒有用處,只是讓一個地方繼續像它自己。可聲音一旦進入字幕,往往已經通過篩選。APPLAUSE DROWNS SPEECH,掌聲淹沒了說話;GUNFIRE,不必說明誰朝誰開槍。那些標籤冷靜得近乎粗暴,卻也誠實:有時字幕無法歸還一句話,只能告訴你語言如何被聲音擊敗。

自動字幕把這件事暴露得更直接。它太習慣先尋找人在說什麼,至於房間、風聲、遠處的樂器,常常晚一步才被看見。但人工字幕也不是在一張可以慢慢寫作的紙上工作。它面對的是幾秒鐘、兩行字,和一雙正在移動的眼睛。粗糙有時來自懶惰,有時來自媒介必須做出的壓縮。

反過來說,聲音也不該一股腦被推到螢幕中央。字幕如果太愛解釋,會替觀看者搶先感動:把一段旋律寫成 [gentle romantic music plays],可能比 [quiet violin melody] 更熱心,也更武斷。對只靠字幕進入影片的人來說,過多的聲音說明也可能變成另一種噪音。更好的字幕不一定更文學,而是讓觀看者少一點被統一安排。

最動人的時刻,反而出現在方括號沒有放棄觸感的時候。[heart throbbing] thud-dub, thud-dub。它沒有把心跳解釋成緊張,而是把一小塊節奏搬到眼前。[wet towel slapping] thrack,也不是動作說明,而是一聲濕重的拍打。文字在這裡不假裝還原聲音,只是在眼睛裡重新造出一個可讀的節拍。

後來我再看到 [music],就不只覺得它貧乏。它像一張貼在門縫上的小紙條,告訴讀它的人:房間裡確實有聲音。只是門沒有打開。紙條輕輕晃了一下。那聲音也許很近,也許隔著雨和牆,正拖著一點脾氣從螢幕外走過去。眼睛停在方括號上,等了一下,然後繼續往前讀。