芥末堆芥末堆

字幕制作是件辛苦活,其實可以用技術(shù)一鍵搞定

作者:怡彭 發(fā)布時間:

字幕制作是件辛苦活,其實可以用技術(shù)一鍵搞定

作者:怡彭 發(fā)布時間:

摘要:一家名叫OKVoice的語音技術(shù)提供商教我們用技術(shù)搞定字幕制作。

提起字幕,許多人都不會陌生。美劇、日劇、韓劇,以及二次元動漫圈子,都對字幕有著大量的需求。數(shù)量更大、范圍更廣的電視受眾,也已經(jīng)對錄播節(jié)目中的字幕習(xí)以為常。在如今火熱的在線教育中,其也有著不可替代的功能。以字幕的形式幫助國內(nèi)學(xué)習(xí)者跨越語言障礙,是國外名校公開課、國外MOOC在國內(nèi)推廣的必須條件。而即使是國內(nèi)老師錄制的視頻課程,字幕也能在一定程度上解決語速、口音、內(nèi)容復(fù)雜給學(xué)習(xí)者帶來的理解困難的問題。

但是目前,除一些名校公開課有大公司、“字幕組”提供的字幕支持外,國內(nèi)的各種錄播課程,大都不提供字幕。在這個已經(jīng)把“體驗”、“極致”講到吐的時代,各家公司自然不是想不到字幕的問題。做不到,做不起,是最大的原因。

在制作視頻字幕,特別是教育視頻的字幕時,能否用技術(shù)替代人力,提高效率,節(jié)省成本呢?一家名叫OKVoice的語音技術(shù)提供商正在試圖給我們一套可用的解決方案。日前,芥末堆收集了OKVoice的聯(lián)合創(chuàng)始人馬驥和市場總監(jiān)向丹,聽他們?nèi)绾慰创@個問題。

給視頻配字幕有多難

由于外國動漫、電視劇、電影的火爆,很多國外劇集在推出之后的4-8個小時,就會有字幕組將制作完成的字幕文件掛在網(wǎng)上供免費(fèi)下載使用。這樣雷鋒般的義務(wù)勞動,慣壞了不少國人,讓大家認(rèn)為字幕是一件很簡單的事情。而事實上,這是一件非常耗時耗力的工作。

粗略來看,字幕制作的工作可以分為文本輸出和時間軸制作兩個部分。文本輸出是指將視頻、音頻中的話語信息由聲音轉(zhuǎn)換成文字。時間軸制作則是在決定每一句話在屏幕上出現(xiàn)、消失的時間點。兩部分都需要花費(fèi)大量時間由人來完成,是一件無法由機(jī)器替代的“體力活”。在字幕組,一個40分鐘至一個小時的劇集通常需要數(shù)個人組成的小組通過合理的分工合作,才可能在數(shù)小時內(nèi)完成。這樣原始的、依賴人力的狀況,在電視臺這樣不差錢的地方也并未得到改觀。從事節(jié)目制作工作的白先生對芥末堆表示,電視臺的字幕制作量更大,且同樣全部由員工手工完成。“一分鐘的節(jié)目通常要花十倍的時間才能轉(zhuǎn)換為文字稿,加上時間軸制作的時間,整個字幕的制作耗時非常大。”

不只是時間,巨大的人力消耗極大地提升了成本。OKVoice的馬驥表示,目前在線教育的錄播節(jié)目,如果一集的制作成本是一千元,為它制作字幕則需要再多花二百至三百元。過于昂貴,正是目前大部分教育課程視頻沒有字幕的原因。但是,不論是一般學(xué)生還是特殊用戶(如聽力障礙),對字幕都是存在需求的。

語音技術(shù)能做什么

語音識別技術(shù)目前在做的,是建立語音、文字兩個相互平行的語料庫,通過機(jī)器識別、算法匹配,來達(dá)到文字與聲音之間的轉(zhuǎn)換。

據(jù)馬驥說,在語音識別上,整個行業(yè)能做到的正確率大約為90%,而當(dāng)達(dá)到95%的時候,這項技術(shù)的實用性將大大提升。盡管以目前的技術(shù)來看,在通用領(lǐng)域?qū)⒄_率推高至95%還有些遙遠(yuǎn),但在一些更專的領(lǐng)域,通過對算法的調(diào)整和機(jī)器學(xué)習(xí),將識別率提高到95%也并非沒有可能。

市場總監(jiān)向丹則表示,盡管OKVoice是一個僅成立一年的新公司,在體量與知名度上均無法與業(yè)內(nèi)龍頭相比,但他們的核心技術(shù)團(tuán)隊在此前已經(jīng)有過5年的技術(shù)積累,在技術(shù)和達(dá)到的效果上均能達(dá)到業(yè)內(nèi)頂尖的水平。與其它公司相比,OKVoice的優(yōu)勢在于,他們能夠為客戶的個性化需求做定制服務(wù)。“不是90%的識別率,而是經(jīng)過定制優(yōu)化的95%?!?/p>

目前,基于語音技術(shù)開發(fā)的產(chǎn)品有語音助手、口語評測、語音輸入等等,而在字幕制作上卻還是空白??礈?zhǔn)了這一點的OKVoice推出了“字幕大師”,一款專為字幕制作使用的產(chǎn)品。在現(xiàn)階段,其開放了自動對齊時間軸的功能。將影音文件與文本信息分別導(dǎo)入后,系統(tǒng)可以在非??斓臅r間內(nèi)把時間軸對齊。在為芥末堆演示的demo版本中,“字幕大師”已能達(dá)到較高的識別率。在未來,OKVoice還將推出不需要人工錄入文本信息,識別影音文件中的聲音后直接輸出字幕的功能。這個產(chǎn)品最終要達(dá)到的目標(biāo),是能夠處理外文片源,直接輸出翻譯后的字幕。

在OKVoice團(tuán)隊看來,對“字幕大師”這一產(chǎn)品需求量最大的,正是在線教育領(lǐng)域。事實也的確如此,目前,已有合一互動、好學(xué)教育、德勝制課等在線教育、課程制作公司與OKVoice達(dá)成合作,使用“字幕大師”來輔助課程視頻的字幕制作。隨著語音技術(shù)的發(fā)展與普及,在未來,”字幕“這件又貴又耗時的苦差事,將不再成為負(fù)擔(dān)。

1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權(quán)拒絕一切形式轉(zhuǎn)載,違者必究;
2、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。
來源: 芥末堆
芥末堆商務(wù)合作:王老師 18710003484
  • 字幕制作是件辛苦活,其實可以用技術(shù)一鍵搞定分享二維碼