久久亚洲国产精品视频,中国AV片,最近中文字幕免费大全,国产亚洲精品久久久999功能介绍,欧美色女人

金融情報(bào)局網(wǎng)

搜狗獲全球口語翻譯大賽冠軍 成機(jī)器翻譯標(biāo)桿

當(dāng)前位置:金融情報(bào)局網(wǎng)>資訊 > 頭條 > 正文  2018-11-13 13:40:31 來源:TechWeb

11月7日,在2018IWSLT(International Workshop on Spoken Language Translation)全球頂級口語機(jī)器翻譯評測大賽上,搜狗憑借BLEU(BLEU是機(jī)器翻譯自動評價(jià)方法,其數(shù)值越大意味著越準(zhǔn)確)值28.09的成績奪得冠軍,超過第二名1.6個BLEU。在如此重量級賽事中斬獲冠軍足以凸顯搜狗在口語機(jī)器翻譯領(lǐng)域的領(lǐng)先地位。

IWSLT作為全球最具影響力的口語機(jī)器翻譯評測比賽,今年是第15屆,共有10支隊(duì)伍參賽。除了全球領(lǐng)先的學(xué)校、科研機(jī)構(gòu),今年也有包括美國APPTEK、國內(nèi)科大訊飛、阿里巴巴在內(nèi)的“大廠”參賽。

TechWeb近日和搜狗參賽核心成員進(jìn)行了近距離溝通,從中或許可以窺見搜狗機(jī)器翻譯能力快速突破的訣竅。

兩年兩項(xiàng)領(lǐng)域奪冠 成機(jī)器翻譯標(biāo)桿

在機(jī)器翻譯領(lǐng)域,這已不是搜狗第一次獲得冠軍。

在去年的2017WMT(Workshop on Machine Translation)機(jī)器翻譯頂級評測大賽上,搜狗就獲得中英和英中翻譯雙向冠軍,其機(jī)器翻譯的準(zhǔn)確率和速度受到業(yè)界矚目。

搜狗機(jī)器翻譯負(fù)責(zé)人王宇光介紹,本屆IWSLT2018評測比賽中,考評的是將英語演講語音翻譯成對應(yīng)的德語文本,難度系數(shù)更高。

IWSLT2018大賽共分了2大賽道,其一是Baseline Model(基線模型賽道),這是業(yè)內(nèi)最主流最實(shí)用的語音翻譯應(yīng)用技術(shù)。另一賽道是End-to-End(端到端賽道),為本屆大賽新增設(shè)賽道。

baseline模型對應(yīng)的語音翻譯方案,包含語音識別、機(jī)器翻譯兩大模塊,采用多步流水線設(shè)計(jì),即語音信號先輸入語音識別系統(tǒng)得到源語言的識別文本,然后再將識別文本送入機(jī)器翻譯系統(tǒng)輸出目標(biāo)語言的對應(yīng)譯文。

End-to-End模型則是輸入語音,基于深度神經(jīng)網(wǎng)絡(luò)模型直接輸出譯文,并不會產(chǎn)生源語言的識別中間結(jié)果。

搜狗參加的是baseline模型賽道比拼,并最終奪得冠軍。

從比賽結(jié)果BLEU數(shù)據(jù)來看,搜狗的BLEU最高,達(dá)到28.09。第二名是科大訊飛BLEU26.47,相差1.6個BLEU。搜狗語音技術(shù)負(fù)責(zé)人陳偉表示,從BLEU上來看二者差距已經(jīng)比較明顯,這種差距從用戶層面上已經(jīng)是可感知程度。

新增賽道End-to-End模型賽道的最高BLEU僅為19.4,與baseline模型結(jié)果相差甚遠(yuǎn),End-to-End模型離能實(shí)際商用解決用戶翻譯需求還有很大差距。

多模型融合 細(xì)節(jié)打磨成制勝法寶

王宇光介紹,IWSLT201大賽,搜狗共投入近17人的團(tuán)隊(duì),耗時近3個月時間打磨整合聲學(xué)模型、機(jī)器翻譯、語音增強(qiáng)、語言模型、解碼器等領(lǐng)域技術(shù)能力。

搜狗語音技術(shù)負(fù)責(zé)人陳偉表示,“這次IWSLT評測數(shù)據(jù)體系是真實(shí)場景下的,而且又涉及到跨語言(英德)的現(xiàn)象,檢驗(yàn)了我們能力,也證明我們在不同語種之間的遷移能力。”

陳偉介紹,在baseline模型的語音識別、機(jī)器翻譯兩大模塊方面,從技術(shù)實(shí)驗(yàn)上看,在語言識別上,目前搜狗和訊飛水平基本持平,在文本翻譯上搜狗做的更好。但是,他也強(qiáng)調(diào)“做好語音翻譯這件事,除了單拼語音識別、單拼翻譯以外,主要還是拼細(xì)節(jié)。”

在IWSLT201大賽競技中,陳偉透露,為了確??谡Z翻譯準(zhǔn)確率更好,無論是語音識別還是機(jī)器翻譯,都采用了多個不同模型融合去做,包括不同的語料、時間點(diǎn)、數(shù)據(jù)、特征等。每個模型優(yōu)勢不同,多個模型做磨合,讓多個專家一起做決策,這樣能保證準(zhǔn)確率有進(jìn)一步的提升。僅語音識別方面,搜狗團(tuán)隊(duì)就用了用包括TDNN、BiLSTM、Deep-CNN在內(nèi)的多個模型融合。

語音識別場景往往存在很多問題,如演講者口語化現(xiàn)象、現(xiàn)場噪聲問題,翻譯方面有選詞、一詞多義問題。怎么去應(yīng)對這些問題,很多是在細(xì)節(jié)上打磨。除了把語音識別和機(jī)器翻譯做好,還需要解決語音翻譯結(jié)合部分的工作,如語音順順滑、斷句等等工作。

此外,搜狗已經(jīng)向大眾推出了翻譯機(jī)、同傳等產(chǎn)品,搜狗同傳產(chǎn)品在網(wǎng)球公開賽、游泳世界杯等多場景下進(jìn)行了實(shí)踐使用。這些來源于實(shí)際產(chǎn)品的經(jīng)驗(yàn)和用戶反饋,也幫助搜狗語音翻譯技術(shù)不斷迭代突破。目前在噪音相對小的情景下,搜狗語音識別準(zhǔn)確率可達(dá)95%,以5分制評價(jià),機(jī)器翻譯能維持在4分左右。在陳偉看來,這些都成為搜狗口語翻譯冠軍實(shí)力的注解。

加速語音翻譯技術(shù)商業(yè)化落地

基于搜狗語音翻譯實(shí)力,目前搜狗打造的同傳、旅行翻譯狗、錄音翻譯筆等產(chǎn)品已經(jīng)落地多個場景,并不斷迭代升級。

搜狗同傳目前已支持過很多科技大會,具備了很強(qiáng)的科技屬性?,F(xiàn)在開始嘗試在網(wǎng)球、游泳比賽、專業(yè)學(xué)術(shù)會議等領(lǐng)域做同傳適配,未來將向更多領(lǐng)域拓展。

陳偉表示,盡管語音翻譯技術(shù)已經(jīng)有了突破性發(fā)展,但是和成熟的人工同傳相比還有很大差距。預(yù)計(jì)到2020年左右,機(jī)器同傳的水平可以達(dá)到一般水平速記的程度。目前搜狗同傳希望能夠更好地配合人、幫助人,并不是替代人。

此外,陳偉透露后續(xù)會有多款圍繞語音翻譯技術(shù)的硬件產(chǎn)品發(fā)布,搜狗在語音合成技術(shù)方面近期也會有新的產(chǎn)品發(fā)布。

關(guān)鍵詞: 搜狗 口語翻譯

相關(guān)內(nèi)容