凡語要想徹底顛覆社交領(lǐng)域,做facebook、twitter的終結(jié)者,僅憑當(dāng)下的完美翻譯遠遠不夠。
????還需要更進一步,擁有更多的賣點!
????當(dāng)下社交軟件的交互,不僅局限于傳統(tǒng)的文字,更是包含視頻、語音等等。
????更重要的是,互相之間的綜合交互,例如語音和文字之間的轉(zhuǎn)譯。
????因此,凡人論壇或者凡語,要顛覆整個領(lǐng)域,逃不過與時俱進。
????視頻交互容易解決,沒多少難度,然而語音就不同了。
????盡管當(dāng)下智能語音輸入軟件頗多,但精準度以及模糊識別一直是個大問題。
????當(dāng)用戶對著語音輸入法,興奮地說了一堆話,結(jié)果識別錯誤頗多,掉字連連,甚至連語義都扭曲了。
????至于那些不標(biāo)準的普通話,以及方言,結(jié)果更是慘不忍睹。
????說是雞肋都不為過。
????更何況王凡要求的更高!
????他想要將一種語言的語音,翻譯成另一種語言的語音。
????完美實現(xiàn)不同語言之間的對話交互,而不是單純地局限在文字上的完美交互。
????例如英語和華夏語的對話交互。
????這需要將英語的語音,轉(zhuǎn)為英文。然后完美翻譯成華夏文,再度讀出來,變成華夏語,從而傳遞給另一個人。
????反義亦然。
????整個過程要確保準確無誤,尤其是第一個過程,語音到文字,一旦出現(xiàn)錯誤,后面整個過程都會出現(xiàn)問題。
????而兩種文字的完美翻譯,當(dāng)下已經(jīng)實現(xiàn),至于最后的文字到語音的閱讀,那更不是問題。
????只是如此精準地將語音識別,這種近似“智能”的過程,王凡憑自己的力量當(dāng)然搞不定。
????即便當(dāng)下全球領(lǐng)先的巨頭,依舊局限在“模糊識別”的不精確階段。
????不過通過科技衍生系統(tǒng),一切都將與之不同。
????王凡親自挑選了一些語音識別軟件,訊飛、千度、靈犀、云之聲、googlenow、siri以及微軟cortana。
????一番比較,各有千秋。
????訊飛、千度、靈犀等,比較適合華夏,但對國際方面的處理不太給力。
????而googlenow、siri以及微軟cortana,則擅長國際,很多華夏方面的做不到位。
????一番權(quán)衡,王凡最終選擇了googlenow,這款綜合性比較優(yōu)越的語音識別軟件。
????在此基礎(chǔ)上,王凡衍生出一款新的語音識別軟件——tt智語。
????一番測試,這款語音識別軟件的強大讓王凡贊不絕口。
????不僅能智能識別華夏語、英語、俄語、法語等常用語言,還能識別俚語。
????即便王凡對著tt智語爆粗口,都能智能識別或模糊轉(zhuǎn)譯。
????之所以有些模糊轉(zhuǎn)譯,是因為很多方言或者粗口,太過“高端”,當(dāng)下還沒有具體的漢字與之對應(yīng),連我們都寫不出。
????不過很快王凡發(fā)現(xiàn)了問題,對于普通話或者近乎普通話,智能識別準確率幾乎百分百。
????但對于方言音頻的識別,有些差強人意,準確率只有百分之九十左右。
????盡管這一比例已經(jīng)很高,足夠用戶使用。但作為系統(tǒng)出品的黑科技,還是有些不夠看。
????另外,對于方言音頻的識別,會出現(xiàn)兩個版本。
????例如智能識別《咱們屯里人》時候,出現(xiàn)了兩個結(jié)果。
????一個是標(biāo)準的普通話版,一個是直接識別的版本:偶滴老嘎,就組在則個屯。偶系則個屯里,土生土長滴羊……
????而且聯(lián)網(wǎng)狀態(tài)時,普通話版本處于優(yōu)先等級。斷網(wǎng)狀態(tài),直接識別版本處于優(yōu)先等級。