本篇介紹Google的語音輸入法。
跟懶懶打字聊天,(由於本王平日惜字如金,聊天都是刻下來的。)(咦?)突然想到去研究語音輸入法。大概是因為我平常就是全方位摸魚,不只是耳朵聽音樂,開文件兩三款內容看,手有時候是畫圖/寫字/做模型/修理東西/織布/吃東西/etc. ,感官一直都不太夠用。正發牢騷,腦子還塞滿東西,但是手指累了,突然想到之前我有玩過 App的語音翻譯。它會把讀過的中文列成文字,再列另外一條英文翻譯。我以前也拿他來電練習英語發音。現在想想拿它來省打字,好像也不賴。
後來順著查詢找到了「語音輸入」這個詞,才注意到Google早就偷裝在手機裡了.......
打開手機換輸入法會有一個Google voice typing(我的手機是英文語系,拿到店裡比較好修,)選語音輸入就可以開始錄音,關掉輸入就可以回到原來的輸入法。
下半格右上角的「x」就是關掉語音輸入。別傻了,那些顏文字都是從網路存下來的。我連打字都打不出來了,別以為我用語音可以講得出來......。
我在 App store 上找到的語音輸入大部分是英文。Google的中文輸入算是找到過最好的。而且,反正它都早就裝在你的手機裡了。乾脆要拿來用用吧。
用法應該不太需要介紹,只要你會講話就沒問題。語音辨識若出錯,再用一般輸入法打字改正就可以了。
接下來聊聊使用語音輸的週邊效應。語音輸入需要網路連線。程式會把你的音頻上傳到雲端辨識,在回傳文字到你的手機。基本上他是雲端操作;沒有網路就沒得玩。我也試用過其他公司的語音辨識,語音在雲端辨識的速度就真的比Google慢很多。
語音辨識吃掉的流量應該沒有看影片大,但是顯然比打字大多了。
如果你的網路快,辨識的速度就快。
如果你的環境安靜,辨識得詭快。
如果你的環境很吵,程式必須削減環境音,判斷句子停頓點就很困難。
如果你的句子簡短,用詞常見,辨識起來的準確度會很高。
如果你平 講的是複雜、又長、用詞又少見的句子,準確度就會低很多。
說起來 Google 語音辨識應該慢慢能跟 Mac Siri 競爭。也許 Google繼上次語音機器人被惡搞後,乾脆用 Google 翻譯及語音辨識來研究語言學。同樣是使用者需要用的工具,處心機慮要把它搞倒的人就少。應該是能很快追上Siri的方法。
我以前想過用語音紀錄靈感。以前我打字更慢,而且廢話多的時候常常是在旅行途中,沒辦法打字。我曾試過用MP3播放器記錄語音,悲劇的是,我沒有時間聽......。我覺得影片音頻太花時間了,這才是我很少看電視的原因 。語音輸入把語音轉成文字,省了很多拼字的時間;但是閱讀起來夠快。真是個好發明!
我認為講話輸入法可以讓科技更普及。科技人得承認,就是做得不夠方便,才讓人敬而遠之。要不然,手遊普及速度是蠻快的。遊戲很注重玩家的適應能力。科技該是用來幫助人類,而不是造成人類的麻煩。「科技來自於人性」是我們這些科技人的夢想。(雖然我快不太能說自己是科技人啊.....。我還是很喜歡軟體這個領域。)
Google的語言研究在Google Translate其實已經做得不錯了。如果仔細觀察Google語音輸入的辨識方法,你會發現它跟英文辨識差不多,英文他也是從一整句判斷音節。也就是你說了一串之後,程式再把句子打斷成好幾個詞。
後來想想,也許外國人的技術分析還是比較實際。例如中文輸入法,台灣的設計還是傾向輸入法選字。例如倉頡,速成,無蝦米等。以我擅長的輸入法來說,我用大易輸入法是因為幾乎不選字。不用注音輸入法是因為同音字太多,每個字都要選很容易打斷思緒,不小心就忘了原本要寫什麼。微軟在某一年替換上新注音輸入法,這種輸入法容許使用者輸入一整串,系統再幫忙判斷每一個詞。這類似英文的自動校正,也大大減少了選字的時間。
中文改成簡體之後,其實就很像英文的用法。繁體中文字可以從很簡短的幾個字依據字形有很多同音的可能性,卻表達不同的意涵。這種情況下,輸入法一定要一個字一個字選,以字型為主的輸入法有很大優勢。自動辨識率一定低到不行。自從簡體話之後,常常需要讀完一整個句子,才能理解被簡化過的字到底屬於哪一個詞。也就是,簡化後的中文其實也是走向拼音文字。拼音文字最大的危險就是語言分裂。簡體化對中國來說的統治是好是壞還很難說。不過簡化圖型就必然會拉長組合。這對科技化來說比較容易。
凡事有好有壞。現在可以少寫字,我覺得是上天垂憐,哈哈~。(<--徹底的懶人)(我是記憶力很短的人。如果不是科技,我不太可能是作家吧。也當不了程式設計師....... 去要飯?)(os: .....應該有很多像金魚的工作能做吧。)
電腦的話,你可以在 Google Doc 使用語音輸入。開好麥克風錄音功能後,功能列:工具》語音輸入法...
可以在畫面上開出一個浮動麥克風標示。可以選語系,點選圖示開始或結束錄音。你說一小段或幾個字,停頓一下,它就會把辨識結果列出來。如果你講一長串沒有停....... 應該就不會有什麼東西出來.....。反正雲端也不懂,就不用傳垃圾了。我這裡網路蠻差,有時短句子也傳不出去。
跟懶懶打字聊天,(由於本王平日惜字如金,聊天都是刻下來的。)(咦?)突然想到去研究語音輸入法。大概是因為我平常就是全方位摸魚,不只是耳朵聽音樂,開文件兩三款內容看,手有時候是畫圖/寫字/做模型/修理東西/織布/吃東西/etc. ,感官一直都不太夠用。正發牢騷,腦子還塞滿東西,但是手指累了,突然想到之前我有玩過 App的語音翻譯。它會把讀過的中文列成文字,再列另外一條英文翻譯。我以前也拿他來電練習英語發音。現在想想拿它來省打字,好像也不賴。
後來順著查詢找到了「語音輸入」這個詞,才注意到Google早就偷裝在手機裡了.......
下半格右上角的「x」就是關掉語音輸入。別傻了,那些顏文字都是從網路存下來的。我連打字都打不出來了,別以為我用語音可以講得出來......。
我在 App store 上找到的語音輸入大部分是英文。Google的中文輸入算是找到過最好的。而且,反正它都早就裝在你的手機裡了。乾脆要拿來用用吧。
用法應該不太需要介紹,只要你會講話就沒問題。語音辨識若出錯,再用一般輸入法打字改正就可以了。
接下來聊聊使用語音輸的週邊效應。語音輸入需要網路連線。程式會把你的音頻上傳到雲端辨識,在回傳文字到你的手機。基本上他是雲端操作;沒有網路就沒得玩。我也試用過其他公司的語音辨識,語音在雲端辨識的速度就真的比Google慢很多。
語音辨識吃掉的流量應該沒有看影片大,但是顯然比打字大多了。
如果你的網路快,辨識的速度就快。
如果你的環境安靜,辨識得詭快。
如果你的環境很吵,程式必須削減環境音,判斷句子停頓點就很困難。
如果你的句子簡短,用詞常見,辨識起來的準確度會很高。
如果你平 講的是複雜、又長、用詞又少見的句子,準確度就會低很多。
說起來 Google 語音辨識應該慢慢能跟 Mac Siri 競爭。也許 Google繼上次語音機器人被惡搞後,乾脆用 Google 翻譯及語音辨識來研究語言學。同樣是使用者需要用的工具,處心機慮要把它搞倒的人就少。應該是能很快追上Siri的方法。
我以前想過用語音紀錄靈感。以前我打字更慢,而且廢話多的時候常常是在旅行途中,沒辦法打字。我曾試過用MP3播放器記錄語音,悲劇的是,我沒有時間聽......。我覺得影片音頻太花時間了,這才是我很少看電視的原因 。語音輸入把語音轉成文字,省了很多拼字的時間;但是閱讀起來夠快。真是個好發明!
我認為講話輸入法可以讓科技更普及。科技人得承認,就是做得不夠方便,才讓人敬而遠之。要不然,手遊普及速度是蠻快的。遊戲很注重玩家的適應能力。科技該是用來幫助人類,而不是造成人類的麻煩。「科技來自於人性」是我們這些科技人的夢想。(雖然我快不太能說自己是科技人啊.....。我還是很喜歡軟體這個領域。)
後來想想,也許外國人的技術分析還是比較實際。例如中文輸入法,台灣的設計還是傾向輸入法選字。例如倉頡,速成,無蝦米等。以我擅長的輸入法來說,我用大易輸入法是因為幾乎不選字。不用注音輸入法是因為同音字太多,每個字都要選很容易打斷思緒,不小心就忘了原本要寫什麼。微軟在某一年替換上新注音輸入法,這種輸入法容許使用者輸入一整串,系統再幫忙判斷每一個詞。這類似英文的自動校正,也大大減少了選字的時間。
中文改成簡體之後,其實就很像英文的用法。繁體中文字可以從很簡短的幾個字依據字形有很多同音的可能性,卻表達不同的意涵。這種情況下,輸入法一定要一個字一個字選,以字型為主的輸入法有很大優勢。自動辨識率一定低到不行。自從簡體話之後,常常需要讀完一整個句子,才能理解被簡化過的字到底屬於哪一個詞。也就是,簡化後的中文其實也是走向拼音文字。拼音文字最大的危險就是語言分裂。簡體化對中國來說的統治是好是壞還很難說。不過簡化圖型就必然會拉長組合。這對科技化來說比較容易。
凡事有好有壞。現在可以少寫字,我覺得是上天垂憐,哈哈~。(<--徹底的懶人)(我是記憶力很短的人。如果不是科技,我不太可能是作家吧。也當不了程式設計師....... 去要飯?)(os: .....應該有很多像金魚的工作能做吧。)
電腦的話,你可以在 Google Doc 使用語音輸入。開好麥克風錄音功能後,功能列:工具》語音輸入法...
可以在畫面上開出一個浮動麥克風標示。可以選語系,點選圖示開始或結束錄音。你說一小段或幾個字,停頓一下,它就會把辨識結果列出來。如果你講一長串沒有停....... 應該就不會有什麼東西出來.....。反正雲端也不懂,就不用傳垃圾了。我這裡網路蠻差,有時短句子也傳不出去。
Comments
Post a Comment