不只語音轉文字，還能幫你畫重點、讓同事朋友間互動討論的 vocol.ai 跨語系協作平台 - 蘋果仁

現在有越來越多的人在使用數位科技輔助學習、工作，我也常常在 PTT 上看到許多網友在問有沒有好用的筆記軟體、工具可以處理語音轉文字的工作，因為他們可能錄下了課堂老師講的內容、工作會議討論的事項，但事後需要轉成文字檔整理到自己的筆記或是工作報告中。

最近我就發現了一款好用的語音轉文字工具 vocol.ai，辨識正確率很高，產生逐字稿的同時還可以分辨不同的講者，甚至未來的 AI 趨勢在 vocol.ai 裡面也直接整合進去了，大家最常叫 ChatGPT 做的「幫我整理這內容的重點跟翻譯」直接就在逐字稿產生以後一併生成。

另外，如果你是需要團隊合作的案子，vocol.ai 也有團隊協作功能，從頭到尾一站式就搞定。下面我會詳細的介紹 vocol.ai 要怎麼用，並且實際示範語音轉文字效果以及好用的幾個功能。

語音轉文字神器：vocol.ai 的 7 大重點

這裡先跟大家快速重點一下我覺得 vocol.ai 好用的 7 大功能，先讓大家有個概念，原來這 vocol.ai 可以做這些，然後我們再體驗它的效果。

免費試用約 200 分鐘

先跟大家說，目前 vocol.ai 有提供每個帳號大約 200 V-points 的免費試用額度，通常一分鐘的逐字稿轉換會花掉 1 到 1.5 V-points（這只是大約計算，通常不會差太多），所以 200 V-points 大概就是 200 分鐘左右。

▲你可以在個人頁面中看到剩餘可用的 V-points

所以你不用擔心說看完介紹想要用結果要付費才能用！可以先試用 200 分鐘，覺得好用、有幫助的話再繼續購買更多的 V-points。

▲ vocol.ai 還有包含企業方案在內的其他方案，後面會提到

語音轉逐字稿

直接把錄音檔、影片檔上傳到 vocol.ai 的個人平台上，vocol.ai 就會開始幫你分析影片、音樂的內容，然後產生逐字稿，整個流程大概兩、三個步驟就能搞定。

▲上傳 mp3、mp4、m4a 多種格式都可以支援

通常內容只要不是太複雜的情況下，逐字稿大約可以在 3 ~ 5 分鐘之內就產生出來，然後就可以在專案的畫面右半部「逐字稿」這一區塊看到完整的逐字稿內容。

▲上傳完畢後再等一下逐字稿就會出現，等待時間取決影片長度與複雜度

完整呈現聲音的內容

就連那種我們很不經意脫口而出的贅詞「對」、「就是」、「那個」，或是你卡詞的狀況都會很完整的節錄出來。

▲ vocol.ai 完整地把語音內容轉成逐字稿

既然是逐字稿，所以當然就是說了什麼就呈現什麼，本來就不會去幫你修飾語句，我覺得這樣是非常正常而且盡責的逐字稿。

錄音的品質會決定逐字稿生成後的結果，有時候我們可能會因為聲音素材品質不佳、講話彼此互相搭到、太過小聲….等原因，導致辨識出錯誤的內容或是用字，但也沒關係，點兩下逐字稿中想要修改的段落，就可以在跳出的選單中選擇「編輯」進行修改。

▲ 覺得有需要調整的地方也可以自行修改

辨識不同講者

vocol.ai 在辨識逐字稿的過程中也會分辨哪一句話是誰講的，然後把不同的句子對應到講話的人，所以會在逐字稿中看到「講話者 1」、「講話者 2」等字樣，讓我們可以更容易了解誰說了些什麼。

▲ 分辨講者更容易看出是誰在說話

就我目前的測試，至少到第七位講話者都還可以辨識得出來，而且每一位講者都會用不同顏色的線條表示，在內容很多的情況下比較好一眼就找到、辨別不同的說話者。

▲ 目前測試至少可以支援 7 名講者

如果還想要更容易辨識的話，直接把「講話者」改為真實的對象名稱就好了，這樣如果有剛參與專案的同事或是朋友之間就在討論事情，就不用擔心不知道是誰在說話了。

▲ 講者的名稱也可以自行調整

👉 vocol.ai 上傳檔案就能產生逐字稿+AI 畫重點：免費試用 200 V-points

多種語言辨識

vocol.ai 可以針對影片、錄音檔內不同的語音進行辨識，基本的國語、英語和日語就不說了，這幾種語言對於 vocol.ai 在處理逐字稿上幾乎是沒有什麼太大的問題。

▲ vocol.ai 辨識英語

甚至對話包含中、英文夾雜的狀況也都可以順利辨識，就像下面這樣，在逐字稿裡面就會同時顯示中文以及英文兩種不同的內容。

▲ vocol.ai 辨識中英語夾雜

另外，因為許多台灣人習慣說台語，今天如果錄音的場合是大家都習慣說台語的會議、討論上，其他的語音轉文字系統可能很難處理，vocol.ai 就沒有問題。

我也簡短的測試了一下，是真的可以辨識出來，不過要注意的是，台語的說法跟國語還是會有落差，像是下面這個「補給夠」是台語「補嘎搞」的直翻，國語可能就會講「補足」，會有這類的差別需要注意。

▲ vocol.ai 台語也能辨識

然後來試試看廣東話，這是我在網路上找到的一段香港 YouTuber 的街訪影片開頭，丟到 vocol.ai 去轉文字，沒想到竟然也可以正確辨識。

▲ vocol.ai 廣東話也能辨識

AI 生成重點

在上面的幾張截圖中你應該也有看到，vocol.ai 在生成完逐字稿以後，還會透過 AI 語言模型，把逐字稿的內容整理出重點顯示在左半邊的部分，而且如果內容完整清晰的話，可以分段，並且指出每一段的時間從什麼時候開始、什麼時候結束。

雖然在上傳檔案時可以先勾選產生 AI 分析摘要，但我有時我在上傳的時候會刻意先不開啟 AI 自動產生摘要的功能，就是下面這個開關先不打開。

我會先產出逐字稿，確認好內容再點選「執行智能分析」產出 AI 分析摘要。

這也是我覺得很棒的一點，因為我通常習慣先確認好逐字稿內容，確認沒有要修改再做 AI 重點摘要，因為如果我有針對逐字稿進行修改的話，這樣做可以確保我的摘要會跟逐字稿內容是同步的，省去我對照內容的時間。

另外，錄音的內容如果一次說了好多不同的主題，vocol.ai 也會幫你把不同的主題分門別類的抓出來，你可以從「主題」標籤頁中看到 vocol.ai 幫你整理的主題項目，點一下任何一個項目，右邊的逐字稿就會反黃，方便我們可以快速找到。

團隊協作平台

團隊協作功能是我覺得 vocol.ai 很棒的一項特色，不僅僅是你可以自己在上面完成工作，你還可以邀請同事一起參與，直接在 vocol.ai 的平台上，針對生成的內容進行討論，評論。

無論是自己還是被邀請的對象，除了可以瀏覽逐字稿內容、摘要內容以外，還可以針對有疑慮的地方，直接留下評論，然後在評論區中進行討論或是交流。

然後我看 vocol.ai 官網的方案內容說明，在未來還會加入新的 Starter 和 Pro 方案，可以使用像是重點標示、權限設定、團隊管理、使用分析….等更多專案團隊使用者專屬且工作上必須使用到的功能。

👉 vocol.ai 上傳檔案就能產生逐字稿+AI 畫重點：免費試用 200 V-points

vocol.ai 可以用在哪裡？

下面這邊我想要實際帶大家來體驗看看各種不同使用 vocol.ai 的情境，透過情境的方式，我想大家應該更可以體會 vocol.ai 語音轉文字有哪些可以發揮的地方。

課堂紀錄整理

現在很多人都會在課堂上把老師教的內容記錄下來，甚至有些筆記 App 也有提供錄音功能，但就是純錄音，也沒辦法轉成文字，後續要做筆記的時候還是要從頭開始聽，甚至你有想要聽的內容，但是你根本不知道這個內容出現在幾分幾秒，要像是瞎子摸象那樣一直在播放器中尋找。

但是利用 vocol.ai，你只需要把影片、錄音檔上傳。

如果內容很多也沒關係，上傳完以後你可以先做自己的事情，等到逐字稿生成完畢會傳送通知給你，蠻貼心的功能，不用在那癡癡的等。

但要特別注意的是，上傳單個音檔最高限制是 180 分鐘！

如果你剛好沒有帶到錄音筆、手機空間不夠、快沒電的情況下，你也可以直接透過 volco.ai 提供的錄音功能錄下要轉逐字稿的內容。

但因為這是透過內建瀏覽器來進行錄音，所以還是要注意一下瀏覽器的設定，避免因為沒有跟網頁有互動時進入休眠狀態讓錄音被迫停止，以我的經驗來說，我常用 Google Chrome，所以會習慣去「設定」→「效能」→把信任的網站加入選單中。此外，我也會同時關閉記憶體節省模式。

無論是透過 vocol.ai 直接錄音或是上傳音檔，當逐字稿產生完畢後，你就可以從逐字稿中透過搜尋的方式，快速找到你想要找的重點，之後再把所有的內容好好整理一下，會比從頭重新聽過再來整理還要有效率。

想聽哪一段的內容直接點選文字就可以直接切換過去，不用在一整段語音中盲目尋找要聽的目標內容。

這裡也要特別提一下，其實 vocol.ai 也有針對逐字稿、評論討論的關鍵字搜尋工具，不過我覺得那比較適用有好多段對話的情況，搜尋工具會引導你去有包含這個關鍵字的對話、章節或是討論串。

但是像我上面那樣，課堂上只有老師一個人批哩啪啦在講的情況，vocol.ai 的關鍵字搜尋反而沒那麼好用，因為他不會引導你去這個字實際出現的地方，而是把有提到這個字的對話整段抓出來，等於是老師整段講的話都被標出來了，那就沒有意義了，所以像這種情況還是改用瀏覽器內建的搜尋工具比較好。

還是要說一下，逐字稿真的很好用，大家一定要會善用，畢竟在資訊的世界，文字是很重要的傳播媒介啊。

會議紀錄整理

vocol.ai 也很適合拿來做會議記錄，做會後的資料整理，搭配 vocol.ai 可以分辨不同講者的特色，可以在逐字稿中很容易了解到誰說了哪些內容。

而且包含這樣一來一回的對話，甚至有時候有搶話的狀況，vocol.ai 都還是分辨得很清楚，沒有混在一起、搭在一起。

另外像這個情境，就可以使用上面提過的關鍵字搜尋工具，找出哪些對話裡面有我們想要了解的關鍵字內容。

如果可以使用 vocol.ai 的工具還是比較好，畢竟這個可以直接讓畫面只顯示我們搜尋的關鍵字對話，更容易聚焦在結果上。

另外還有一種會議記錄，可能就是大家開會的時候隨手錄下來的，這種當然也可以使用 vocol.ai 來做會後的逐字稿整理。

可是你會發現這裡面明明就很多人都有發言，但是在逐字稿中卻都只辨識成一個講者，不像上面那樣可以辨識成兩個人，還能一來一往很流暢，句子也不會搭在一起。

主要還是因為聲音品質的關係。

像這個會議記錄的影片檔案，因為大家聲音都不是非常清晰，有些講得也很模糊，所以 vocol.ai 在判斷上就會有很大難度去準確的辨識，而這個影片的情況還算好，逐字稿中有 8 成的內容都有抓到，只是沒有分辨講者罷了。

畢竟 AI 也不是萬能，素材的品質越好，能夠提供的內容就越完整，這點大家一定要記得。

用翻譯快速看懂國外採訪紀錄

剛好在這段時間，我們有機會受德國在台協會邀請做一個小訪問，主題是關於 9 月要在德國柏林舉辦的 IFA 展覽，而我們也錄下了採訪的內容，然後透過 vocol.ai 來幫我們做事後的整理。

一樣可以透過 AI 生成的重點先了解一下整段訪問的內容，然後再針對逐字稿的內容去做整理或是進一步的利用。

這邊就要提到 vocol.ai 七月剛上線的翻譯功能！

簡單來說，這功能是能夠讓你在生成逐字稿之後進行翻譯。完成逐字稿翻譯後，點擊該語系就能對照原始語系，而且就算你點選特定區段的翻譯版本逐字稿，語音也會同步，也能留下評論。

這對想要學習語言的人來說，就像是學習平台一樣方便。

除了在平台上跨語系協作，也能下載各種翻譯版本逐字稿。支援的格式有 txt 和 srt 這兩種。

逐字稿翻譯功能甚至支援 20 種以上的語系，但需要注意的是翻譯版本無法被編輯喔！

我認為這對於需要開跨國會議的人非常有幫助，例如有時候跟日本客戶開會時，他們偏好使用日文，但對於不懂日文的我們，如果需要知道內容細節，就需要口譯幫忙，但有時候口譯也會省略一些內容，這就會造成資訊落差，如果能掌握到所有細節，其實就能避免這種狀況。

👉 vocol.ai 上傳檔案就能產生逐字稿+AI 畫重點：免費試用 200 V-points

vocol.ai 也是好用的多人協作平台

上面的案例中，你可以發現我主要是以個人使用的情境在體驗 vocol.ai 的功能，談到 vocol.ai 如何幫助我們更好的處理語音的事情。

但其實 vocol.ai 不僅僅是對自己有幫助，對於團隊協作都是有幫助的，這都是借助 vocol.ai 的協作平台功能。

換個立場，今天你不是會議的參與者，但你是團隊的一員

你不一定要親自參與每一場的會議，但是你可以在會議結束以後，讓與會的同事透過 vocol.ai 平台的「分享檔案」功能把你邀請進 vocol.ai 的協作平台。

收到邀請後會有 Email 的通知，而且可以在媒體庫中清楚的辨識哪些是受他人邀請參與的專案，哪些是自己的專案。

直接在平台中留下針對內容的建議

身為受邀者雖然目前還不能編輯逐字稿的內容，但是可以針對逐字稿或是語音的段落給予意見，然後再由專案的擁有者根據大家的回饋進行修改。

可以選擇任何一段的逐字稿或是語音段落，然後留下「評論」，這樣在同一個專案底下的其他參與者，就可以看到彼此的評論內容。

其他人只要點選討論區中你所留下的評論，就會被引導到你選起來的對話或是章節，你也不用再跟大家說「請看 XX 分 XX 秒的地方」，把時間跟精力專注在真正要聚焦的內容上吧。

所以無論你是主要參與會議的人、只需要知道會議上討論了些什麼的人，或者你是一個專案管理的角色，你都可以利用 vocol.ai 協作平台的共享逐字稿（包括原始逐字稿跟多語系翻譯版本）與 AI 重點整理的功能，查看整場會議的全貌或重點、甚至給予評論。

而且上面說到的這些評論都會即時顯示，大家可以花個 10 分鐘 20 分鐘一起在線上透過 vocol.ai 來完成會議後續的確認工作。

也能直接用 vocol.ai 錄製線上會議

此外，vocol.ai 還可以化身為一個機器人加入 Google Meet 或 Microsoft Team 的視訊會議中，把會議的內容自動記錄下來，再自動丟回 vocol.ai 的平台中分析、產出逐字稿。不過要注意的是，目前使用機器人自動錄音有六十分鐘限制。

接著你只要從個人後台首頁中的「邀請 Google/Team 會議錄音機器人」選項的「加入會議」功能操作。

然後貼上會議的連結，讓 vocol.ai 可以向會議送出加入的邀請。

在會議端就會收到有 vocol.ai 機器人要加入會議的通知，允許加入以後，vocol.ai 就會開始對會議的內容進行錄音。

當會議結束後，vocol.ai 機器人就會自動把錄製的內容丟回系統，你可以在後台中看到 meeting 的檔案，這就是剛剛錄製的會議內容。

接著後面產生 AI 摘要、逐字稿的功能就跟前面介紹過的一樣。

透過這個方式，在團隊開會、遠端視訊會議時，就不用另外錄影、取得錄影檔然後再上傳，這些有的沒的工作就直接讓 vocol.ai 來處理，處理完還能直接生成會議重點摘要與逐字稿，多方便。

👉 vocol.ai 上傳檔案就能產生逐字稿+AI 畫重點：免費試用 200 V-points

vocol.ai 平台：語音轉多語系逐字稿，讓工作變得更有效率

回歸到最原始的需求，我們之所以需要一款好用的語音轉文字工具，就是因為現在很多東西都講求數位化，而數位與我們之間最重要的溝通方式就是文字了。

透過 vocol.ai 的語音轉文字功能，我們可以很方便又快速的把落落長的課堂錄音、會議記錄、採訪內容在幾分鐘內就轉成多語系文字，讓我們後續可以做更多應用。

vocol.ai 提供了 AI 摘要功能以及分享逐字稿功能，可以加快工作的流程以及協作的順暢度，利用 AI 摘要先快速了解內容後，在針對逐字稿的細項內容去修正、討論與調整。

無論你是什麼角色、什麼職位，都可以透過 vocol.ai 找到最適合你處理會議記錄、專題討論…等文字稿的工作模式。

語音轉文字＋重點整理一站式完成
提供免費 200 分鐘左右的試用時間
操作簡單，我們只要上傳檔案，其他交給 AI
支援多語系辨識，中英夾雜、台語、廣東話也可以
逐字稿翻譯功能支援 20+ 種以上的語系
完整轉錄語音內容生成語音逐字稿
逐字稿生成的同時也提供 AI 重點摘要
可分享逐字稿與協作平台給他人
能針對句子、段落、語音範圍提供評論
能加入線上會議，並且錄音後產生逐字稿
無論什麼角色、職務用起來都很適合

此外，vocol.ai 在日後還會推出更多企業方案與專業方案，可以讓 vocol.ai 的協作平台設定不同角色的操作權限、團隊管理、自己標註精華內容，或者是針對過去專案的參與情形進行活動分析，協助了解哪些是討論度最高的項目。

我想在未來，vocol.ai 應該會在團隊協作功能以及 AI 的能力上繼續強化，大家可以先申請 200 V-points 試用看看。

👉 vocol.ai 生成逐字稿+AI 畫重點：免費試用 200 V-points

＊本文章內容含合作宣傳

語音轉文字神器：vocol.ai 的 7 大重點

免費試用約 200 分鐘

語音轉逐字稿

完整呈現聲音的內容

辨識不同講者

多種語言辨識

AI 生成重點

團隊協作平台

vocol.ai 可以用在哪裡？

課堂紀錄整理

會議紀錄整理

用翻譯快速看懂國外採訪紀錄

vocol.ai 也是好用的多人協作平台

換個立場，今天你不是會議的參與者，但你是團隊的一員

直接在平台中留下針對內容的建議

也能直接用 vocol.ai 錄製線上會議

vocol.ai 平台：語音轉多語系逐字稿，讓工作變得更有效率

分享此文：