不只語音轉文字,還能幫你畫重點、讓同事朋友間互動討論的 vocol.ai 跨語系協作平台

vocol.ai 語音轉文字

現在有越來越多的人在使用數位科技輔助學習、工作,我也常常在 PTT 上看到許多網友在問有沒有好用的筆記軟體、工具可以處理語音轉文字的工作,因為他們可能錄下了課堂老師講的內容、工作會議討論的事項,但事後需要轉成文字檔整理到自己的筆記或是工作報告中。

最近我就發現了一款好用的語音轉文字工具 vocol.ai,辨識正確率很高,產生逐字稿的同時還可以分辨不同的講者,甚至未來的 AI 趨勢在 vocol.ai 裡面也直接整合進去了,大家最常叫 ChatGPT 做的「幫我整理這內容的重點跟翻譯」直接就在逐字稿產生以後一併生成。

另外,如果你是需要團隊合作的案子,vocol.ai 也有團隊協作功能,從頭到尾一站式就搞定。下面我會詳細的介紹 vocol.ai 要怎麼用,並且實際示範語音轉文字效果以及好用的幾個功能。

語音轉文字神器:vocol.ai 的 7 大重點

這裡先跟大家快速重點一下我覺得 vocol.ai 好用的 7 大功能,先讓大家有個概念,原來這 vocol.ai 可以做這些,然後我們再體驗它的效果。

免費試用約 200 分鐘

先跟大家說,目前 vocol.ai 有提供每個帳號大約 200 V-points 的免費試用額度,通常一分鐘的逐字稿轉換會花掉 1 到 1.5 V-points(這只是大約計算,通常不會差太多),所以 200 V-points 大概就是 200 分鐘左右。

vocol.ai 語音轉文字

vocol.ai 語音轉文字

▲你可以在個人頁面中看到剩餘可用的 V-points

所以你不用擔心說看完介紹想要用結果要付費才能用!可以先試用 200 分鐘,覺得好用、有幫助的話再繼續購買更多的 V-points。

vocol.ai 語音轉文字

▲ vocol.ai 還有包含企業方案在內的其他方案,後面會提到

語音轉逐字稿

直接把錄音檔、影片檔上傳到 vocol.ai 的個人平台上,vocol.ai 就會開始幫你分析影片、音樂的內容,然後產生逐字稿,整個流程大概兩、三個步驟就能搞定。

vocol.ai 語音轉文字

▲上傳 mp3、mp4、m4a 多種格式都可以支援

通常內容只要不是太複雜的情況下,逐字稿大約可以在 3 ~ 5 分鐘之內就產生出來,然後就可以在專案的畫面右半部「逐字稿」這一區塊看到完整的逐字稿內容。

vocol.ai 語音轉文字

▲上傳完畢後再等一下逐字稿就會出現,等待時間取決影片長度與複雜度

完整呈現聲音的內容

就連那種我們很不經意脫口而出的贅詞「對」、「就是」、「那個」,或是你卡詞的狀況都會很完整的節錄出來。

vocol.ai 語音轉文字

▲ vocol.ai 完整地把語音內容轉成逐字稿

既然是逐字稿,所以當然就是說了什麼就呈現什麼,本來就不會去幫你修飾語句,我覺得這樣是非常正常而且盡責的逐字稿。

錄音的品質會決定逐字稿生成後的結果,有時候我們可能會因為聲音素材品質不佳、講話彼此互相搭到、太過小聲….等原因,導致辨識出錯誤的內容或是用字,但也沒關係,點兩下逐字稿中想要修改的段落,就可以在跳出的選單中選擇「編輯」進行修改。

vocol.ai 語音轉文字 vocol.ai 語音轉文字

▲ 覺得有需要調整的地方也可以自行修改

辨識不同講者

vocol.ai 在辨識逐字稿的過程中也會分辨哪一句話是誰講的,然後把不同的句子對應到講話的人,所以會在逐字稿中看到「講話者 1」、「講話者 2」等字樣,讓我們可以更容易了解誰說了些什麼。

vocol.ai 語音轉文字

▲ 分辨講者更容易看出是誰在說話

就我目前的測試,至少到第七位講話者都還可以辨識得出來,而且每一位講者都會用不同顏色的線條表示,在內容很多的情況下比較好一眼就找到、辨別不同的說話者。

vocol.ai 語音轉文字

▲ 目前測試至少可以支援 7 名講者

如果還想要更容易辨識的話,直接把「講話者」改為真實的對象名稱就好了,這樣如果有剛參與專案的同事或是朋友之間就在討論事情,就不用擔心不知道是誰在說話了。

vocol.ai 語音轉文字

▲ 講者的名稱也可以自行調整

👉 vocol.ai 上傳檔案就能產生逐字稿+AI 畫重點:免費試用 200 V-points

多種語言辨識

vocol.ai 可以針對影片、錄音檔內不同的語音進行辨識,基本的國語、英語和日語就不說了,這幾種語言對於 vocol.ai 在處理逐字稿上幾乎是沒有什麼太大的問題。

vocol.ai 語音轉文字

▲ vocol.ai 辨識英語

甚至對話包含中、英文夾雜的狀況也都可以順利辨識,就像下面這樣,在逐字稿裡面就會同時顯示中文以及英文兩種不同的內容。

vocol.ai 語音轉文字

▲ vocol.ai 辨識中英語夾雜

另外,因為許多台灣人習慣說台語,今天如果錄音的場合是大家都習慣說台語的會議、討論上,其他的語音轉文字系統可能很難處理,vocol.ai 就沒有問題。

我也簡短的測試了一下,是真的可以辨識出來,不過要注意的是,台語的說法跟國語還是會有落差,像是下面這個「補給夠」是台語「補嘎搞」的直翻,國語可能就會講「補足」,會有這類的差別需要注意。

vocol.ai 語音轉文字

▲ vocol.ai 台語也能辨識

然後來試試看廣東話,這是我在網路上找到的一段香港 YouTuber 的街訪影片開頭,丟到 vocol.ai 去轉文字,沒想到竟然也可以正確辨識。

vocol.ai 語音轉文字

▲ vocol.ai 廣東話也能辨識

AI 生成重點

在上面的幾張截圖中你應該也有看到,vocol.ai 在生成完逐字稿以後,還會透過 AI 語言模型,把逐字稿的內容整理出重點顯示在左半邊的部分,而且如果內容完整清晰的話,可以分段,並且指出每一段的時間從什麼時候開始、什麼時候結束。

vocol.ai 語音轉文字

雖然在上傳檔案時可以先勾選產生 AI 分析摘要,但我有時我在上傳的時候會刻意先不開啟 AI 自動產生摘要的功能,就是下面這個開關先不打開。

vocol.ai 語音轉文字

我會先產出逐字稿,確認好內容再點選「執行智能分析」產出 AI 分析摘要。

這也是我覺得很棒的一點,因為我通常習慣先確認好逐字稿內容,確認沒有要修改再做 AI 重點摘要,因為如果我有針對逐字稿進行修改的話,這樣做可以確保我的摘要會跟逐字稿內容是同步的,省去我對照內容的時間。

vocol.ai 語音轉文字

另外,錄音的內容如果一次說了好多不同的主題,vocol.ai 也會幫你把不同的主題分門別類的抓出來,你可以從「主題」標籤頁中看到 vocol.ai 幫你整理的主題項目,點一下任何一個項目,右邊的逐字稿就會反黃,方便我們可以快速找到。

vocol.ai 語音轉文字

團隊協作平台

團隊協作功能是我覺得 vocol.ai 很棒的一項特色,不僅僅是你可以自己在上面完成工作,你還可以邀請同事一起參與,直接在 vocol.ai 的平台上,針對生成的內容進行討論,評論。

無論是自己還是被邀請的對象,除了可以瀏覽逐字稿內容、摘要內容以外,還可以針對有疑慮的地方,直接留下評論,然後在評論區中進行討論或是交流。

vocol.ai 語音轉文字

vocol.ai 語音轉文字

然後我看 vocol.ai 官網的方案內容說明,在未來還會加入新的 Starter 和 Pro 方案,可以使用像是重點標示、權限設定、團隊管理、使用分析….等更多專案團隊使用者專屬且工作上必須使用到的功能。

👉 vocol.ai 上傳檔案就能產生逐字稿+AI 畫重點:免費試用 200 V-points

vocol.ai 可以用在哪裡?

下面這邊我想要實際帶大家來體驗看看各種不同使用 vocol.ai 的情境,透過情境的方式,我想大家應該更可以體會 vocol.ai 語音轉文字有哪些可以發揮的地方。

課堂紀錄整理

現在很多人都會在課堂上把老師教的內容記錄下來,甚至有些筆記 App 也有提供錄音功能,但就是純錄音,也沒辦法轉成文字,後續要做筆記的時候還是要從頭開始聽,甚至你有想要聽的內容,但是你根本不知道這個內容出現在幾分幾秒,要像是瞎子摸象那樣一直在播放器中尋找。

但是利用 vocol.ai,你只需要把影片、錄音檔上傳。

vocol.ai 語音轉文字

如果內容很多也沒關係,上傳完以後你可以先做自己的事情,等到逐字稿生成完畢會傳送通知給你,蠻貼心的功能,不用在那癡癡的等。

但要特別注意的是,上傳單個音檔最高限制是 180 分鐘!

vocol.ai 語音轉文字

如果你剛好沒有帶到錄音筆、手機空間不夠、快沒電的情況下,你也可以直接透過 volco.ai 提供的錄音功能錄下要轉逐字稿的內容。

vocol.ai 語音轉文字

但因為這是透過內建瀏覽器來進行錄音,所以還是要注意一下瀏覽器的設定,避免因為沒有跟網頁有互動時進入休眠狀態讓錄音被迫停止,以我的經驗來說,我常用 Google Chrome,所以會習慣去「設定」→「效能」→把信任的網站加入選單中。此外,我也會同時關閉記憶體節省模式。

vocol.ai 語音轉文字

無論是透過 vocol.ai 直接錄音或是上傳音檔,當逐字稿產生完畢後,你就可以從逐字稿中透過搜尋的方式,快速找到你想要找的重點,之後再把所有的內容好好整理一下,會比從頭重新聽過再來整理還要有效率。

vocol.ai 語音轉文字

想聽哪一段的內容直接點選文字就可以直接切換過去,不用在一整段語音中盲目尋找要聽的目標內容。

這裡也要特別提一下,其實 vocol.ai 也有針對逐字稿、評論討論的關鍵字搜尋工具,不過我覺得那比較適用有好多段對話的情況,搜尋工具會引導你去有包含這個關鍵字的對話、章節或是討論串。

但是像我上面那樣,課堂上只有老師一個人批哩啪啦在講的情況,vocol.ai 的關鍵字搜尋反而沒那麼好用,因為他不會引導你去這個字實際出現的地方,而是把有提到這個字的對話整段抓出來,等於是老師整段講的話都被標出來了,那就沒有意義了,所以像這種情況還是改用瀏覽器內建的搜尋工具比較好。

還是要說一下,逐字稿真的很好用,大家一定要會善用,畢竟在資訊的世界,文字是很重要的傳播媒介啊。

會議紀錄整理

vocol.ai 也很適合拿來做會議記錄,做會後的資料整理,搭配 vocol.ai 可以分辨不同講者的特色,可以在逐字稿中很容易了解到誰說了哪些內容。

vocol.ai 語音轉文字

而且包含這樣一來一回的對話,甚至有時候有搶話的狀況,vocol.ai 都還是分辨得很清楚,沒有混在一起、搭在一起。

另外像這個情境,就可以使用上面提過的關鍵字搜尋工具,找出哪些對話裡面有我們想要了解的關鍵字內容。

vocol.ai 語音轉文字

如果可以使用 vocol.ai 的工具還是比較好,畢竟這個可以直接讓畫面只顯示我們搜尋的關鍵字對話,更容易聚焦在結果上。

vocol.ai 語音轉文字

另外還有一種會議記錄,可能就是大家開會的時候隨手錄下來的,這種當然也可以使用 vocol.ai 來做會後的逐字稿整理。

可是你會發現這裡面明明就很多人都有發言,但是在逐字稿中卻都只辨識成一個講者,不像上面那樣可以辨識成兩個人,還能一來一往很流暢,句子也不會搭在一起。

主要還是因為聲音品質的關係。

像這個會議記錄的影片檔案,因為大家聲音都不是非常清晰,有些講得也很模糊,所以 vocol.ai 在判斷上就會有很大難度去準確的辨識,而這個影片的情況還算好,逐字稿中有 8 成的內容都有抓到,只是沒有分辨講者罷了。

畢竟 AI 也不是萬能,素材的品質越好,能夠提供的內容就越完整,這點大家一定要記得。

用翻譯快速看懂國外採訪紀錄

剛好在這段時間,我們有機會受德國在台協會邀請做一個小訪問,主題是關於 9 月要在德國柏林舉辦的 IFA 展覽,而我們也錄下了採訪的內容,然後透過 vocol.ai 來幫我們做事後的整理。

一樣可以透過 AI 生成的重點先了解一下整段訪問的內容,然後再針對逐字稿的內容去做整理或是進一步的利用。

這邊就要提到 vocol.ai 七月剛上線的翻譯功能!

簡單來說,這功能是能夠讓你在生成逐字稿之後進行翻譯。完成逐字稿翻譯後,點擊該語系就能對照原始語系,而且就算你點選特定區段的翻譯版本逐字稿,語音也會同步,也能留下評論。

vocol.ai 語音轉文字

這對想要學習語言的人來說,就像是學習平台一樣方便。

除了在平台上跨語系協作,也能下載各種翻譯版本逐字稿。支援的格式有 txt 和 srt 這兩種。

逐字稿翻譯功能甚至支援 20 種以上的語系,但需要注意的是翻譯版本無法被編輯喔!

vocol.ai 語音轉文字

我認為這對於需要開跨國會議的人非常有幫助,例如有時候跟日本客戶開會時,他們偏好使用日文,但對於不懂日文的我們,如果需要知道內容細節,就需要口譯幫忙,但有時候口譯也會省略一些內容,這就會造成資訊落差,如果能掌握到所有細節,其實就能避免這種狀況。

👉 vocol.ai 上傳檔案就能產生逐字稿+AI 畫重點:免費試用 200 V-points

vocol.ai 也是好用的多人協作平台

上面的案例中,你可以發現我主要是以個人使用的情境在體驗 vocol.ai 的功能,談到 vocol.ai 如何幫助我們更好的處理語音的事情。

但其實 vocol.ai 不僅僅是對自己有幫助,對於團隊協作都是有幫助的,這都是借助 vocol.ai 的協作平台功能。

換個立場,今天你不是會議的參與者,但你是團隊的一員

你不一定要親自參與每一場的會議,但是你可以在會議結束以後,讓與會的同事透過 vocol.ai 平台的「分享檔案」功能把你邀請進 vocol.ai 的協作平台。

vocol.ai 語音轉文字

收到邀請後會有 Email 的通知,而且可以在媒體庫中清楚的辨識哪些是受他人邀請參與的專案,哪些是自己的專案。

vocol.ai 語音轉文字

直接在平台中留下針對內容的建議

身為受邀者雖然目前還不能編輯逐字稿的內容,但是可以針對逐字稿或是語音的段落給予意見,然後再由專案的擁有者根據大家的回饋進行修改。

可以選擇任何一段的逐字稿或是語音段落,然後留下「評論」,這樣在同一個專案底下的其他參與者,就可以看到彼此的評論內容。

vocol.ai 語音轉文字

vocol.ai 語音轉文字

其他人只要點選討論區中你所留下的評論,就會被引導到你選起來的對話或是章節,你也不用再跟大家說「請看 XX 分 XX 秒的地方」,把時間跟精力專注在真正要聚焦的內容上吧。

vocol.ai 語音轉文字

所以無論你是主要參與會議的人、只需要知道會議上討論了些什麼的人,或者你是一個專案管理的角色,你都可以利用 vocol.ai 協作平台的共享逐字稿(包括原始逐字稿跟多語系翻譯版本)與 AI 重點整理的功能,查看整場會議的全貌或重點、甚至給予評論。

而且上面說到的這些評論都會即時顯示,大家可以花個 10 分鐘 20 分鐘一起在線上透過 vocol.ai 來完成會議後續的確認工作。

也能直接用 vocol.ai 錄製線上會議

此外,vocol.ai 還可以化身為一個機器人加入 Google Meet 或 Microsoft Team 的視訊會議中,把會議的內容自動記錄下來,再自動丟回 vocol.ai 的平台中分析、產出逐字稿。不過要注意的是,目前使用機器人自動錄音有六十分鐘限制。

接著你只要從個人後台首頁中的「邀請 Google/Team 會議錄音機器人」選項的「加入會議」功能操作。

vocol.ai 語音轉文字

然後貼上會議的連結,讓 vocol.ai 可以向會議送出加入的邀請。

vocol.ai 語音轉文字

在會議端就會收到有 vocol.ai 機器人要加入會議的通知,允許加入以後,vocol.ai 就會開始對會議的內容進行錄音。

vocol.ai 語音轉文字

當會議結束後,vocol.ai 機器人就會自動把錄製的內容丟回系統,你可以在後台中看到 meeting 的檔案,這就是剛剛錄製的會議內容。

vocol.ai 語音轉文字

接著後面產生 AI 摘要、逐字稿的功能就跟前面介紹過的一樣。

透過這個方式,在團隊開會、遠端視訊會議時,就不用另外錄影、取得錄影檔然後再上傳,這些有的沒的工作就直接讓 vocol.ai 來處理,處理完還能直接生成會議重點摘要與逐字稿,多方便。

👉 vocol.ai 上傳檔案就能產生逐字稿+AI 畫重點:免費試用 200 V-points

vocol.ai 平台:語音轉多語系逐字稿,讓工作變得更有效率

回歸到最原始的需求,我們之所以需要一款好用的語音轉文字工具,就是因為現在很多東西都講求數位化,而數位與我們之間最重要的溝通方式就是文字了。

透過 vocol.ai 的語音轉文字功能,我們可以很方便又快速的把落落長的課堂錄音、會議記錄、採訪內容在幾分鐘內就轉成多語系文字,讓我們後續可以做更多應用。

vocol.ai 提供了 AI 摘要功能以及分享逐字稿功能,可以加快工作的流程以及協作的順暢度,利用 AI 摘要先快速了解內容後,在針對逐字稿的細項內容去修正、討論與調整。

無論你是什麼角色、什麼職位,都可以透過 vocol.ai 找到最適合你處理會議記錄、專題討論…等文字稿的工作模式。

  • 語音轉文字+重點整理一站式完成
  • 提供免費 200 分鐘左右的試用時間
  • 操作簡單,我們只要上傳檔案,其他交給 AI
  • 支援多語系辨識,中英夾雜、台語、廣東話也可以
  • 逐字稿翻譯功能支援 20+ 種以上的語系
  • 完整轉錄語音內容生成語音逐字稿
  • 逐字稿生成的同時也提供 AI 重點摘要
  • 可分享逐字稿與協作平台給他人
  • 能針對句子、段落、語音範圍提供評論
  • 能加入線上會議,並且錄音後產生逐字稿
  • 無論什麼角色、職務用起來都很適合

此外,vocol.ai 在日後還會推出更多企業方案與專業方案,可以讓 vocol.ai 的協作平台設定不同角色的操作權限、團隊管理、自己標註精華內容,或者是針對過去專案的參與情形進行活動分析,協助了解哪些是討論度最高的項目。

我想在未來,vocol.ai 應該會在團隊協作功能以及 AI 的能力上繼續強化,大家可以先申請 200 V-points 試用看看。

👉 vocol.ai 生成逐字稿+AI 畫重點:免費試用 200 V-points

*本文章內容含合作宣傳