【科技M頭條精華摘要】#18 微軟買下 Nuance、NVidia 殺進 CPU 市場、SpaceX 要登陸月球!
美國時間4月12日,微軟宣布已經與 Nuance 達成協議,以 197 億美元溢價收購,是微軟史上第二大收購案,僅次於 Linkedin 的262億美元。未來 Nuance 會歸屬於微軟智能雲的事業單位。
• Nuance 做的是語音辨識的 AI 解決方案,最出名的產品當然就是蘋果 Siri 背後的語音辨識引擎 Dragon,它具有深度學習功能,所以辨識率可以一直提升 。它把語音轉換成文字的正確率目前是業界最強。現在很多企業與機構事務都很需要語音轉換文字的功能,例如會議記錄、上課與演說、醫療現場,所以現在主要做企業生意的微軟併購 Nuance十分合理,以後可以在 Team 軟體或其他企業軟體中加入相關功能。
• 這樁併購對微軟更直接的效果是取得醫療市場。Nuance 近期的市場轉向特定領域,尤其是醫療方面,而且在這方面從 2019 年就開始跟微軟合作。一般的語音辨識可能不太能準確辨識醫療方面的內容,而 Nuance 的 Dragon Medical One 產品特別強化對醫療術語的辨識,將醫師跟病人交談紀錄在病歷上,已經獲得全球超過50萬醫師跟77%的美國醫院採用。
「微軟文字轉語音」的推薦目錄:
- 關於微軟文字轉語音 在 Facebook 的精選貼文
- 關於微軟文字轉語音 在 Microsoft Taiwan Facebook 的最讚貼文
- 關於微軟文字轉語音 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文
- 關於微軟文字轉語音 在 Re: [討論] 上字幕的流程問題- 看板youtuber 的評價
- 關於微軟文字轉語音 在 Re: [討論] 上字幕的流程問題- 看板youtuber 的評價
- 關於微軟文字轉語音 在 微软云Text to speech文字转语音体验,英语配音So easy! 的評價
- 關於微軟文字轉語音 在 Bing Speech API 實作文字轉語音 - 買菜的保肝膠囊 的評價
- 關於微軟文字轉語音 在 iThome - 微軟發表一款文字轉語音AI,只用共20分鐘長的200個 ... 的評價
微軟文字轉語音 在 Microsoft Taiwan Facebook 的最讚貼文
當身心障礙者面臨不平等的環境,想學習、就業與維持生活品質可說是難關重重😓
因此,微軟舉行「愛無國界 科技無礙」活動,運用雲端與人工智慧等技術,攜手台灣三間致力幫助身心障礙族群的機構,一起為身心障礙者打造人生新樣貌🥰
📍#伊甸基金會 視障重建中心代主任周玉玲,視神經萎縮等自身生命經驗讓她更貼近與幫助視障者的內心世界和生活需求
📍患有多發性硬化症的 #無礙玩家生活關懷協會 理事長賴志銘,幫助身障者透過網路銷售落實自立生活
📍不畏急性青光眼阻礙的甘仲維博士,成立 #社團法人台灣視覺希望協會,幫助中途失明者重建生活
Microsoft 365 也針對不同需求的身心障礙對象提供多元輔助功能✨
如 PowerPoint 及 Microsoft Stream 能為聽障者提供即時字幕,Word、PowerPoint 及 Excel 為視障者提供 AI 圖片轉文字的功能
Windows 10 則分別為視障者、肢障者、聽障者提供自動念出網頁內容、眼球控制及語音輸入/控制、雙聲道播放等功能
其他包含 Microsoft Edge、Microsoft Teams、Microsoft Forms 及 Outlook 亦提供多元友善的功能
微軟始終致力於利用科技賦能身心障礙者提升科技強度、重建就業能力,進而融入社會
未來也持續將此理念融入產品開發應用,並攜手全球相關機構,將台灣無障礙文化的影響力向外發散💗
看完整報導 👇
https://aka.ms/MSTW_032901
看更多「有愛無礙」的友善科技及無障礙故事👇
https://aka.ms/MSTW_032902
科技有愛,生活無礙,看更多微軟為身心障礙者開發的暖心工具👇
https://aka.ms/MSTW_032903
#Microsoft #Accessibility #Microsoft365 #Azure
#MicrosoftStream #Windows10 #MicrosoftEdge #MicrosoftTeams #MicrosoftForms
微軟文字轉語音 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文
用 AI「復活」已故親人,微軟最新專利獲批准
作者 雷鋒網 | 發布日期 2021 年 01 月 28 日 8:30 |
2020 是足以讓人銘記的一年,因為帶走太多珍貴生命。1 月 27 日截至上午 8 時,新冠肺炎全球確診人數突破 1 億,死亡人數超過 214 萬人。
逝去的生命無法挽回,但科技是否能幫助失去親人的人們彌補遺憾?近日微軟通過名為 AI 聊天機器人的專利申請。根據專利描述,AI 聊天機器人可模仿逝者與親人即時互動和聊天。
重現《黑鏡》,與過世親人對話
英劇《黑鏡》「Be right back」這集,女主角瑪莎的新婚丈夫艾許死於車禍,巨大的悲痛之下,她登錄朋友推薦的某網站,開始與網路虛擬丈夫對話。
她沒想到的是,網路艾許的說話口氣、聊天習慣都和真的艾許非常接近。後來他們開始語音通話,再後來瑪莎甚至照著虛擬艾許的指導,把丈夫組成實體機器人。
這種科幻劇情或許不久的將來就會成為現實。
微軟專利目的便是創造艾許版 AI 聊天機器人,能透過語音和文字與人類對話。
2017 年微軟正式申請專利,並於近日通過,專利主要發明人是達斯汀·艾布拉姆森(Dustin Abramson)和小約瑟夫·約翰遜(Joseph Johnson Jr.) 。
據他們介紹,AI 聊天機器人透過個人圖像、語音數據、社群媒體發文、電子資訊及其他類型的資訊大數據分析,盡可能模仿亡者生前性格、特點及語氣。某些情況下,甚至可使用圖像和影像創建人物 3D 模型增加互動真實感。
據專利描述,用戶可使用手機、電腦或 Alexa、Siri 等語音助理與過世親人聊天或表達關心。機器人的回應取決於輸入的數據。
如果交談時,用戶的問題沒有可回答的依據,AI 系統可基於「人群感知」和「心理數據」給予邏輯上可能的回答。
AI 背後,還需注意倫理風險
將過世者轉為數位化的想法並不新鮮。如邁克·傑克森去世 5 年後,透過全像投影還原技術,出現 2014 年告示牌音樂頒獎典禮,並表演新單曲《Slave to The Rhythm》。
同樣地已故音樂巨星惠妮·休士頓(Whitney Houston)也將透過全像投影技術在今年舉辦歐洲巡迴演唱會。
另外,美國明星詹姆斯·迪恩(James Dean)去世整整 64 年,近日也透過 AI 特效完成電影《尋找傑克》的拍攝。
相比之下,微軟的專利有些不同,是首次以「社群媒體數據」創建過世者的 AI 機器人。
照微軟專利說明,AI 聊天機器人不僅能模仿過世者,只要有足夠文字、語音和圖像,還能模仿朋友、明星、虛構人物、歷史人物,或任何實體人類。
但這必然會造成道德和法律問題。
如沒有明確許可,過世者的數位隱私權要怎麼保護?如何界定個人數據和圖像的使用權限?如何確保合法使用,是否會像 Deepfake,出現假冒現實人物的詐騙或造假事件?
不過技術專利距離實現還有一段距離。
面對種種倫理問題,微軟 AI 程式負責人 Tim O’Brien 也表示,目前還沒有任何明確計畫可將演算法付諸實行。
資料來源:https://technews.tw/2021/01/28/microsoft-patent-details-tech-that-could-turn-dead-people-into-ai-chatbots/
微軟文字轉語音 在 Re: [討論] 上字幕的流程問題- 看板youtuber 的推薦與評價
首先 我是網頁搜尋到這篇文的
平常沒來這版,不過因為網路上討論很少
就稍微回覆一下,做個筆記順便讓之後需要的人能夠方便些
你遇到的就是文字還有語音轉換的問題
這要分兩個部分講
第一個部分是文字轉語音TTS (Text to Speech)
先推薦一個軟體
Balabolka
網址在此
https://cross-plus-a.com/balabolka.htm
(有中文版)
安裝完之後打開 把文字放進去就可以叫他唸了
他所調用的語音引擎是windows內建的
假如系統是WIN10新版本,可以調用SAPI5的語音
預設的繁體中文語音是涵涵(微軟會把語音取名子)
如果想用另外兩個SAPI5的語音(雅婷.志威)
請參考這裡
https://class.kh.edu.tw/19061/bulletin/msg_view/400
下載REG登錄檔 裝好之後就有了
以上是Balabolka調用本機(不連網)的語音引擎
假如是想要用線上語音引擎
在Balabolka->工具->Use online TTS services
快速鍵shift+ctrl+D
就可以使用一堆的線上TTS
而且可以直接轉存聲音檔
Google TTS1 TTS2是免費的 直接把文字打進去就能用
Google Cloud TTS要收錢
但是效果真的比較好
免費體驗網址在這
https://cloud.google.com/text-to-speech
註冊方式請參考
https://www.youtube.com/watch?v=y_vQvAqgqgA
免費:每月免費100萬字(WaveNet)
收費:每100萬字 16美元
小量使用通常不會收到錢
另外Google Cloud TTS裡面的standard語音和Google TTS2是一樣的,不要浪費額度去開
另外一個是Micosoft Azure TTS
一樣是收錢
體驗網址:
https://azure.microsoft.com/zh-tw/services/cognitive-services/text-to-speech/
註冊方式:
https://www.youtube.com/watch?v=WZi0fhJtLJI
免費:每月免費50萬字(神經網路)
收費:每100萬字 NT$480.868
然後裡面的涵涵.雅婷.志威是電腦WIN10就有內建可以調用 不要浪費額度去開
至於其他線上TTS 不成氣候 不推
第二部分
語音轉文字
一樣是GOOGLE還有AZURE兩家
體驗網址:
https://azure.microsoft.com/zh-tw/services/cognitive-services/speech-to-text/#features
https://cloud.google.com/speech-to-text?hl=zh-TW
我拿上面文字轉語音的音檔去餵
成功率挺高的,就是有些字會識別成同音字,這要手動修正一下
但是拿演講的錄音檔輸入進去
辨識就是很糟糕了
有在用pyTranscriber應該就知道體驗的結果
反正就是目前的語音轉文字 必定還要花時間去修正
不過順便提一下
之前在看有話好說的節目,節目使用交大的AI軟體,準確率幾乎是100%
連來賓突然講台語照樣輸出
不過目前沒有公開,花錢也買不到,假如公開在台灣腔轉文字就是打爆GOOGLE和AZURE
※ 引述《h07860251 (無法顯示)》之銘言:
: 最近嘗試做影片
: 計畫是使用GOOGLE語音+自動上字幕
: 結果實際使用完全跟想像的不一樣
: 超級不順利
: 首先
: 為了生成GOOGLE語音
: 事先用記事本紀錄了腳本
: 然後嘗試使用網路上說的兩種方法
: 第一種是使用GOOGLE翻譯網頁讓他朗讀+電腦錄音軟體錄製
: 缺點:網頁有字數限制(看起來是限制5000字)、而且耗時很久
: 第二種是像 Sound of Text 網頁方法的但字數更短
: 或是說使用F12從Media 抓取的話 太長會被自動分段也不是很方便...
: 總之GOOGLE語音檔會有一種沒分割的完整檔,或是小段小段的分割檔
: 不是影片去搭配語音,就是語音去切割搭配影片
: 這兩種要看狀況,都有適合的時機
: 然後影片跟聲音製作完成要去製作字幕的時候
: 使用網路上推薦的免費AI字幕生成(pyTranscriber)
: 結果正確率低到爆炸,GOOGLE語音比人聲難辨識阿
: 而且該軟體網路上說使用的是 Google 語音識別來產生的字幕
: 結果自己產出的語音自己的辨識系統分不出來....
: 為了調整正確率
: 使用網路上推薦的免費字幕編輯軟體(Aegisub)
: 搭配使用起來因為已經有腳本了
: 原本想說應該只要複製貼上過去很快就結束
: 結果他斷句怪怪的,又要細部微調
: 感覺做了很多無用功.......
: 最後要上傳YOUTUBE
: 自己本身也習慣內建字幕
: 去網路上找合成影片跟字幕的軟體
: 結果合成上去發現字體不一樣
: 然後排版也不太一樣... 應該是軟體差異造成
: 只是沒看到想用的免費軟體....(大陸的先不要...)
: 感覺我整個流程繞了超級大圈
: 有沒有什麼建議可以提供
: 在下感激不盡....
: -----
: 順帶一提,目前我使用Shotcut這款(免費軟體)來剪輯
: 查了一下,這款是可以上文字,但是還沒有支援SRT字幕等等功能
: 之前是有用過DaVinci Resolve (聽說調色特別厲害)
: 只是他雖然說是免費的,但是還是跟付費版有差別
: 上網查了一些教學,結果是付費版才有的功能
: 大失望就換軟體了...
: 最後再問一下
: GOOGLE語音是可以隨便使用(包含商業使用)嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.239.186.13 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/youtuber/M.1626333090.A.FD7.html
... <看更多>
微軟文字轉語音 在 Re: [討論] 上字幕的流程問題- 看板youtuber 的推薦與評價
首先 我是網頁搜尋到這篇文的
平常沒來這版,不過因為網路上討論很少
就稍微回覆一下,做個筆記順便讓之後需要的人能夠方便些
你遇到的就是文字還有語音轉換的問題
這要分兩個部分講
第一個部分是文字轉語音TTS (Text to Speech)
先推薦一個軟體
Balabolka
網址在此
https://cross-plus-a.com/balabolka.htm
(有中文版)
安裝完之後打開 把文字放進去就可以叫他唸了
他所調用的語音引擎是windows內建的
假如系統是WIN10新版本,可以調用SAPI5的語音
預設的繁體中文語音是涵涵(微軟會把語音取名子)
如果想用另外兩個SAPI5的語音(雅婷.志威)
請參考這裡
https://class.kh.edu.tw/19061/bulletin/msg_view/400
下載REG登錄檔 裝好之後就有了
以上是Balabolka調用本機(不連網)的語音引擎
假如是想要用線上語音引擎
在Balabolka->工具->Use online TTS services
快速鍵shift+ctrl+D
就可以使用一堆的線上TTS
而且可以直接轉存聲音檔
Google TTS1 TTS2是免費的 直接把文字打進去就能用
Google Cloud TTS要收錢
但是效果真的比較好
免費體驗網址在這
https://cloud.google.com/text-to-speech
註冊方式請參考
https://www.youtube.com/watch?v=y_vQvAqgqgA
免費:每月免費100萬字(WaveNet)
收費:每100萬字 16美元
小量使用通常不會收到錢
另外Google Cloud TTS裡面的standard語音和Google TTS2是一樣的,不要浪費額度去開
另外一個是Micosoft Azure TTS
一樣是收錢
體驗網址:
https://azure.microsoft.com/zh-tw/services/cognitive-services/text-to-speech/
註冊方式:
https://www.youtube.com/watch?v=WZi0fhJtLJI
免費:每月免費50萬字(神經網路)
收費:每100萬字 NT$480.868
然後裡面的涵涵.雅婷.志威是電腦WIN10就有內建可以調用 不要浪費額度去開
至於其他線上TTS 不成氣候 不推
第二部分
語音轉文字
一樣是GOOGLE還有AZURE兩家
體驗網址:
https://azure.microsoft.com/zh-tw/services/cognitive-services/speech-to-text/#features
https://cloud.google.com/speech-to-text?hl=zh-TW
我拿上面文字轉語音的音檔去餵
成功率挺高的,就是有些字會識別成同音字,這要手動修正一下
但是拿演講的錄音檔輸入進去
辨識就是很糟糕了
有在用pyTranscriber應該就知道體驗的結果
反正就是目前的語音轉文字 必定還要花時間去修正
不過順便提一下
之前在看有話好說的節目,節目使用交大的AI軟體,準確率幾乎是100%
連來賓突然講台語照樣輸出
不過目前沒有公開,花錢也買不到,假如公開在台灣腔轉文字就是打爆GOOGLE和AZURE
※ 引述《h07860251 (無法顯示)》之銘言:
: 最近嘗試做影片
: 計畫是使用GOOGLE語音+自動上字幕
: 結果實際使用完全跟想像的不一樣
: 超級不順利
: 首先
: 為了生成GOOGLE語音
: 事先用記事本紀錄了腳本
: 然後嘗試使用網路上說的兩種方法
: 第一種是使用GOOGLE翻譯網頁讓他朗讀+電腦錄音軟體錄製
: 缺點:網頁有字數限制(看起來是限制5000字)、而且耗時很久
: 第二種是像 Sound of Text 網頁方法的但字數更短
: 或是說使用F12從Media 抓取的話 太長會被自動分段也不是很方便...
: 總之GOOGLE語音檔會有一種沒分割的完整檔,或是小段小段的分割檔
: 不是影片去搭配語音,就是語音去切割搭配影片
: 這兩種要看狀況,都有適合的時機
: 然後影片跟聲音製作完成要去製作字幕的時候
: 使用網路上推薦的免費AI字幕生成(pyTranscriber)
: 結果正確率低到爆炸,GOOGLE語音比人聲難辨識阿
: 而且該軟體網路上說使用的是 Google 語音識別來產生的字幕
: 結果自己產出的語音自己的辨識系統分不出來....
: 為了調整正確率
: 使用網路上推薦的免費字幕編輯軟體(Aegisub)
: 搭配使用起來因為已經有腳本了
: 原本想說應該只要複製貼上過去很快就結束
: 結果他斷句怪怪的,又要細部微調
: 感覺做了很多無用功.......
: 最後要上傳YOUTUBE
: 自己本身也習慣內建字幕
: 去網路上找合成影片跟字幕的軟體
: 結果合成上去發現字體不一樣
: 然後排版也不太一樣... 應該是軟體差異造成
: 只是沒看到想用的免費軟體....(大陸的先不要...)
: 感覺我整個流程繞了超級大圈
: 有沒有什麼建議可以提供
: 在下感激不盡....
: -----
: 順帶一提,目前我使用Shotcut這款(免費軟體)來剪輯
: 查了一下,這款是可以上文字,但是還沒有支援SRT字幕等等功能
: 之前是有用過DaVinci Resolve (聽說調色特別厲害)
: 只是他雖然說是免費的,但是還是跟付費版有差別
: 上網查了一些教學,結果是付費版才有的功能
: 大失望就換軟體了...
: 最後再問一下
: GOOGLE語音是可以隨便使用(包含商業使用)嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.239.186.13 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/youtuber/M.1626333090.A.FD7.html
... <看更多>