迎接終端AI新時代:讓運算更靠近資料所在
作者 : Andrew Brown,Strategy Analytics
2021-03-03
資料/數據(data)成長的速度越來越快。據估計,人類目前每秒產出1.7Mb的資料。智慧與個人裝置如智慧型手機、平板電腦與穿戴式裝置不但快速成長,現在我們也真正目睹物聯網(IoT)的成長,未來連網的裝置數量將遠遠超越地球的人口。
這包括種類繁多的不同裝置,像是智慧感測器與致動器,它們可以監控從震動、語音到視覺等所有的東西,以及幾乎大家可以想像到的所有東西。這些裝置無所不在,從工廠所在位置到監控攝影機、智慧手錶、智慧家庭以及自主性越來越高的車輛。隨著我們企圖測量生活週遭數位世界中更多的事物,它們的數量將持續爆炸性成長。
資料爆量成長,讓許多企業把資料從內部部署運作移到雲端。儘管集中到雲端運算的性質,在成本與資源效率、彈性與便利性有它的優點,但也有一些缺點。由於運算與儲存在遠端進行,來自終端、也就是那些在網路最邊緣裝置的資料,需要從起始點經過網際網路或其他網路,來到集中式的資料中心(例如雲端),然後在這裡處理與儲存,最後再傳回給用戶。
對於一些傳統的應用,這種方式雖然還可以接受,但越來越多的使用場景就是無法承受終端與雲端之間,資訊被接力傳遞產生的延遲。我們必須即時做出決策,網路延遲要越小越好。基於這些原因,開始有人轉向終端運算;越來越多人轉而使用智慧終端,而去中心化的程度也越來越高。此外,在這些即時應用中產生的龐大資料量,意味著處理與智慧必須在本地以分散的方式進行。
與資料成長連袂而來的,是人工智慧與機器學習(ML)也朝終端移動,並且越來越朝終端本身移動。大量來自真實世界的資訊,需要用ML的方式來進行詮釋與採取行動。透過AI與ML,是以最小的延遲分析影像、動作、影片或數量龐大的資料,唯一可行且合乎成本效益的方式。運用AI與ML的演算法與應用將在邊緣運作,在未來還將會直接在終端裝置上進行。
資料正在帶動從集中化到分散化的轉變
隨著資訊科技市場逐漸發展與成熟,網路的設計以及在其運作的所有裝置,也都跟著進化。全盛時期從服務數千個小型客戶端的主機,一直到客戶端伺服器模型中使用的越來越本地化的個人電腦運算效能,基礎架構持續重組與最佳化,以便更貼近網路上的裝置以及符合運作應用的需求。這些需求包含檔案存取與資料儲存,以及資料處理的需求。
智慧型手機與其他行動裝置的爆炸性成長,加上物聯網的快速成長,促使我們需要為如何讓資產進行最佳的部署與安排進行評估。而影響這個評估的因素,包括網路的可用性、安全性、裝置的運算力,以及把資料從終端傳送到儲存設備的相關費用,近來也已轉向使用分散式的運算模型。
從邊緣到終端:AI與ML改變終端典範
在成本、資源效率、彈性與便利性等方面,雲端有它的優點,裝置數量的急遽增加(如圖2),將導致資料產出量大幅增加。這些資料大部份都相當複雜且非結構化的,這也是為何企業只會分析1%~12% 的資料的原因之一。把大量非結構化的資料送到雲端的費用相當高、容易形成瓶頸,而且從能源、頻寬與運算力角度來看,相當沒有效率。
在終端執行進階處理與分析的能力,可協助為關鍵應用降低延遲、減少對雲端的依賴,並且更好地管理物聯網產出的巨量資料。
終端AI:感測、推論與行動
在終端部署更多智慧的主要原因之一,是為了創造更大的敏捷性。終端裝置處於網路的最邊緣與資料產生的地方,可以更快與更準確地做出回應,同時免除不必要的資料傳輸、延遲與資料移動中的安全風險,可以節省費用。
處理能力與神經網路的重大進展,正協助帶動終端裝置的新能力,另一股驅動力則是對即時資訊、效率(傳送較少的資訊到雲端)、自動化與在多數情況下,對近乎即時回應的需求。這是一個三道步驟的程序:傳送資料、資料推論(例如依據機器學習辨識影像、聲音或動作),以及採取行動(如物件是披薩,冰箱的壓縮機發出正常範圍外的聲音,因此發出警告)。
感測
處理器、微控制器與感測器產生的資料量相當龐大。例如,自駕車每小時要搜集25GB的資料。智慧家庭裝置、智慧牙刷、健身追蹤器或智慧手錶持續進化,並且與以往相比,會搜集更多的資料。
它們搜集到的資料極具價值,但每次都從各個終端節點把資料推回給雲端,數量又會過多。因此必須在終端進行處理。倘若部份的作業負載能在終端本身進行,就可以大幅提升效率。
推論
終端搜集到的資料是非結構性的。當機器學習從資料擷取到關聯性時,就是在進行推論。這表示使用AI與ML工具來幫忙訓練裝置辨識物件。拜神經網路的進展之賜,機器學習工具越來越能訓練物件以高度的精準度辨識影像、聲音與動作,這對體積越來越小的裝置,極為關鍵。
例如,圖4顯示使用像ONNX、PyTorch、Caffe2、Arm NN或 Tensorflow Lite 等神經網路工具,訓練高效能的意法半導體(ST)微控制器(MCU),以轉換成最佳化的程式碼,讓MCU進行物件辨識(這個的情況辨識對象是影像、聲音或動作)。更高效能的MCU越來越常利用這些ML工具來辨識動作、音訊或影像,而且準確度相當高,而我們接下來馬上就要對此進行檢視。這些動作越來越頻繁地從邊緣,轉移到在終端運作的MCU本身。
行動
資料一旦完成感測與推論後,結果就是行動。這有可能是回饋簡單的回應(裝置是開啟或關閉),或針對應用情況進行最佳化(戴耳機的人正在移動中,因此會針對穩定度而非音質進行最佳化),或是回饋迴路(根據裝置訓練取得的機器學習,輸送帶若發出聲音,顯示它可能歪掉了)。物聯網裝置將會變得更複雜且更具智慧,因為這些能力提升後,運算力也會因此增加。在我們使用新的機器學習工具後,一些之前在雲端或終端完成的關鍵功能,將可以移到終端本身的內部進行。
終端 AI:千里之行始於足下
從智慧型手機到車輛,今日所有電子裝置的核心都是許多的處理器、微控制器與感測器。它們執行各種任務,從最簡單到最複雜,並需要各式各樣的能力。例如,應用處理器是高階處理器,它們是為行動運算、智慧型手機與伺服器設計;即時處理器是為例如硬碟控制、汽車動力傳動系統,與無線通訊的基頻控制使用的非常高效能的處理器,至於微控制器處理器的矽晶圓面積則小了許多,能源效率也高出很多,同時擁有特定的功能。
這意味著利用ML工具訓練如MCU等較不複雜元件來執行的動作,之前必須透過威力更強大的元件才能完成,但現在邊緣與雲端則是理想的場所。這將讓較小型的裝置以更低的延遲執行更多種類的功能,例如智慧手錶、健康追蹤器或健康照護監控等穿戴式裝置。
隨著更多功能在較小型的終端進行,這將可以省下資源,包括資料傳輸費用與能源費用,同時也會產生極大的環境衝擊,特別是考量到全球目前已有超過200億台連網裝置,以及超過2,500億顆MCU(根據Strategy Analytics統計數據)。
TinyML、MCU與人工智慧
根據Google的TesnsorFlow 技術主管、同時也是深度學習與TinyML領域的指標人物 Pete Warden 表示:「令人相當興奮的是,我還不知道我們將如何使用這些全新的裝置,特別是它們後面代表的科技是如此的吸引人,我無法想像那些即將出現的全新應用。」
微型機器學習(TinyML)的崛起,已經催化嵌入式系統與機器學習結合,而兩者傳統上大多是獨立運作的。TinyML 捨棄在雲端上運作複雜的機器學習模型,過程包含在終端裝置內與微控制器上運作經過最佳化的模式識別模型,耗電量只有數毫瓦。
物聯網環境中有數十億個微型裝置,可以為各個產業提供更多的洞察與效率,包括消費、醫療、汽車與工業。TinyML 獲得 Arm、Google、Qualcomm、Arduino等業者的支持,可望改變我們處理物聯網資料的方式。
受惠於TinyML,微控制器搭配AI已經開始增添各種傳統上威力更強大的元件才能執行的功能。這些功能包括語音辨識(例如自然語言處理)、影像處理(例如物件辨識與識別),以及動作(例如震動、溫度波動等)。啟用這些功能後,準確度與安全性更高,但電池的續航力卻不會打折扣,同時也考量到各種更微妙的應用。
儘管之前提到的雲端神經網路框架工具,是取用這個公用程式最常用的方法,但把AI函式庫整合進MCU,然後把本地的AI訓練與分析能力插入程式碼中也是可行的。這讓開發人員依據從感測器、麥克風與其他終端嵌入式裝置取得的訊號導出資料模式,然後從中建立模型,例如預測性維護能力。
如Arm Cortex-M55處理器與Ethos U55微神經處理器(microNPU),利用CMSIS-DSP與CMSIS-NN等常見API來簡化程式碼的轉移性,讓MCU與共同處理器緊密耦合以加速AI功能。透過推論工具在低成本的MCU上實現AI功能並符合嵌入式設計需求極為重要,原因是具有AI功能的MCU有機會在各種物聯網應用中轉變裝置的設計。
AI在較小型、低耗電與記憶體受限的裝置中可以協助的關鍵功能,我們可以把其精華歸納至我們簡稱為「3V」的三大領域:語音(Voice,如自然語言處理)、視覺(Vision,如影像處理)以及震動(Vibration,如處理來自多種感測器的資料,包括從加速計到溫度感測器,或是來自馬達的電氣訊號)。
終端智慧對「3V」至關重要
多數的物聯網應用聚焦在一些特定的領域:基本控制(開/關)、測量(狀態、溫度、流量、噪音與震動、濕度等)、資產的狀況(所在地點以及狀況如何?),以及安全性功能、自動化、預測性維護以及遠端遙控(詳見圖 6)。
Strategy Analytics的研究顯示,許多已經完成部署或將要部署的物聯網B2B應用,仍然只需要相對簡單的指令,如基本的開/關,以及對設備與環境狀態的監控。在消費性物聯網領域中,智慧音箱的語音控制AI已經出現爆炸性成長,成為智慧家庭指令的中樞,包括智慧插座、智慧照明、智慧攝影機、智慧門鈴,以及智慧恆溫器等。消費性裝置如藍牙耳機現在已經具備情境感知功能,可以依據地點與環境,在音質優先與穩定度優先之間自動切換。
如同我們檢視的結果,終端AI可以在「3V」核心領域提供價值,而它觸及的許多物聯網領域,遍及B2B與B2C的應用:
震動:包含來自多種感測器資料的處理,從加速計感測器到溫度感測器,或來自馬達的電氣訊號。
視覺:影像與影片辨識;分析與識別靜止影像或影片內物件的能力。
語音:包括自然語言處理(NLP)、瞭解人類口中說出與寫出的語言的能力,以及使用人類語言與人類交談的能力-自然語言產生(NLG)。
垂直市場中有多種可以實作AI技術的使用場景:
震動
可以用來把智慧帶進MCU中的終端AI的進展,有各式各樣的不同應用領域,對於成本與物聯網裝置與應用的效用,都會帶來衝擊。這包括我們在圖6中點出的數個關鍵物聯網應用領域,包括:
溫度監控;
壓力監控;
溼度監控;
物理動作,包括滑倒與跌倒偵測;
物質檢測(漏水、瓦斯漏氣等) ;
磁通量(如鄰近感測器與流量監控) ;
感測器融合(見圖7);
電場變化。
一如我們將在使用場景單元中檢視的,這些能力有許多可以應用在各種被普遍部署的物聯網應用中。
語音
語音是進化的產物,也是人類溝通非常有效率的方式。因此我們常常想要用語音來對機器下指令,也不令人意外;聲音檢測是持續成長的類別。語音啟動在智慧家庭應用中很常見,例如智慧音箱,而它也逐漸成為啟動智慧家庭裝置與智慧家電的語音中樞,如電視、遊戲主機與其他新的電器。
在工業環境中,供車床、銑床與磨床等電腦數值控制(CNC)機器使用的電腦語音引擎正方興未艾。iTSpeex的ATHENA4是第一批專為這些產品設計的語音啟動作業系統。這些產品往往因為安全原因,有離線語音處理的需求,因此終端 AI 語音發展在這裡也創造出有趣的機會。用戶可以指示機器執行特定的運作,並從機器手冊與工廠文件,立即取用資訊。
語音整合在車輛中也相當關鍵。OEM 代工廠商持續對車載娛樂系統中的語音辨識系統,進行大量投資。語音有潛力成為最安全的輸入模式,因為它可以讓駕駛的眼睛持續盯著道路,而雙手仍持續握著方向盤。
對於使用觸控螢幕或硬體控制器通常需要多道步驟的複雜任務,語音辨識系統特別能勝任。這些任務包括輸入文字簡訊、輸入目的地、播放特定歌曲或歌曲子集,以及選擇廣播電台頻道。其他的服務包含如拋錨服務(或bCall)與禮賓服務。
視覺
正如我們之前已經檢視過,終端 AI 提供視覺領域全新的機會,特別是與物件檢測及辨識相關。這可能包括觀察生產線的製造瑕疵,以及找出自動販賣機需要補貨的庫存。其他實例包括農業應用,例如依據大小與品質為農產品分級。
曳引機裝上機器視覺攝影機後,我們幾乎可以即時檢測出雜草。雜草冒出後,AI可以分類雜草並估算它對農產收穫的潛在威脅。這讓農民可以鎖定特定的雜草,並打造客製的除草解決方案。機器視覺然後可以檢測除草劑的效用,並找出農地中仍具抗藥性的殘餘雜草。
使用場景
預測性維護工具已經從擷取與比較震動的量測資料,進化到提出即時的資產監控。藉由連接物聯網感測器裝置與維護軟體,我們也可能做到遠端監控。
震動分析
這種類型的預測性維護在旋轉型機器密集的製造工廠裡,相當常見。震動分析可以揭露鬆脫、不平衡、錯位與軸承磨損等狀況。例如,把震動計量器接上靠近選煤廠離心泵浦內部承軸處,就可以讓工程師建立起正常震動範圍的基線。超出這個範圍的震動,可能顯示滾珠軸承出現鬆動,需要更換。
磁感測器融合
磁感測器利用磁性浮筒與一系列可以感應並與液體表面一起移動的感測器,測量液面的高低。所有的這些應用都使用一個固定面上的磁感測器,它與附近平面的磁鐵一起作動,與這個磁鐵相對應的感測器也會移動。
聲學分析(聲音)
與震動分析相似,聲測方位分析也是供潤滑技師使用,主要是專注在主動採取潤滑措施。這意味我們可以避免移動設備時產生的過度磨損,否則會為了修理造成代價高昂的停機。實際的例子可能包括測量輸送皮帶的承軸狀況。出現過度磨損時,承軸會因為潤滑不足或錯位出現故障,可能造成整個生產流程的中斷。
聲學分析(超音波)
聲音聲學分析雖然可以用來進行主動與預測性維護,超音波聲學分析卻只能用於預測性維護。它可以在超音波範圍內找出與機器摩擦及壓力相關的聲音,並使用在會發出較細微聲音的電氣設備與機器設備。我們可以說這一類型的分析與震動或油量分析相比,更可以預測即將出現的故障。目前它部署起來比其他種類的預防性維護花費較高,但終端 AI 的進展可以促成這種細微層級的聲學檢測,大幅降低部署的費用。
熱顯影
熱顯影利用紅外線影像來監控互動機器零件的溫度,讓任何異常情況很快變得顯而易見。具備終端 AI 能力的裝置,可以長期檢測微細的變化。與其他對事故敏感的監視器一樣,它們會觸發排程系統,自動採取適當的行動來預防零件故障。
消費者與智慧家庭
將語音運用在消費者與智慧家庭,是最常看到的場景之一。這包括智慧型手機與平板電腦上、未包含電話整合功能的裝置,例如螢幕尺寸有限的穿戴式裝置。這類型的裝置包含智慧手錶與健康穿戴式裝置,可以為各種功能提供免動手的語音啟動。像 Amazon 的 Echo 或 Google 的 Home 等智慧音箱市場的成長,說明消費者對於可接收與提供語音互動等現有裝置的強勁需求,與日俱增。
消費者基於各種理由使用智慧音箱,最常見的使用場景為:
聽音樂;
控制如照明等智慧家庭裝置;
取得新聞與天氣預報的更新;
建立購物與待辦事項清單。
除了像智慧音箱與智慧電視等消費裝置,智慧家庭裝置語音的使用,也顯現相當的潛力。諸如連網門鈴(如 ring.com)等裝置與連網的煙霧偵測器(例如 Nest Protect 煙霧與一氧化碳警報)目前都已上市可供消費者選購,它們結合了語音與視覺的感測器融合功能以及運動檢測。有了連網的煙霧偵測器,裝置在偵測到煙霧或一氧化碳時,可以發出語音警告。
終端 AI 為強化這些能力提供了全新機會,而且常常結合震動(動作)、視覺與語音控制。例如,增加姿態辨識來控制例如電視等家電,或是把語音控制嵌入白色家電,即是以最低成本強化功能性最直接的方式。
健康照護
用來發現醫護資訊的 AI 驅動終端裝置的應用,將為病況的治療與診斷,提供更多的價值。這種資訊可能是資料,也可能是影像、影片以及說出的話,我們可以透過 AI 進行型態與診斷分析。這些資料將引發全新、更有效的治療方法,為整個產業節省成本。受惠於終端 AI 的進展,像 Google Duplex 等語音系統的複雜性將會降低。例如門診預約等勞力密集的工作,也可以轉換成 AI 活動。利用自然語言語音來延伸 AI 的使用,也可以把 AI 用在第一線的病人診斷,然後再由醫師接手提供諮詢。
其他健康照護實例包括像 Wewalk5 等物件,這是一個供半盲與全盲人員使用的智慧拐杖。它使用感測器來檢測胸口水平以上的物件,並搭配 Google Maps 與 Amazon Alexa 等 app,方便使用者提出問題。
結論
由於連網的終端裝置數量越來越多,這個世界也越來越複雜。連接到網際網路的裝置已經超過 300 億個,而微控制器的數量也超過 2,500 億,每年還會增加約 300 億個。越來越多的程序開始進行自動化,不過,把大量資料傳送到雲端涉及的延遲以及邊緣運算的額外費用,意味著許多全新、令人興奮且引人矚目的物聯網使用場景,可能無法開花結果。
解決這些挑戰的答案,並不是為雲端資料中心持續增添運算力。降低出現在邊緣的延遲雖然會有幫助,但不會解決日益分散的世界的所有挑戰。我們需要把智能應用到基礎架構中。
儘管為終端裝置增添先進的運算能力在十年前仍不可行,TinyML 技術近來的提升,已經讓位處相當邊緣的裝置 (也就是終端本身)增添智能的機會大大改觀。在終端增加運算與人工智慧能力,可以讓我們在源頭搜集到更多更具關聯性與相關的資訊。隨著裝置與資料的數量持續攀升,在源頭掌握情境化與具關聯性的資料,具有極大的價值,並將開啟全新的使用場景與營收機會。
終端裝置的機器學習,可以促成全新的終端 AI 世界。新的應用場景正在崛起,甚至跳過傳送大量資料的需求,因而紓解資料傳輸的瓶頸與延遲,並在各種作業環境中創造全新機會。終端 AI 將為我們開啟一個充滿全新機會與應用場景的世界,其中還有很多我們現在想像不到的機會。
附圖:圖1:從集中式到分散式運算的轉變。
(資料來源:《The End of Cloud Computing》,by Peter Levine,Andreessen Horowitz)
圖2:全球上網裝置安裝量。
(資料來源:Strategy Analytics)
圖3:深度學習流程。
圖4:MCU的視覺、震動與語音。
(資料來源:意法半導體)
圖5:AI 工具集執行模型轉換,以便在MCU上執行經最佳化的神經網路推論。
(資料來源:意法半導體)
圖6:物聯網企業對企業應用的使用-目前與未來。
(資料來源:Strategy Analytics)
圖7:促成情境感知的感測器融合。
(資料來源:恩智浦半導體)
資料來源:https://www.eettaiwan.com/20210303nt31-the-dawn-of-endpoint-ai-bringing-compute-closer-to-data/?fbclid=IwAR0JTRpNsJUl-DmSNpfIcymGQpkQaUgXixEaczwDpELxGCaCeJpkTyoqUtI
同時也有2部Youtube影片,追蹤數超過2萬的網紅洋叔叔,也在其Youtube影片中提到,近期台灣進入 三級警戒,希望大家好好的防疫,政府推出了簡單且安全又免費的簡訊實聯制, 簡訊實聯制店家申請網址:https://emask.taiwan.gov.tw/real/ Android 可用以下 App 直接掃描 Google智慧鏡頭:https://play.google.com/st...
「google語音輸入無法使用」的推薦目錄:
- 關於google語音輸入無法使用 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
- 關於google語音輸入無法使用 在 Facebook 的精選貼文
- 關於google語音輸入無法使用 在 李開復 Kai-Fu Lee Facebook 的最佳貼文
- 關於google語音輸入無法使用 在 洋叔叔 Youtube 的最佳解答
- 關於google語音輸入無法使用 在 包一包 Youtube 的最佳貼文
- 關於google語音輸入無法使用 在 [心得] Google語音輸入可以產生標點符號了- 看板MobileComm 的評價
- 關於google語音輸入無法使用 在 語音輸入無法正常使用 - Mobile01 的評價
- 關於google語音輸入無法使用 在 陳玉蘭- 紅米NOTE手機更新到29版, Google 語音輸入無法 ... 的評價
- 關於google語音輸入無法使用 在 沒有相關權限因此無法啟用以下功能語音輸入的推薦,PTT 的評價
- 關於google語音輸入無法使用 在 Android 語音輸入不能正常運作+解決方法 - YouTube 的評價
- 關於google語音輸入無法使用 在 line無法語音輸入2022-在Mobile01/PTT/Yahoo上的體育賽事 ... 的評價
- 關於google語音輸入無法使用 在 line無法語音輸入2022-在Mobile01/PTT/Yahoo上的體育賽事 ... 的評價
- 關於google語音輸入無法使用 在 YouTube – Google 輸入工具 的評價
- 關於google語音輸入無法使用 在 2022年Discord還可以播YouTube的高品質免費音樂機器人 的評價
google語音輸入無法使用 在 Facebook 的精選貼文
最近玩了一些內建 Google Play 商店的 Android 車機、Android 後照鏡(流媒體),還有安裝好 GMS 之後的 HUAWEI 手機都有一個問題那就是都無法使用語音輸入來搜尋資料,或是利用 Google 地圖來語音輸入搜尋關鍵字,今天就來教大家如何在 Android 車機、Android 後照鏡(流媒體),還有安裝好 GMS 之後的 HUAWEI 手機上使用 Google 語音輸入來搜尋各種資料…
google語音輸入無法使用 在 李開復 Kai-Fu Lee Facebook 的最佳貼文
前陣子與深度學習發明人之一、2019年ACM圖靈獎得主Yoshua Bengio教授一起對話,深深為他身上的科學家底蘊所感動。
Bengio教授長期致力於推動AI的合理使用,尤其對用AI解決環保議題有很多投入,如使用新藥研發的AI演算法概念,延伸應用在發掘全新低污染材料以對抗全球氣候環境變化的艱巨挑戰。
他相信,人工智慧將推送社會的理性和包容,構建AI與人類社會的良性循環。
這是我們討論的視頻和文字記錄。
……………………
李開復對話Yoshua Bengio:構建AI與人類社會的良性循環
7月23日,創新工場董事長兼CEO李開復博士,受邀參加SGInnovate主辦的“深度科技(Deep Tech)造福人類”活動,與Element AI聯合創始人Yoshua Bengio教授對話,討論人工智慧的未來發展。
在對話中,李開復博士與Yoshua Bengio教授探討了AI對人類社會的意義,尤其在COVID-19疫情後時代,AI如何幫助未來的經濟社會更加富有彈性、宜居和可持續。
他們認為,AI是一個千載難逢的機會,人類得以真正從重複性事務中解脫出來。在 AI 的幫助下,我們將有希望希望建立一個明智、理性、包容的社會,構建人類社會與AI的良性循環。
他們討論的話題包括:
1、AI技術的下一個突破,如何加速AI從科研到應用轉化?
2、COVID-19疫情如何加速AI應用,由此帶來了什麼風險?
3、AI的責任和挑戰:如何促進未來社會經濟可持續發展?
4、你心目中理想的AI未來是什麼樣的?
▌深度學習2.0時代,提升機器理解和執行能力
話題1:AI技術的下一個突破,以及如何加速AI科研到應用
“接下來的研究雖然繁重,但新的進展會令人振奮。尤其是在深度學習領域,我稱其為‘深度學習2.0’。” ——Yoshua Bengio
Yoshua Bengio:第一個問題我非常有共鳴,在我看來,目前機器學習的一大限制,是學習系統的泛化能力。
過去幾十年研發的系統,都建立於一個假設,即預設測試數據與訓練數據有相同的數據分佈。
然而在現實世界中,無論在什麼行業應用,都會存在實際情況與AI訓練時不同的問題。
這一問題看起來無解,但目前我們找到了幾個突破點和想法,主要是借鑒人類的意識加工機制,對原本分散的知識積累,快速進行全新重組。
雖然這些知識的組合不一定遵循訓練數據分佈,但我們還是能從中獲得某種重組方向的優勢,從而在訓練分佈中進行更好的歸納。
接下來的研究雖然繁重,但新的進展會令人振奮。尤其是在深度學習領域,我稱其為“深度學習2.0”,它能吸收人類的歸納傾向,對數據分佈演算法進行泛化。
李開復:我借 Bengio 教授的觀點多說幾句。我從大學時期就開始著手會話式 AI 的研究。目前的人機界面,我稱之為委託界面,大多基於直接操作,如鍵盤、滑鼠、多點觸控等。
但語言是人類最基本的交流方式,也是最自然的交流途徑。向AI語音辨識、自然語言理解進軍,一直是我們孜孜以求的目標。
例如,以前我們使用搜尋引擎時,會通過輸入關鍵字來查找網頁。後來,Google帶來了新的突破,基於深度學習的智慧問答功能,可以直接讓機器“說”出答案。
但我們不應止步於此,而是應該繼續向下一步目標努力:通過深度學習的進一步研究,提升機器對人類指令意圖的理解和執行能力。
例如,我們是否可以直接向亞馬遜 Alexa發送指令:“給我媽媽送個生日禮物”。之後,它將自動理出頭緒,流覽禮物,安排配送。它瞭解我的個人喜好,知道我能接受的價格範圍,也知道我媽媽是誰,住在哪裡,想要的禮物是什麼。
Yoshua Bengio:關於AI的行業應用,我做個簡短分享。我認為這是個很有難度的議題。困難來自兩方面:一是社會方面,二是技術方面。
在社會方面,從基礎科學研究,到最後產品研發階段,需要共同營造一種文化,讓研究人員可以擁有研究自由,從而取得真實的突破。在技術方面,我們需要一些軟體工具,讓技術從研發到生產這一轉化過程,盡可能的高效快速。
李開復:AI的行業應用,我將之分為兩大類:顛覆式和漸進式。
顛覆式是指引入 AI 會對行業造成顛覆性的結果,帶來天翻地覆的改變。
例如,自動駕駛將徹底改變運輸行業;Alexa某種程度上正在改變音箱行業;新的互聯網保險應用,比如美國的Lemonade,極可能顛覆保險行業。
這些行業已經具備了一定的條件,讓行業專家通過 AI 帶來顛覆影響,讓人非常期待。當AI與行業的顛覆式創新兩相結合,將有機會擊敗行業巨頭,重整行業格局。
然而顛覆式只是冰山一角。在人工智慧帶來的巨大機會中,漸進式變革佔據絕大部分份額。
普華永道預估,人工智慧將在2030年給全球帶來15萬億美元的財富淨增,主要來自于傳統行業和AI的結合。由於傳統行業規模龐大,僅僅提高幾個百分點,就可以產生海量財富。
但困難在於,當前一些傳統企業對 AI 一無所知,他們以為AI是科幻小說的臆想,看不到即刻就能產生的收益,再加上技術工具太難使用,導致他們的 IT 部門無法駕馭。
因此,我們應該通過培訓,説明傳統行業接受並認識到AI的益處。同時,我們投資的AI企業或像 Element AI 之類的公司,需要幫助傳統企業找到簡單易用的工具,讓他們跨越技術鴻溝,上手即用。
▌AI提前預測傳染性,應權衡公共衛生與隱私保護
話題2:疫情如何加速AI應用,由此帶來了什麼風險?
“必須在公共衛生或個人健康的背景下考慮隱私,在公共衛生危機期間,國家應該在尊重權利和必要防控措施間加以權衡,從而有效控制疾病的傳播。”——李開復
李開復:我說幾個親身經歷的例子。疫情期間的社交隔離,催生了眾多的 AI 應用,例如醫院中的送貨機器人。
對於隔離中的人也一樣。前陣子我回到北京隔離時,在我居住的公寓樓裡,沒有見到一個人。所有的事情都交給了一台機器人代勞,包括網購的包裹和食品運送,真正實現了零接觸,將危險降到最小化。
第二個例子是AI與醫療的結合。我們投資的AI 醫療企業Insilico Medicine,主要使用生成化學對抗神經網路,研發新藥小分子。在疫情期間,他們通過AI平臺,用幾個星期的時間,研發出了能抑制病毒內負責複製的主要蛋白成分的新藥物小分子。
最後一個例子或許有些爭議,就是接觸者追蹤。世界上許多國家已經成功的建立了接觸者追蹤體系,並較為有效地控制了疫情蔓延。但在美國、歐洲等地方,這種做法被視為是對隱私的侵犯。
對此,我的觀點是,對那些重視隱私的國家,我表示完全理解和尊重,但是我認為必須在公共衛生或個人健康的背景下考慮隱私。在公共衛生危機期間,國家應該在尊重權利和必要防控措施間加以權衡,從而有效控制疾病的傳播。等到疫情結束後,再回歸正常。
我們都不希望重蹈疫情的覆轍。我預計在未來,AI將被用來預防流行病的發生和傳播。醫院將廣泛使用感測器、可穿戴設備,匯總疫情資訊,及時報告潛在危害,在早期遏制疫情指數級增長的趨勢,從而更好地應對危機,避免再次失控。
Yoshua Bengio:李開復博士提到的這幾個領域,我都有所涉及。
一個是藥品研發,我本人參與了幾個專案,其中涉及神經網路、即時強化學習和主動學習。
在化學和生物領域,需要進行測試的組合方式太多,逐個進行研究是不可能的。所以我們需要一個合理的搜索策略,這就是我現在參與的專案內容。我們希望能用AI縮短研究時間,通過重組已有藥物,研發新型抗病毒藥物。
在接觸追蹤方面,目前已有的接觸追蹤大都沒有用到AI,只是進行簡單的測試法:如果有人測試結果為陽性,或者確診感染,那麼與其接觸過的所有人,都應該採取隔離措施。但是,在測試為陽性進而被隔離之前,傳染就已經開始了。
我們的一項研究顯示,如果能借助機器學習,提前預測某個體是否具有傳染性以及傳染性強弱,透過一些模糊的數據分析,就能大幅節省等待時間,及早知道曾接觸過病毒攜帶者,從而抑制病毒的傳播。
當然不可避免會出現隱私問題。隱私保護與機器學習需求之間存在有趣的矛盾。隱私保護需要盡可能降低數據交換,而機器學習卻需要盡可能收集大量的數據。
許多國家非常擔憂接觸者追蹤的濫用會侵犯隱私,因此催生了許多隱私保護技術。好消息是,這兩者可以共存。
▌AI是把雙刃劍,應推動全球治理、改變文化
話題3:AI的責任和挑戰:如何促進未來社會經濟可持續發展?
“如果我們能對人工智慧的能力善加利用,就能更快速地找到更好的新材料,以取代現今對地球造成長期污染的碳、電池等毒性材料。”——Yoshua Bengio
李開復:我會從創新工場的角度舉一些例子,創新工場是一家創業投資公司,我們非常希望 AI 能得到合理應用。Bengio 教授可能會在氣候變化上再補充一些。
在 《AI新世界》一書中,我描述了一個人類與 AI 的共存的藍圖:由 AI 承擔優化常規工作,讓人類專注於需要創造力和同情心的工作。
從社會責任感的角度說講,AI與醫療和教育的結合,將帶來極大的社會福祉。
未來,醫生將成為富有同情心的護理者,深切關懷病患,與他們交流。而 AI 可以用於分析放射結果、MRI、CT報告,提出各種可能的診斷及治療結果,針對性推薦藥物,以及輔助科學家研發新藥。
教育行業也是這樣。我們投資了很多線上教育公司,發現 AI 在教師的常規工作上表現非常出色,能夠根據學生的特點,因人而異地佈置作業,幫老師們節省了時間,讓他們專注于為孩子指導能力和引導心靈,進行個性化的教育,幫助他們培養創造力、團隊合作能力、交流能力以及同情心。
所以,醫療和教育既是 AI能夠顯現優勢的領域,也是有價值的投資。目前這兩個領域正在蓬勃發展,我們也投入了大量精力和資金。
Yoshua Bengio:我完全同意李開復博士的觀點。AI 技術的進步,能夠造福大多數人,我們需要將大量精力投入到此類項目中。
我個人對用AI解決環保問題投入很多,目前正在參與的一個項目就和氣候危機相關。
我們使用類似新藥研發的AI演算法,應用在對抗全球氣候環境變化的艱巨挑戰上,生成、合成、評估各種新型材料技術,包括碳回收和電池。
正常情況下,這些新材料研發耗時極長,動輒十幾年,甚至比新藥研發的時間還要久。但是如果我們能對人工智慧的能力善加利用,就能更快速地找到更好的新材料,以取代現今對地球造成長期污染的碳、電池等毒性材料。
但是,我們同時應該保持警惕:如果AI僅被少數市場玩家掌握,也有可能被用做牟利的工具,破壞正常、自由、動態競爭的市場環境。
因此,在向AI 未來發展的路上,我們需要時刻謹記 AI 具有的社會危害性。要將AI治理落實到各個層面,小到公司,大到全球。只有具備放眼全球的管理,才能合理有效地協調所有的力量,一起應對這些挑戰。
如果我們真的想引導 AI 應用富有道德和責任,就必須改變現有的文化。而這依賴於所有人的努力。
政府必須參與其中,要投資好的技術應用,改變教育體系,讓工程師、科學家不只專攻特定的科技領域,還要具備足夠的社會學科知識;科學家必須懂得謙虛,認識到自己對專業以外的領域知之甚少,與其他不同領域的專家合作,保證自己的成果對社會產生正面的影響。
▌構建AI與人類社會的良性循環
話題4:你心目中理想的AI未來是什麼樣的?
如果我們能努力抓住人類與 AI 共存的機遇,思考人類存在真正的意義,從我們這一代便開始努力,最終將可以實現理想的AI未來。——李開復
Yoshua Bengio:未來,在 AI 的幫助下,我們可以建立一個更明智、更公平、更理性、更包容的社會,每個人都可以說出自己的觀點,進行充分辯論,再做出最佳決定。
社交媒體在誕生之初,本意是做一個最為透明、最為公平、普惠大眾的公眾傳播平臺,但由於演算法基於人類偏好的推薦,及帶有特定企圖的傳播者作祟,造成社交網路的破碎淩亂,煽動的、謬誤的、偏見的資訊被放大傳播,不僅沒法幫助我們理性討論,也欠缺幫助人們做出最佳集體決策的能力。
人工智慧應該在這一方面有所作為,從各種垃圾資訊中篩選出有用結果,讓社交
平臺更加智慧,做到真正的公正透明,推送社會的理性和包容。
反過來說,如果我們都能變得更理智,也就能更好地使用 AI 技術,就能構建一個良性循環。但如果應用不當,就可能陷入惡性循環,因此我們必須謹慎選擇。
李開復:Bengio教授說得太好了!我們是幸運的一代,AI是一個千載難逢的機會,人類能夠與AI共存合作,由AI來承擔常規事務,我們則專注於人類擅長的領域,從重複性事務中解脫出來,放手去做自己喜愛的事情。
我想用我心愛的、約翰·亞當斯的一首詩來結束這場分享。如果我們能努力抓住人類與 AI 共存的機遇,思考人類存在真正的意義,從我們這一代便開始努力,最終將可以實現理想的AI未來:
I must study politics and war
我必須研究政治和戰爭
that my sons may have liberty to study mathematics and philosophy
因此我的兒子們能夠學習數學和哲學
My sons ought to study mathematics and philosophy, geography, natural history, naval architecture, navigation,commerce and agriculture
我的兒子們應該學習數學、哲學、地理、博物、造船、航海、商業和農業
in order to give their children a right to study painting, poetry, music, architecture, statuary, tapestry and porcelain
使得他們的孩子們可以學習繪畫、詩歌、音樂、建築、雕塑、織物和瓷器
約翰·亞當斯,美國第二任總統,《獨立宣言》起草委員會的五個成員之一,被譽為“美國獨立的巨人”。
本文及視頻內容經主辦方 SGInnovate 同意翻譯轉載
google語音輸入無法使用 在 洋叔叔 Youtube 的最佳解答
近期台灣進入 三級警戒,希望大家好好的防疫,政府推出了簡單且安全又免費的簡訊實聯制,
簡訊實聯制店家申請網址:https://emask.taiwan.gov.tw/real/
Android 可用以下 App 直接掃描
Google智慧鏡頭:https://play.google.com/store/apps/details?id=com.google.ar.lens&hl=zh_TW&gl=US
QR code APP: https://play.google.com/store/apps/details?id=app.qrcode&hl=zh_TW
Android 其他掃描方式:(感謝以下網友分享)
@蔡一支
用Google App (Icon是一個G的那個) 也可以
進入App最上面的搜尋框,在麥克風(語音搜尋)的右邊也有可以掃描
@簡竣智、@習維尼媽死了
雙平台都可用的LINE的疾管家 LINE ID: vqv2007o
或點擊加入 https://liff.line.me/1645278921-kWRPP32q?openerPlatform=native&openerKey=urlSchema%3Aexternal&accountId=vqv2007o#mst_challenge=HrdfGlSJfoPDsLSBLn93h8QdfJwppZWkettxV9yUO-c
@洋叔叔的朋友
Samsung 手機可以直接掃描
@韓風子、@郭慶慶
安桌手機可以下載GOOGLE智慧鏡頭APP 也能掃描
若無法使用鏡頭,可以直接撰寫新簡訊送出
1.手機撰寫新簡訊
2.輸入店家號碼,記得空格
3.收件人號碼 1922
4.送出 即可
請訂閱我們的 Youtube 頻道,搶先觀看最新影片唷→https://goo.gl/ME2ehJ
歡迎訂閱我們的 LBRY/Odysee 頻道:https://odysee.com/@uncleyung
如果這些影片對您有幫助,記得也分享給其他人唷。
粉絲團:https://www.facebook.com/UncleYungFans/
Telegram:http://t.me/uncleyung
Instagram:uncleyungig
Clubhouse:uncleyung
連絡信箱:will@uncleyung.com
狗狗幣 錢包捐:DQ5VZpNcZghZotGkAnKVP2WaxRxFCXwocn
以太幣 錢包捐:0x3fA71c045218dc4ef83513fD4DD53080E362a97B
LBRY 錢包捐:bRZ1UFxZ7MN5W1SAs1uMzpk7MqHprudbow
主要相機:Sony A6500, AX700
鏡頭:Sony e10-18mm, Sigma 16mm f1.4, Sony EF 50mm F1.8
其他相機:iPhone 11 Pro Max, GoPro Hero 9, 7
360度相機:Insta360 one x
google語音輸入無法使用 在 包一包 Youtube 的最佳貼文
時間目錄
00:06 音效包+過濾器效果展示
01:34 錄製音效檔方式
02:38 錄麥克風聲音
03:09 過濾器及音效檔放置的位置(放錯就沒用)
03:37 將音效檔寫入過濾器的方法1,用語法自寫
04:57 方法2,使用Filtration輕鬆效率替換音效檔
附錄:
06:46 下載及安裝「Filtration編輯器」
07:03 下載及安裝「Moo0錄音專家」
Filtration編輯器
官方網站:https://github.com/ben-wallis/Filtration
Moo0錄音專家
官方網站:https://zhs.moo0.com
文字轉語音網站,可變換語速及多國發音(包括廣東話!)
https://ttsreader.com/
測試用過濾器及9個咕狗姊姊音效檔
https://drive.google.com/open?id=1vHocb5qgzkDRGmmHee9Nbxr3b-tzCmLp
(因為懶惰,編寫格式為繁體中文!無法相容其它版本哦)
=====完整步驟流程=====
《音效檔錄製方式》
準備一個錄音軟體,以「Moo0」為例
「目錄」設定為POE存放外部音效及過濾器的資料夾,預設路徑:文件\My Games\Path of Exile
「檔案名稱」隨便寫一個檔名。
「格式」MP3
「音量增益」建議設定為300%,不然在遊戲中播放時會很小聲。
然後到Google翻譯或其它文字轉語音網頁,輸入一段對話,然後播放及錄音即可。
《錄麥克風聲音》
先確定你麥克風有插好,而且可以正常運作!
將「Moo0」設定為「只錄語音(只有語音)」,之後按下錄音鍵並對著麥克風說話。
《過濾器及音效檔存放位置》
音效檔錄好後,在巴哈找別人寫好的過濾器下載並放進POE存放外部音效及過濾器的資料夾裡。
(預設路徑「文件\My Games\Path of Exile」)
然後再檢查一次,確定你的音效檔跟過濾器都放在正確的資料夾後,接下來要把錄好的音效檔寫進過濾器的語法裡,才會有作用。
《音效檔寫入過濾器語法的兩種方式》
方法1.
用「記事本」打開過濾器,找到你想播放自訂音效的項目,把這行語法加進去
CustomAlertSound "XXX.mp3"
XXX是你的MP3檔名,請自行填寫,不要照抄哦
如果該項目裡有其它音效語法,例如:
PlayAlertSound 6 300
就把它刪掉,然後存檔,進遊戲,加載過濾器,物品篩選音量開到最大,儲存,把東西丟地上,正常會發出你想要的聲音跟特效。
方法2.
用「 Filtration編輯器」打開過濾器,找到你想播放自己音效的項目,例如掉六連裝備時,我希望播放「包一包帥哥」。就到六連裝備那邊,點右邊圖示,然後查看內容,
如果有預設的音效就按X把它刪掉,然後點+Custom Alert Sound(自定義警報聲),在小方框選擇你錄好的音效,按喇叭還可以立即試聽。
弄好後存檔,進遊戲,加載過濾器,物品篩選音量開到最大,儲存,把東西丟地上,正常會發出你想要的聲音跟特效,不正常就自己檢查看看,一定是檔案放錯或操作錯誤。
#POE #流亡黯道 #PathOfExile
google語音輸入無法使用 在 語音輸入無法正常使用 - Mobile01 的推薦與評價
小弟的手機是Nokia 8 sirocco,目前遇到語音輸入的問題,正常語音輸入是講完話就會顯示文字出來,現在是要按暫停字才會出現(按麥克風的標誌變成灰色) ... ... <看更多>
google語音輸入無法使用 在 陳玉蘭- 紅米NOTE手機更新到29版, Google 語音輸入無法 ... 的推薦與評價
紅米NOTE手機更新到29版, Google 語音輸入無法使用? 解決方式如下: 1 進去桌面的「安全中心」,「授權管理」再選「應用授權管理」。 2 選「應用管理」, ... ... <看更多>
google語音輸入無法使用 在 [心得] Google語音輸入可以產生標點符號了- 看板MobileComm 的推薦與評價
今天發現Google語音輸入終於可以產生標點符號了,而且是以AI判別語氣來自動帶入,只
要在Google Play更新昨天釋出的最新版本Google,就可以使用。
以往在iOS的語音輸入可以說「逗號/句號」來輸入逗號/句號,在Android說「逗號」則會
出現逗號兩字,現在Google一口氣超車兩條街,實在方便極了,小小心得分享。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.165.155.208 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/MobileComm/M.1580819564.A.821.html
... <看更多>