感覺這次 iOS 15 搶了不少 Google 的飯碗(原況文字、地圖擴增實境),而且 iPhone 6s 也能升級,佛心。
-
iOS 15 帶來保持聯繫的新方式,以及幫助使用者專注、探索的強大更新,還能透過智慧功能用 iPhone 完成更多事。FaceTime 更新提供更自然的視訊通話;「專注模式」幫助使用者減少分心;「原況文字」等新功能利用裝置端智慧技術來顯示實用資訊;「地圖」的升級體驗提供探索世界的全新方法;還有更多強大新功能。iOS 15 今日以免額外付費軟體更新形式提供。
增強後更自然的 FaceTime 通話
FaceTime 變得比以往更不可或缺,讓使用者能輕鬆和最重要的人聯繫。FaceTime 音訊和視訊功能的強大更新,讓通話更自然、更栩栩如生。透過空間音訊,群組 FaceTime 通話中的聲音聽起來就像是從對方在畫面中的方位傳來。「語音隔離」是新的麥克風模式,運用機器學習技術排除背景噪音,優先聚焦使用者的聲音;「寬廣頻譜」模式則將所有背景聲音都收錄到通話中。受 iPhone 拍攝的絢麗人像照片啟發, FaceTime 上的「人像」模式可以將背景模糊,將畫面對焦在使用者身上。「語音隔離」、「寬廣頻譜」和「人像」模式也能以第三方 app 使用,例如 Webex、Zoom 和 WhatsApp。群組 FaceTime 提供新的格狀顯示選項,能以相同大小的方格來顯示通話參與者。
FaceTime 通話現在延伸至 Apple 裝置以外,Android 或 Windows 裝置的使用者也能從各自的網頁瀏覽器加入通話。網頁版 FaceTime 通話仍經端對端加密處理,隱私性不受影響。iPhone、iPad 和 Mac 使用者只需建立一個 FaceTime 連結,並透過「訊息」、「行事曆」、「郵件」或第三方 app 分享連結,即可開啟通話,與親友聯繫變得前所未有地容易。
今年秋季稍晚,「同播共享」將帶來讓使用者在 FaceTime 通話中與親友分享體驗的新方式,例如一同聆聽歌曲、觀看電視節目或電影、一起完成體能訓練、或分享螢幕以查看 app。「同播共享」將適用於 Apple Music、Apple TV+,以及 Disney+、HBO Max、MasterClass、SoundCloud、TikTok、Twitch,還有其他許多 app。「同播共享」可透過 iPhone、iPad 和 Mac 使用。共享播放控制選項,讓所有參與「同播共享」的成員都能播放、暫停或快轉。「同播共享」也可在 Apple TV 使用,讓使用者可在大螢幕上欣賞節目或電影。
藉由「訊息」保持聯繫的更多方式
「與你分享」是出現於「照片」、Safari、Music、Apple Podcasts 以及 Apple TV 等 app 的新區塊,顯示親友透過「訊息」分享的照片、文章、音樂等內容。「與你分享」自動於「照片」app 中顯示分享的照片,並在對應 app 中顯示其他相關內容。「與你分享」區塊顯示該內容的傳送者,讓使用者能輕鬆查看對應的訊息,並重啟對話。
iOS 15 中,Memoji 帶來讓使用者展現自己的更多元方式,包括多色頭飾、更多眼鏡款式,以及人工電子耳、氧氣管、軟頭盔等無障礙選項。使用者可用 40 多種服飾選項,以及沙卡、揮手、靈機一動燈泡時刻等九種全新貼圖手勢,自訂 Memoji 貼圖。
一日之中保持專注的強大工具
iOS 15 推出「專注模式」,可根據當下想專注處理的事情過濾通知,藉此幫助使用者減少分心。例如,工作期間可以設定「工作專注模式」,僅允許同事或工作用 app 傳送的通知;「個人專注模式」可在與親友一同休息放鬆時使用;「健身專注模式」則可幫助使用者進行體能訓練時保持在狀況內。使用者可以建立自訂「專注模式」或選擇系統提供的「專注模式」,運用裝置端智慧技術,建議允許發送通知給使用者的人和 app。為了進一步延伸專注功能,使用者能用符合特定「專注模式」的相關 app 建立專用「主畫面」。
使用「專注模式」時,「訊息」app 和 Slack 等支援此功能的第三方通訊 app 會自動對聯絡人顯示使用者狀態,使對方明白此刻不宜打擾。使用者甚至能收到開啟「專注模式」的建議,依據時間點或地點等因素而提供,且在一個 Apple 裝置上設定好的「專注模式」也會自動套用在使用者的其他 Apple 裝置上。
通知的全新樣貌
通知經過重新設計,新增了聯絡人照片和較大的 app 圖示,使通知內容更容易辨識。通知摘要是每日於使用者指定時間發送的通知整合。裝置端智慧技術會根據使用者與 app 的互動,將摘要按照優先順序整理,最為重要的通知會在最上方。有時效性的通知、訊息和電話會立即傳遞,因此使用者不會錯過緊急的通知。此外,若想將特定 app 或訊息通知轉為靜音一小時或一天,也都輕而易舉。
裝置端的智慧技術驅動「原況文字」、更先進的 Spotlight 搜尋、以及「回憶」等功能
「原況文字」將照片中文字內容變得有互動性。「原況文字」使用裝置端智慧技術辨識全系統 (包括網頁) 照片中的文字內容,並讓使用者採取進一步行動,例如複製貼上、查詢資訊、翻譯等。使用者甚至可輕點電話號碼的影像以撥打電話,或輕點網址的影像以在 Safari 中開啟頁面。透過神經網路引擎的能力,「相機」app 也可以快速在當下辨識並擷取文字,例如社區咖啡廳牆上寫的 Wi-Fi 密碼。使用者可利用「圖像查詢」獲得有關流行藝術、地標、書籍、自然界中的植物花草、寵物品種等進一步資訊。
Spotlight 是 iPhone 上通用的啟動搜尋方式,現在可以直接從鎖定畫面使用,並包括以地點、人物、場景或物品搜尋照片的功能。利用「原況文字」,Spotlight 可搜尋到照片中的文字與手寫內容。
iOS 15 為「回憶」功能帶來目前為止最大幅度的更新。全新電影級「回憶」功能具備煥然一新的樣貌、互動式介面,並結合 Apple Music 利用裝置端智慧技術推薦音樂曲目,重溫最愛或遺忘的回憶變得更容易。
重新設計的 Safari 瀏覽體驗
Safari 推出新設計的瀏覽體驗,使控制選項更容易觸及。新的標籤列預設置於螢幕底部,讓使用者可以輕鬆以單手在標籤頁間滑動瀏覽。利用「標籤頁群組」,使用者可以輕鬆地整理標籤頁,並隨時隨地在 iPhone、iPad、Mac 裝置上讀取。iOS 上自訂起始頁面以及網頁延伸功能,使 Safari 變得更個人化、更強大。
用Apple「地圖」導航、探索
iOS 15 中的「地圖」提供看世界的嶄新方式。視覺效果絢麗的地圖,提供更勝以往的細節呈現社區、商業區、建築物,也擁有客製地標,以及帶著閃耀月光效果的全新夜間模式。導航提供全新 3D 駕駛顯示,搭配新的道路細節呈現,幫助使用者更清楚辨識轉彎車道、分隔帶、人行穿越道、人行道等。升級的地圖功能於洛杉磯、紐約、舊金山提供,日後將於更多地區推出。設計精美的互動式地球儀提供山脈、沙漠、雨林、水體等地貌的豐富細節。
大眾運輸使用者輕輕一點,即可找到附近站點、釘選愛用路線。「地圖」會自動跟隨所選的交通路線,在接近出發時間時通知使用者,並在 Apple Watch 上追蹤這些資訊。使用者只要舉起 iPhone,即可透過擴增實境獲取詳細的步行路線指引。
「錢包」新增鑰匙和州證件
有了 iOS 15,「錢包」新增住家、飯店、辦公室,甚至汽車鑰匙,讓使用者僅透過輕輕一點 iPhone 即可進出更多地方。具備超寬頻支援的數位汽車鑰匙變得更厲害,使用者不必從口袋或包包拿出 iPhone,即可安全上鎖、解鎖、啟動指定車輛。 只要將鑰匙儲存在「錢包」裡,iPhone 也可以用來解鎖住家、辦公室,甚至飯店房間。 此外,未來將開放讓住在美國參與州的使用者可以把合格州證件與駕照加入 iPhone「錢包」。
重新設計的「天氣」功能
「天氣」全新設計的外觀配有全螢幕地圖、圖像化顯示的天氣資訊、以及根據情況動態調整的配置。精美的動畫背景能更準確反映太陽位置、雲量與降水,以及降雨或降雪的開始與結束時間通知。
運用「備忘錄」整理、協作
「備忘錄」新增可供使用者自訂的標籤,易於快速分類筆記,「提及」功能讓共享筆記的成員可通知彼此重要的內容更新。全新「活動」顯示,可查看共享筆記的近期紀錄;Highlights 則顯示編輯者的細節。首先於 Mac 和 iPad 登場的「快速備忘錄」可在「備忘錄」app 中查看與編輯。
更多隱私控制
全新隱私權功能提供透明度,以及用戶對於提供給 app 資料的掌控度。「郵件隱私權保護」防止寄件人得知郵件是否被開啟,也隱藏 IP 地址,如此一來寄件人就無法從 IP 地址得知使用者地點,或藉此對使用者進行建檔分析。Siri 對使用者隱私權的保護更進一步,透過裝置端語音辨識,使用者的指令音訊預設完全在裝置端處理,實現更加個人化、離線指令、以及更快的性能。
其他功能特色
Siri 新增 AirPods 上的「播報通知」功能,也能讓使用者透過下達指令與他人分享螢幕。Siri 現在可以在第三方 HomeKit 配件中啟用,如此一來 HomePod 與 HomePod mini 使用者可以輕鬆、安全地請 Siri 傳送訊息、設定提醒事項,或將內部訊息透過家中更多設備廣播給家人。
iCloud+ 結合所有使用者最愛的 iCloud 功能,再加上新的進階功能,包括「隱藏我的電子郵件」、擴充的「HomeKit 安全錄影」支援,還有創新的網路隱私權服務 「iCloud 私密轉送」。iCloud 目前的訂閱者將會自動升級至 iCloud+,無需額外付費。所有的 iCloud+ 方案皆可與使用者「家人共享」群組中的其他成員共享,如此一來,所有人都能享受這項服務提供的新功能、儲存空間和升級的體驗。
「健康」app 新增分享標籤頁,使用者可以跟家人、照護者或照護團隊分享健康資料;「趨勢」讓使用者可注意有意義的個人健康數據變化;新的衡量指標「步行穩定性」則賦予使用者積極管理跌倒風險的能力。使用者也能夠直接在「健康」app 中儲存可驗證的 COVID-19 疫苗或篩檢結果紀錄,以供隨時輕鬆取用。
「翻譯」 新增「自動翻譯」功能,不需點按麥克風按鈕,即可自動偵測到使用者開始說話,並翻譯語音內容,使得跨語言對話更加流暢自然。全系統適用的翻譯功能,讓使用者可透過選擇文字並點選「翻譯」,在 iPhone 上隨處進行翻譯。
新的 iPhone 設定讓使用者可更無縫地啟用 iPhone。原 iPhone 使用者無需訂閱 iCloud,也可以暫時在 iCloud 備份資料,以便輕鬆轉移資料到新的 iPhone。針對第一次換到 iPhone 的使用者,進化版的「移轉到 iOS」,讓使用者輕鬆轉移「照片」相簿、檔案、資料夾、「輔助使用」設定等,從最開始就享受個人化的 iPhone 使用體驗。
「輔助使用」透過「旁白」讓使用者探索圖片中人物、物品、文字、表格資料、以及圖片中表格的更多細節。新的背景音持續於背景播放,掩蓋惱人的環境或外部噪音。「聲音控制」功能提供客製化「切換控制」,可用嘴巴發出的聲音進行操作,使用者也可在不同 app 上自訂顯示和文字大小。Apple 也將為「耳機調節」功能支援辨識外部載入的聽力圖 —— 顯示聽力測試結果的圖表。
健身環離線模式 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳解答
迎接終端AI新時代:讓運算更靠近資料所在
作者 : Andrew Brown,Strategy Analytics
2021-03-03
資料/數據(data)成長的速度越來越快。據估計,人類目前每秒產出1.7Mb的資料。智慧與個人裝置如智慧型手機、平板電腦與穿戴式裝置不但快速成長,現在我們也真正目睹物聯網(IoT)的成長,未來連網的裝置數量將遠遠超越地球的人口。
這包括種類繁多的不同裝置,像是智慧感測器與致動器,它們可以監控從震動、語音到視覺等所有的東西,以及幾乎大家可以想像到的所有東西。這些裝置無所不在,從工廠所在位置到監控攝影機、智慧手錶、智慧家庭以及自主性越來越高的車輛。隨著我們企圖測量生活週遭數位世界中更多的事物,它們的數量將持續爆炸性成長。
資料爆量成長,讓許多企業把資料從內部部署運作移到雲端。儘管集中到雲端運算的性質,在成本與資源效率、彈性與便利性有它的優點,但也有一些缺點。由於運算與儲存在遠端進行,來自終端、也就是那些在網路最邊緣裝置的資料,需要從起始點經過網際網路或其他網路,來到集中式的資料中心(例如雲端),然後在這裡處理與儲存,最後再傳回給用戶。
對於一些傳統的應用,這種方式雖然還可以接受,但越來越多的使用場景就是無法承受終端與雲端之間,資訊被接力傳遞產生的延遲。我們必須即時做出決策,網路延遲要越小越好。基於這些原因,開始有人轉向終端運算;越來越多人轉而使用智慧終端,而去中心化的程度也越來越高。此外,在這些即時應用中產生的龐大資料量,意味著處理與智慧必須在本地以分散的方式進行。
與資料成長連袂而來的,是人工智慧與機器學習(ML)也朝終端移動,並且越來越朝終端本身移動。大量來自真實世界的資訊,需要用ML的方式來進行詮釋與採取行動。透過AI與ML,是以最小的延遲分析影像、動作、影片或數量龐大的資料,唯一可行且合乎成本效益的方式。運用AI與ML的演算法與應用將在邊緣運作,在未來還將會直接在終端裝置上進行。
資料正在帶動從集中化到分散化的轉變
隨著資訊科技市場逐漸發展與成熟,網路的設計以及在其運作的所有裝置,也都跟著進化。全盛時期從服務數千個小型客戶端的主機,一直到客戶端伺服器模型中使用的越來越本地化的個人電腦運算效能,基礎架構持續重組與最佳化,以便更貼近網路上的裝置以及符合運作應用的需求。這些需求包含檔案存取與資料儲存,以及資料處理的需求。
智慧型手機與其他行動裝置的爆炸性成長,加上物聯網的快速成長,促使我們需要為如何讓資產進行最佳的部署與安排進行評估。而影響這個評估的因素,包括網路的可用性、安全性、裝置的運算力,以及把資料從終端傳送到儲存設備的相關費用,近來也已轉向使用分散式的運算模型。
從邊緣到終端:AI與ML改變終端典範
在成本、資源效率、彈性與便利性等方面,雲端有它的優點,裝置數量的急遽增加(如圖2),將導致資料產出量大幅增加。這些資料大部份都相當複雜且非結構化的,這也是為何企業只會分析1%~12% 的資料的原因之一。把大量非結構化的資料送到雲端的費用相當高、容易形成瓶頸,而且從能源、頻寬與運算力角度來看,相當沒有效率。
在終端執行進階處理與分析的能力,可協助為關鍵應用降低延遲、減少對雲端的依賴,並且更好地管理物聯網產出的巨量資料。
終端AI:感測、推論與行動
在終端部署更多智慧的主要原因之一,是為了創造更大的敏捷性。終端裝置處於網路的最邊緣與資料產生的地方,可以更快與更準確地做出回應,同時免除不必要的資料傳輸、延遲與資料移動中的安全風險,可以節省費用。
處理能力與神經網路的重大進展,正協助帶動終端裝置的新能力,另一股驅動力則是對即時資訊、效率(傳送較少的資訊到雲端)、自動化與在多數情況下,對近乎即時回應的需求。這是一個三道步驟的程序:傳送資料、資料推論(例如依據機器學習辨識影像、聲音或動作),以及採取行動(如物件是披薩,冰箱的壓縮機發出正常範圍外的聲音,因此發出警告)。
感測
處理器、微控制器與感測器產生的資料量相當龐大。例如,自駕車每小時要搜集25GB的資料。智慧家庭裝置、智慧牙刷、健身追蹤器或智慧手錶持續進化,並且與以往相比,會搜集更多的資料。
它們搜集到的資料極具價值,但每次都從各個終端節點把資料推回給雲端,數量又會過多。因此必須在終端進行處理。倘若部份的作業負載能在終端本身進行,就可以大幅提升效率。
推論
終端搜集到的資料是非結構性的。當機器學習從資料擷取到關聯性時,就是在進行推論。這表示使用AI與ML工具來幫忙訓練裝置辨識物件。拜神經網路的進展之賜,機器學習工具越來越能訓練物件以高度的精準度辨識影像、聲音與動作,這對體積越來越小的裝置,極為關鍵。
例如,圖4顯示使用像ONNX、PyTorch、Caffe2、Arm NN或 Tensorflow Lite 等神經網路工具,訓練高效能的意法半導體(ST)微控制器(MCU),以轉換成最佳化的程式碼,讓MCU進行物件辨識(這個的情況辨識對象是影像、聲音或動作)。更高效能的MCU越來越常利用這些ML工具來辨識動作、音訊或影像,而且準確度相當高,而我們接下來馬上就要對此進行檢視。這些動作越來越頻繁地從邊緣,轉移到在終端運作的MCU本身。
行動
資料一旦完成感測與推論後,結果就是行動。這有可能是回饋簡單的回應(裝置是開啟或關閉),或針對應用情況進行最佳化(戴耳機的人正在移動中,因此會針對穩定度而非音質進行最佳化),或是回饋迴路(根據裝置訓練取得的機器學習,輸送帶若發出聲音,顯示它可能歪掉了)。物聯網裝置將會變得更複雜且更具智慧,因為這些能力提升後,運算力也會因此增加。在我們使用新的機器學習工具後,一些之前在雲端或終端完成的關鍵功能,將可以移到終端本身的內部進行。
終端 AI:千里之行始於足下
從智慧型手機到車輛,今日所有電子裝置的核心都是許多的處理器、微控制器與感測器。它們執行各種任務,從最簡單到最複雜,並需要各式各樣的能力。例如,應用處理器是高階處理器,它們是為行動運算、智慧型手機與伺服器設計;即時處理器是為例如硬碟控制、汽車動力傳動系統,與無線通訊的基頻控制使用的非常高效能的處理器,至於微控制器處理器的矽晶圓面積則小了許多,能源效率也高出很多,同時擁有特定的功能。
這意味著利用ML工具訓練如MCU等較不複雜元件來執行的動作,之前必須透過威力更強大的元件才能完成,但現在邊緣與雲端則是理想的場所。這將讓較小型的裝置以更低的延遲執行更多種類的功能,例如智慧手錶、健康追蹤器或健康照護監控等穿戴式裝置。
隨著更多功能在較小型的終端進行,這將可以省下資源,包括資料傳輸費用與能源費用,同時也會產生極大的環境衝擊,特別是考量到全球目前已有超過200億台連網裝置,以及超過2,500億顆MCU(根據Strategy Analytics統計數據)。
TinyML、MCU與人工智慧
根據Google的TesnsorFlow 技術主管、同時也是深度學習與TinyML領域的指標人物 Pete Warden 表示:「令人相當興奮的是,我還不知道我們將如何使用這些全新的裝置,特別是它們後面代表的科技是如此的吸引人,我無法想像那些即將出現的全新應用。」
微型機器學習(TinyML)的崛起,已經催化嵌入式系統與機器學習結合,而兩者傳統上大多是獨立運作的。TinyML 捨棄在雲端上運作複雜的機器學習模型,過程包含在終端裝置內與微控制器上運作經過最佳化的模式識別模型,耗電量只有數毫瓦。
物聯網環境中有數十億個微型裝置,可以為各個產業提供更多的洞察與效率,包括消費、醫療、汽車與工業。TinyML 獲得 Arm、Google、Qualcomm、Arduino等業者的支持,可望改變我們處理物聯網資料的方式。
受惠於TinyML,微控制器搭配AI已經開始增添各種傳統上威力更強大的元件才能執行的功能。這些功能包括語音辨識(例如自然語言處理)、影像處理(例如物件辨識與識別),以及動作(例如震動、溫度波動等)。啟用這些功能後,準確度與安全性更高,但電池的續航力卻不會打折扣,同時也考量到各種更微妙的應用。
儘管之前提到的雲端神經網路框架工具,是取用這個公用程式最常用的方法,但把AI函式庫整合進MCU,然後把本地的AI訓練與分析能力插入程式碼中也是可行的。這讓開發人員依據從感測器、麥克風與其他終端嵌入式裝置取得的訊號導出資料模式,然後從中建立模型,例如預測性維護能力。
如Arm Cortex-M55處理器與Ethos U55微神經處理器(microNPU),利用CMSIS-DSP與CMSIS-NN等常見API來簡化程式碼的轉移性,讓MCU與共同處理器緊密耦合以加速AI功能。透過推論工具在低成本的MCU上實現AI功能並符合嵌入式設計需求極為重要,原因是具有AI功能的MCU有機會在各種物聯網應用中轉變裝置的設計。
AI在較小型、低耗電與記憶體受限的裝置中可以協助的關鍵功能,我們可以把其精華歸納至我們簡稱為「3V」的三大領域:語音(Voice,如自然語言處理)、視覺(Vision,如影像處理)以及震動(Vibration,如處理來自多種感測器的資料,包括從加速計到溫度感測器,或是來自馬達的電氣訊號)。
終端智慧對「3V」至關重要
多數的物聯網應用聚焦在一些特定的領域:基本控制(開/關)、測量(狀態、溫度、流量、噪音與震動、濕度等)、資產的狀況(所在地點以及狀況如何?),以及安全性功能、自動化、預測性維護以及遠端遙控(詳見圖 6)。
Strategy Analytics的研究顯示,許多已經完成部署或將要部署的物聯網B2B應用,仍然只需要相對簡單的指令,如基本的開/關,以及對設備與環境狀態的監控。在消費性物聯網領域中,智慧音箱的語音控制AI已經出現爆炸性成長,成為智慧家庭指令的中樞,包括智慧插座、智慧照明、智慧攝影機、智慧門鈴,以及智慧恆溫器等。消費性裝置如藍牙耳機現在已經具備情境感知功能,可以依據地點與環境,在音質優先與穩定度優先之間自動切換。
如同我們檢視的結果,終端AI可以在「3V」核心領域提供價值,而它觸及的許多物聯網領域,遍及B2B與B2C的應用:
震動:包含來自多種感測器資料的處理,從加速計感測器到溫度感測器,或來自馬達的電氣訊號。
視覺:影像與影片辨識;分析與識別靜止影像或影片內物件的能力。
語音:包括自然語言處理(NLP)、瞭解人類口中說出與寫出的語言的能力,以及使用人類語言與人類交談的能力-自然語言產生(NLG)。
垂直市場中有多種可以實作AI技術的使用場景:
震動
可以用來把智慧帶進MCU中的終端AI的進展,有各式各樣的不同應用領域,對於成本與物聯網裝置與應用的效用,都會帶來衝擊。這包括我們在圖6中點出的數個關鍵物聯網應用領域,包括:
溫度監控;
壓力監控;
溼度監控;
物理動作,包括滑倒與跌倒偵測;
物質檢測(漏水、瓦斯漏氣等) ;
磁通量(如鄰近感測器與流量監控) ;
感測器融合(見圖7);
電場變化。
一如我們將在使用場景單元中檢視的,這些能力有許多可以應用在各種被普遍部署的物聯網應用中。
語音
語音是進化的產物,也是人類溝通非常有效率的方式。因此我們常常想要用語音來對機器下指令,也不令人意外;聲音檢測是持續成長的類別。語音啟動在智慧家庭應用中很常見,例如智慧音箱,而它也逐漸成為啟動智慧家庭裝置與智慧家電的語音中樞,如電視、遊戲主機與其他新的電器。
在工業環境中,供車床、銑床與磨床等電腦數值控制(CNC)機器使用的電腦語音引擎正方興未艾。iTSpeex的ATHENA4是第一批專為這些產品設計的語音啟動作業系統。這些產品往往因為安全原因,有離線語音處理的需求,因此終端 AI 語音發展在這裡也創造出有趣的機會。用戶可以指示機器執行特定的運作,並從機器手冊與工廠文件,立即取用資訊。
語音整合在車輛中也相當關鍵。OEM 代工廠商持續對車載娛樂系統中的語音辨識系統,進行大量投資。語音有潛力成為最安全的輸入模式,因為它可以讓駕駛的眼睛持續盯著道路,而雙手仍持續握著方向盤。
對於使用觸控螢幕或硬體控制器通常需要多道步驟的複雜任務,語音辨識系統特別能勝任。這些任務包括輸入文字簡訊、輸入目的地、播放特定歌曲或歌曲子集,以及選擇廣播電台頻道。其他的服務包含如拋錨服務(或bCall)與禮賓服務。
視覺
正如我們之前已經檢視過,終端 AI 提供視覺領域全新的機會,特別是與物件檢測及辨識相關。這可能包括觀察生產線的製造瑕疵,以及找出自動販賣機需要補貨的庫存。其他實例包括農業應用,例如依據大小與品質為農產品分級。
曳引機裝上機器視覺攝影機後,我們幾乎可以即時檢測出雜草。雜草冒出後,AI可以分類雜草並估算它對農產收穫的潛在威脅。這讓農民可以鎖定特定的雜草,並打造客製的除草解決方案。機器視覺然後可以檢測除草劑的效用,並找出農地中仍具抗藥性的殘餘雜草。
使用場景
預測性維護工具已經從擷取與比較震動的量測資料,進化到提出即時的資產監控。藉由連接物聯網感測器裝置與維護軟體,我們也可能做到遠端監控。
震動分析
這種類型的預測性維護在旋轉型機器密集的製造工廠裡,相當常見。震動分析可以揭露鬆脫、不平衡、錯位與軸承磨損等狀況。例如,把震動計量器接上靠近選煤廠離心泵浦內部承軸處,就可以讓工程師建立起正常震動範圍的基線。超出這個範圍的震動,可能顯示滾珠軸承出現鬆動,需要更換。
磁感測器融合
磁感測器利用磁性浮筒與一系列可以感應並與液體表面一起移動的感測器,測量液面的高低。所有的這些應用都使用一個固定面上的磁感測器,它與附近平面的磁鐵一起作動,與這個磁鐵相對應的感測器也會移動。
聲學分析(聲音)
與震動分析相似,聲測方位分析也是供潤滑技師使用,主要是專注在主動採取潤滑措施。這意味我們可以避免移動設備時產生的過度磨損,否則會為了修理造成代價高昂的停機。實際的例子可能包括測量輸送皮帶的承軸狀況。出現過度磨損時,承軸會因為潤滑不足或錯位出現故障,可能造成整個生產流程的中斷。
聲學分析(超音波)
聲音聲學分析雖然可以用來進行主動與預測性維護,超音波聲學分析卻只能用於預測性維護。它可以在超音波範圍內找出與機器摩擦及壓力相關的聲音,並使用在會發出較細微聲音的電氣設備與機器設備。我們可以說這一類型的分析與震動或油量分析相比,更可以預測即將出現的故障。目前它部署起來比其他種類的預防性維護花費較高,但終端 AI 的進展可以促成這種細微層級的聲學檢測,大幅降低部署的費用。
熱顯影
熱顯影利用紅外線影像來監控互動機器零件的溫度,讓任何異常情況很快變得顯而易見。具備終端 AI 能力的裝置,可以長期檢測微細的變化。與其他對事故敏感的監視器一樣,它們會觸發排程系統,自動採取適當的行動來預防零件故障。
消費者與智慧家庭
將語音運用在消費者與智慧家庭,是最常看到的場景之一。這包括智慧型手機與平板電腦上、未包含電話整合功能的裝置,例如螢幕尺寸有限的穿戴式裝置。這類型的裝置包含智慧手錶與健康穿戴式裝置,可以為各種功能提供免動手的語音啟動。像 Amazon 的 Echo 或 Google 的 Home 等智慧音箱市場的成長,說明消費者對於可接收與提供語音互動等現有裝置的強勁需求,與日俱增。
消費者基於各種理由使用智慧音箱,最常見的使用場景為:
聽音樂;
控制如照明等智慧家庭裝置;
取得新聞與天氣預報的更新;
建立購物與待辦事項清單。
除了像智慧音箱與智慧電視等消費裝置,智慧家庭裝置語音的使用,也顯現相當的潛力。諸如連網門鈴(如 ring.com)等裝置與連網的煙霧偵測器(例如 Nest Protect 煙霧與一氧化碳警報)目前都已上市可供消費者選購,它們結合了語音與視覺的感測器融合功能以及運動檢測。有了連網的煙霧偵測器,裝置在偵測到煙霧或一氧化碳時,可以發出語音警告。
終端 AI 為強化這些能力提供了全新機會,而且常常結合震動(動作)、視覺與語音控制。例如,增加姿態辨識來控制例如電視等家電,或是把語音控制嵌入白色家電,即是以最低成本強化功能性最直接的方式。
健康照護
用來發現醫護資訊的 AI 驅動終端裝置的應用,將為病況的治療與診斷,提供更多的價值。這種資訊可能是資料,也可能是影像、影片以及說出的話,我們可以透過 AI 進行型態與診斷分析。這些資料將引發全新、更有效的治療方法,為整個產業節省成本。受惠於終端 AI 的進展,像 Google Duplex 等語音系統的複雜性將會降低。例如門診預約等勞力密集的工作,也可以轉換成 AI 活動。利用自然語言語音來延伸 AI 的使用,也可以把 AI 用在第一線的病人診斷,然後再由醫師接手提供諮詢。
其他健康照護實例包括像 Wewalk5 等物件,這是一個供半盲與全盲人員使用的智慧拐杖。它使用感測器來檢測胸口水平以上的物件,並搭配 Google Maps 與 Amazon Alexa 等 app,方便使用者提出問題。
結論
由於連網的終端裝置數量越來越多,這個世界也越來越複雜。連接到網際網路的裝置已經超過 300 億個,而微控制器的數量也超過 2,500 億,每年還會增加約 300 億個。越來越多的程序開始進行自動化,不過,把大量資料傳送到雲端涉及的延遲以及邊緣運算的額外費用,意味著許多全新、令人興奮且引人矚目的物聯網使用場景,可能無法開花結果。
解決這些挑戰的答案,並不是為雲端資料中心持續增添運算力。降低出現在邊緣的延遲雖然會有幫助,但不會解決日益分散的世界的所有挑戰。我們需要把智能應用到基礎架構中。
儘管為終端裝置增添先進的運算能力在十年前仍不可行,TinyML 技術近來的提升,已經讓位處相當邊緣的裝置 (也就是終端本身)增添智能的機會大大改觀。在終端增加運算與人工智慧能力,可以讓我們在源頭搜集到更多更具關聯性與相關的資訊。隨著裝置與資料的數量持續攀升,在源頭掌握情境化與具關聯性的資料,具有極大的價值,並將開啟全新的使用場景與營收機會。
終端裝置的機器學習,可以促成全新的終端 AI 世界。新的應用場景正在崛起,甚至跳過傳送大量資料的需求,因而紓解資料傳輸的瓶頸與延遲,並在各種作業環境中創造全新機會。終端 AI 將為我們開啟一個充滿全新機會與應用場景的世界,其中還有很多我們現在想像不到的機會。
附圖:圖1:從集中式到分散式運算的轉變。
(資料來源:《The End of Cloud Computing》,by Peter Levine,Andreessen Horowitz)
圖2:全球上網裝置安裝量。
(資料來源:Strategy Analytics)
圖3:深度學習流程。
圖4:MCU的視覺、震動與語音。
(資料來源:意法半導體)
圖5:AI 工具集執行模型轉換,以便在MCU上執行經最佳化的神經網路推論。
(資料來源:意法半導體)
圖6:物聯網企業對企業應用的使用-目前與未來。
(資料來源:Strategy Analytics)
圖7:促成情境感知的感測器融合。
(資料來源:恩智浦半導體)
資料來源:https://www.eettaiwan.com/20210303nt31-the-dawn-of-endpoint-ai-bringing-compute-closer-to-data/?fbclid=IwAR0JTRpNsJUl-DmSNpfIcymGQpkQaUgXixEaczwDpELxGCaCeJpkTyoqUtI
健身環離線模式 在 筆記女王Ada Facebook 的最讚貼文
又有一本介紹如何列待辦清單的好書上市囉!
值得大家去買來看。
http://www.books.com.tw/products/0010740326
------------------------------------------------------------------
待辦清單2.0
待辦事項總是亂序到達,根據情境列出優先
想一下生活中的各種情境,哪些對你有利的,又受限於哪些?想在不同的環境下提升工作效率,首先,要建立基本概念,理解不同的情境會產生什麼影響,進而在這些情境下,找出能做、應該做的事。
最常見的工作方式是根據事前排定的優先順序,來決定當下要做什麼。但這種方式並不理想,因為優先順序其實是一種二分法,代表在當下某件事是你唯一能做的事。如果是回家作業,按照順序處理應該沒什麼問題。然而,現代的工作就不同了,訊息和任務常以亂序送達。你的注意力會在大量的、一次湧進的、性質不同的資訊流間跳來跳去,有時候資訊內容還會彼此衝突。
因此,最好的做法是,根據當下的情境,先挑出可以執行的工作,並在所有可以執行的事項中,再決定要做什麼。養成這項習慣後,就能根據情境選擇要做的事,你將從有效率(妥善運用資源)變得有效能(達成目標)。它可以幫你更加善用時間,不管是時間充裕或情況緊急時,都能適當的應對。
什麼環境,適合什麼工作,列出來
回溯到2000年代,用資訊流的方式比較容易解釋「情境背景」(Context)。對大多數人而言,那時的電腦就是放在桌上,「上線」和「離線」是明顯不同的狀態。所以只要根據現有的工具和資源,就能定義出各項環境。以下是從2006年開始,我會工作的各種環境:
‧家裡。
‧電腦前:上線。
‧電腦前:離線。
‧電話中。
‧咖啡廳。
‧圖書館。
‧超市。
‧書店。
‧公車上。
‧火車上。
如今,這個分類已經失效了。有時候,我只能在咖啡廳待十分鐘,但有時候卻會對咖啡沉思好幾個小時。也有可能是都待在圖書館,上午能非常專注,但午餐後卻容易分心、心不在焉。所以不能只以地點和實物來定義工作情境。
更何況,科技也模糊了虛、實體的界線,像即使在火車上,還是能像以前坐在辦公桌前一樣,用智慧型手機,就能直接採買每週補充一次的日用品;在公車上能發送郵件,或在健身房聽有聲書。假如你願意,甚至可以在泡澡時參加視訊會議!
當這些界線一一被打破後,這些情境還值得定義嗎?我反倒相信,環境比起從前更加重要了,因為能做的工作變得越來越含糊,就更需要清楚的區分,才會知道什麼時候更適合做什麼工作。雖然科技的威力越來越強、也越來越友善,我們卻要更拚命的工作、工時更長、方法更愚蠢。所以,清楚的區分出當下的情境,知道自己是「不,我不應該現在做這件事」,而不是「不,我沒辦法做這件事」。它會歷經兩個階段的決策:
‧認知情境。意思是去細細檢視生活中的各種狀況,藉此定義出自己所處的環境,正確理解這些環境如何影響工作。
‧任何情境下,都能迅速找出自己能做的事。
情境不單指地點,有三要素
在此,我得先合理定義這裡所說的「情境」,以便讓你理解它和環境的關聯和區別。所謂情境就是空間、時間和想法架構出來的特定情況。想像它們是三角形的三個頂點,各頂點間有直線相連。
時間和空間——決定了資源可利用性
時間和空間是兩大變數,決定了你手邊的資源是否可用。例如,在某段時間內,手邊有筆記本和參考資料可以用來工作,那就是處在資源可利用性高的環境。相反的,若是你要採訪某位專家學者,手中只有筆記本和資料,就是處在資源可利用性低的環境。
時間和空間也決定了,該情境是固定的還是彈性的。像是,你得前往「一家」銀行辦點事,還是「某家」銀行?情境不相同,要處理的事就不一樣,因為你可以在任一家分行存支票,但要和某家銀行的經理會面,就必須前往特定位置。
空間和想法——決定專注力高低
空間和想法決定了專注力有多高。我常常發現不同的地點,會引導我做不同的工作。像是在家完全沒辦法工作,因為家這個場所較適合執行低專注力的任務,和快速瀏覽資訊。如果有任何要緊的工作,就得到圖書館或咖啡廳。
你的想法和心情也會影響能做的工作,例如開心或情緒不佳,再加上場所的合適性,便會強烈影響你對某項任務或工作計畫有多專注。
待處理想法多寡和時間完整程度——決定創造力高低
你能花多少時間在某個環境工作,通常會深受那個空間的穩定性影響,如果周遭的事物會讓人感覺干擾,一大段完整的時間就會被切割成許多小片段,那麼肯定會影響工作成果。對於開放式創作,一段穩定、不受干擾的時間是最重要的,但你所處理的資訊本身變動性如何(含有多少資訊種類)也極為重要。
也就是說,一項趣味十足、侃侃而談、喝酒助興的活動,應該會比焦慮、專注的思考活動,包含更多樣化的資訊。空間穩定性和資訊量共同決定了創作類型是開放式,還是封閉式。
在不同的空間、時間和想法下,資源的可用性、注意力和創作模式各有什麼含義?
舉例來說,在辦公室時,你的時間會因為有人來電,而被切割成小片段,而在書房或通勤時就能保有完整的一段時間。此外在某些情境之下,你的心境會比較輕鬆,所以多話又富有創意,但在另外一種情境下,則感到較封閉、一板一眼。
舉個具體的例子,在某些常見的場所,例如去隨便一家銀行,你可以迅速完成不用思考的工作,像是存款或領錢。但是在某家特定的銀行,則會有較複雜的工作,如召開嚴謹的會議。
三角架構能幫你解讀情境,為所處的情境找出最適合做的事,但你不一定要用到三角架構的所有細節。對於以三角架構分析,大家常會感到安心,要不然就是有點緊張,覺得這個圖形太複雜了。假如你是後者,別擔心,只需要依據自己的工作量、彈性和能力,來判斷應該做什麼事。
如果你在工作時不受情緒影響,或不管在任何場所,工作品質都一致,當然就不需要用到三角架構中的所有元素。假如你不確定,是否需要考慮三角架構裡的每項變數,可以從簡單幾點開始。
首先,為了幫你分類什麼情境下適合做什麼工作,請回想過去這一星期,你曾經處在哪些不同的環境下,當時的空間、時間和想法如何?細想下列每一項變數:
位置
‧這個情境受限於某個地點,或可以定義為某個位置嗎?
‧這個位置怎麼影響你的心情?
心情
‧當時你覺得愉快,還是充滿負面情緒?
‧對當時正在做的工作,覺得順利嗎?
‧你想做這件事嗎?
‧當時是放鬆、樂於交際,或是封閉、有壓力?
創作種類
‧細想當時的環境,可以發現資訊產出豐富的環境,像是圖書館、廣場、咖啡廳及畫廊,有助於開放式創作。反之,沉悶、資訊貧乏的環境沒有太多外在刺激,就較適合封閉式創作。