關於 google物件辨識，我們在網路上蒐集到這些相關的討論、資訊與評價

「google物件辨識」的推薦目錄：

關於google物件辨識在台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文
關於google物件辨識在 iThome Facebook 的精選貼文
關於google物件辨識在台灣物聯網實驗室 IOT Labs Facebook 的最佳解答

關於google物件辨識在コバにゃんチャンネル Youtube 的最佳解答
關於google物件辨識在大象中醫 Youtube 的最讚貼文
關於google物件辨識在大象中醫 Youtube 的精選貼文

google物件辨識在台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文

2021-03-08 18:09:20 有 1 人按讚

迎接終端AI新時代：讓運算更靠近資料所在

作者 : Andrew Brown，Strategy Analytics
2021-03-03

資料/數據(data)成長的速度越來越快。據估計，人類目前每秒產出1.7Mb的資料。智慧與個人裝置如智慧型手機、平板電腦與穿戴式裝置不但快速成長，現在我們也真正目睹物聯網(IoT)的成長，未來連網的裝置數量將遠遠超越地球的人口。

這包括種類繁多的不同裝置，像是智慧感測器與致動器，它們可以監控從震動、語音到視覺等所有的東西，以及幾乎大家可以想像到的所有東西。這些裝置無所不在，從工廠所在位置到監控攝影機、智慧手錶、智慧家庭以及自主性越來越高的車輛。隨著我們企圖測量生活週遭數位世界中更多的事物，它們的數量將持續爆炸性成長。

資料爆量成長，讓許多企業把資料從內部部署運作移到雲端。儘管集中到雲端運算的性質，在成本與資源效率、彈性與便利性有它的優點，但也有一些缺點。由於運算與儲存在遠端進行，來自終端、也就是那些在網路最邊緣裝置的資料，需要從起始點經過網際網路或其他網路，來到集中式的資料中心(例如雲端)，然後在這裡處理與儲存，最後再傳回給用戶。

對於一些傳統的應用，這種方式雖然還可以接受，但越來越多的使用場景就是無法承受終端與雲端之間，資訊被接力傳遞產生的延遲。我們必須即時做出決策，網路延遲要越小越好。基於這些原因，開始有人轉向終端運算；越來越多人轉而使用智慧終端，而去中心化的程度也越來越高。此外，在這些即時應用中產生的龐大資料量，意味著處理與智慧必須在本地以分散的方式進行。

與資料成長連袂而來的，是人工智慧與機器學習(ML)也朝終端移動，並且越來越朝終端本身移動。大量來自真實世界的資訊，需要用ML的方式來進行詮釋與採取行動。透過AI與ML，是以最小的延遲分析影像、動作、影片或數量龐大的資料，唯一可行且合乎成本效益的方式。運用AI與ML的演算法與應用將在邊緣運作，在未來還將會直接在終端裝置上進行。

資料正在帶動從集中化到分散化的轉變

隨著資訊科技市場逐漸發展與成熟，網路的設計以及在其運作的所有裝置，也都跟著進化。全盛時期從服務數千個小型客戶端的主機，一直到客戶端伺服器模型中使用的越來越本地化的個人電腦運算效能，基礎架構持續重組與最佳化，以便更貼近網路上的裝置以及符合運作應用的需求。這些需求包含檔案存取與資料儲存，以及資料處理的需求。

智慧型手機與其他行動裝置的爆炸性成長，加上物聯網的快速成長，促使我們需要為如何讓資產進行最佳的部署與安排進行評估。而影響這個評估的因素，包括網路的可用性、安全性、裝置的運算力，以及把資料從終端傳送到儲存設備的相關費用，近來也已轉向使用分散式的運算模型。

從邊緣到終端：AI與ML改變終端典範

在成本、資源效率、彈性與便利性等方面，雲端有它的優點，裝置數量的急遽增加(如圖2)，將導致資料產出量大幅增加。這些資料大部份都相當複雜且非結構化的，這也是為何企業只會分析1%~12% 的資料的原因之一。把大量非結構化的資料送到雲端的費用相當高、容易形成瓶頸，而且從能源、頻寬與運算力角度來看，相當沒有效率。

在終端執行進階處理與分析的能力，可協助為關鍵應用降低延遲、減少對雲端的依賴，並且更好地管理物聯網產出的巨量資料。

終端AI：感測、推論與行動

在終端部署更多智慧的主要原因之一，是為了創造更大的敏捷性。終端裝置處於網路的最邊緣與資料產生的地方，可以更快與更準確地做出回應，同時免除不必要的資料傳輸、延遲與資料移動中的安全風險，可以節省費用。

處理能力與神經網路的重大進展，正協助帶動終端裝置的新能力，另一股驅動力則是對即時資訊、效率(傳送較少的資訊到雲端)、自動化與在多數情況下，對近乎即時回應的需求。這是一個三道步驟的程序：傳送資料、資料推論(例如依據機器學習辨識影像、聲音或動作)，以及採取行動(如物件是披薩，冰箱的壓縮機發出正常範圍外的聲音，因此發出警告)。

感測

處理器、微控制器與感測器產生的資料量相當龐大。例如，自駕車每小時要搜集25GB的資料。智慧家庭裝置、智慧牙刷、健身追蹤器或智慧手錶持續進化，並且與以往相比，會搜集更多的資料。

它們搜集到的資料極具價值，但每次都從各個終端節點把資料推回給雲端，數量又會過多。因此必須在終端進行處理。倘若部份的作業負載能在終端本身進行，就可以大幅提升效率。

推論

終端搜集到的資料是非結構性的。當機器學習從資料擷取到關聯性時，就是在進行推論。這表示使用AI與ML工具來幫忙訓練裝置辨識物件。拜神經網路的進展之賜，機器學習工具越來越能訓練物件以高度的精準度辨識影像、聲音與動作，這對體積越來越小的裝置，極為關鍵。

例如，圖4顯示使用像ONNX、PyTorch、Caffe2、Arm NN或 Tensorflow Lite 等神經網路工具，訓練高效能的意法半導體(ST)微控制器(MCU)，以轉換成最佳化的程式碼，讓MCU進行物件辨識(這個的情況辨識對象是影像、聲音或動作)。更高效能的MCU越來越常利用這些ML工具來辨識動作、音訊或影像，而且準確度相當高，而我們接下來馬上就要對此進行檢視。這些動作越來越頻繁地從邊緣，轉移到在終端運作的MCU本身。

行動

資料一旦完成感測與推論後，結果就是行動。這有可能是回饋簡單的回應(裝置是開啟或關閉)，或針對應用情況進行最佳化(戴耳機的人正在移動中，因此會針對穩定度而非音質進行最佳化)，或是回饋迴路(根據裝置訓練取得的機器學習，輸送帶若發出聲音，顯示它可能歪掉了)。物聯網裝置將會變得更複雜且更具智慧，因為這些能力提升後，運算力也會因此增加。在我們使用新的機器學習工具後，一些之前在雲端或終端完成的關鍵功能，將可以移到終端本身的內部進行。

終端 AI：千里之行始於足下

從智慧型手機到車輛，今日所有電子裝置的核心都是許多的處理器、微控制器與感測器。它們執行各種任務，從最簡單到最複雜，並需要各式各樣的能力。例如，應用處理器是高階處理器，它們是為行動運算、智慧型手機與伺服器設計；即時處理器是為例如硬碟控制、汽車動力傳動系統，與無線通訊的基頻控制使用的非常高效能的處理器，至於微控制器處理器的矽晶圓面積則小了許多，能源效率也高出很多，同時擁有特定的功能。

這意味著利用ML工具訓練如MCU等較不複雜元件來執行的動作，之前必須透過威力更強大的元件才能完成，但現在邊緣與雲端則是理想的場所。這將讓較小型的裝置以更低的延遲執行更多種類的功能，例如智慧手錶、健康追蹤器或健康照護監控等穿戴式裝置。

隨著更多功能在較小型的終端進行，這將可以省下資源，包括資料傳輸費用與能源費用，同時也會產生極大的環境衝擊，特別是考量到全球目前已有超過200億台連網裝置，以及超過2,500億顆MCU(根據Strategy Analytics統計數據)。

TinyML、MCU與人工智慧

根據Google的TesnsorFlow 技術主管、同時也是深度學習與TinyML領域的指標人物 Pete Warden 表示：「令人相當興奮的是，我還不知道我們將如何使用這些全新的裝置，特別是它們後面代表的科技是如此的吸引人，我無法想像那些即將出現的全新應用。」

微型機器學習(TinyML)的崛起，已經催化嵌入式系統與機器學習結合，而兩者傳統上大多是獨立運作的。TinyML 捨棄在雲端上運作複雜的機器學習模型，過程包含在終端裝置內與微控制器上運作經過最佳化的模式識別模型，耗電量只有數毫瓦。

物聯網環境中有數十億個微型裝置，可以為各個產業提供更多的洞察與效率，包括消費、醫療、汽車與工業。TinyML 獲得 Arm、Google、Qualcomm、Arduino等業者的支持，可望改變我們處理物聯網資料的方式。

受惠於TinyML，微控制器搭配AI已經開始增添各種傳統上威力更強大的元件才能執行的功能。這些功能包括語音辨識(例如自然語言處理)、影像處理(例如物件辨識與識別)，以及動作(例如震動、溫度波動等)。啟用這些功能後，準確度與安全性更高，但電池的續航力卻不會打折扣，同時也考量到各種更微妙的應用。

儘管之前提到的雲端神經網路框架工具，是取用這個公用程式最常用的方法，但把AI函式庫整合進MCU，然後把本地的AI訓練與分析能力插入程式碼中也是可行的。這讓開發人員依據從感測器、麥克風與其他終端嵌入式裝置取得的訊號導出資料模式，然後從中建立模型，例如預測性維護能力。

如Arm Cortex-M55處理器與Ethos U55微神經處理器(microNPU)，利用CMSIS-DSP與CMSIS-NN等常見API來簡化程式碼的轉移性，讓MCU與共同處理器緊密耦合以加速AI功能。透過推論工具在低成本的MCU上實現AI功能並符合嵌入式設計需求極為重要，原因是具有AI功能的MCU有機會在各種物聯網應用中轉變裝置的設計。

AI在較小型、低耗電與記憶體受限的裝置中可以協助的關鍵功能，我們可以把其精華歸納至我們簡稱為「3V」的三大領域：語音(Voice，如自然語言處理)、視覺(Vision，如影像處理)以及震動(Vibration，如處理來自多種感測器的資料，包括從加速計到溫度感測器，或是來自馬達的電氣訊號)。

終端智慧對「3V」至關重要

多數的物聯網應用聚焦在一些特定的領域：基本控制(開/關)、測量(狀態、溫度、流量、噪音與震動、濕度等)、資產的狀況(所在地點以及狀況如何？)，以及安全性功能、自動化、預測性維護以及遠端遙控(詳見圖 6)。

Strategy Analytics的研究顯示，許多已經完成部署或將要部署的物聯網B2B應用，仍然只需要相對簡單的指令，如基本的開/關，以及對設備與環境狀態的監控。在消費性物聯網領域中，智慧音箱的語音控制AI已經出現爆炸性成長，成為智慧家庭指令的中樞，包括智慧插座、智慧照明、智慧攝影機、智慧門鈴，以及智慧恆溫器等。消費性裝置如藍牙耳機現在已經具備情境感知功能，可以依據地點與環境，在音質優先與穩定度優先之間自動切換。

如同我們檢視的結果，終端AI可以在「3V」核心領域提供價值，而它觸及的許多物聯網領域，遍及B2B與B2C的應用：

震動：包含來自多種感測器資料的處理，從加速計感測器到溫度感測器，或來自馬達的電氣訊號。
視覺：影像與影片辨識；分析與識別靜止影像或影片內物件的能力。
語音：包括自然語言處理(NLP)、瞭解人類口中說出與寫出的語言的能力，以及使用人類語言與人類交談的能力-自然語言產生(NLG)。
垂直市場中有多種可以實作AI技術的使用場景：

震動

可以用來把智慧帶進MCU中的終端AI的進展，有各式各樣的不同應用領域，對於成本與物聯網裝置與應用的效用，都會帶來衝擊。這包括我們在圖6中點出的數個關鍵物聯網應用領域，包括：

溫度監控；
壓力監控；
溼度監控；
物理動作，包括滑倒與跌倒偵測；
物質檢測(漏水、瓦斯漏氣等) ；
磁通量(如鄰近感測器與流量監控) ；
感測器融合(見圖7)；
電場變化。

一如我們將在使用場景單元中檢視的，這些能力有許多可以應用在各種被普遍部署的物聯網應用中。

語音

語音是進化的產物，也是人類溝通非常有效率的方式。因此我們常常想要用語音來對機器下指令，也不令人意外；聲音檢測是持續成長的類別。語音啟動在智慧家庭應用中很常見，例如智慧音箱，而它也逐漸成為啟動智慧家庭裝置與智慧家電的語音中樞，如電視、遊戲主機與其他新的電器。

在工業環境中，供車床、銑床與磨床等電腦數值控制(CNC)機器使用的電腦語音引擎正方興未艾。iTSpeex的ATHENA4是第一批專為這些產品設計的語音啟動作業系統。這些產品往往因為安全原因，有離線語音處理的需求，因此終端 AI 語音發展在這裡也創造出有趣的機會。用戶可以指示機器執行特定的運作，並從機器手冊與工廠文件，立即取用資訊。

語音整合在車輛中也相當關鍵。OEM 代工廠商持續對車載娛樂系統中的語音辨識系統，進行大量投資。語音有潛力成為最安全的輸入模式，因為它可以讓駕駛的眼睛持續盯著道路，而雙手仍持續握著方向盤。

對於使用觸控螢幕或硬體控制器通常需要多道步驟的複雜任務，語音辨識系統特別能勝任。這些任務包括輸入文字簡訊、輸入目的地、播放特定歌曲或歌曲子集，以及選擇廣播電台頻道。其他的服務包含如拋錨服務(或bCall)與禮賓服務。

視覺

正如我們之前已經檢視過，終端 AI 提供視覺領域全新的機會，特別是與物件檢測及辨識相關。這可能包括觀察生產線的製造瑕疵，以及找出自動販賣機需要補貨的庫存。其他實例包括農業應用，例如依據大小與品質為農產品分級。

曳引機裝上機器視覺攝影機後，我們幾乎可以即時檢測出雜草。雜草冒出後，AI可以分類雜草並估算它對農產收穫的潛在威脅。這讓農民可以鎖定特定的雜草，並打造客製的除草解決方案。機器視覺然後可以檢測除草劑的效用，並找出農地中仍具抗藥性的殘餘雜草。

使用場景

預測性維護工具已經從擷取與比較震動的量測資料，進化到提出即時的資產監控。藉由連接物聯網感測器裝置與維護軟體，我們也可能做到遠端監控。

震動分析

這種類型的預測性維護在旋轉型機器密集的製造工廠裡，相當常見。震動分析可以揭露鬆脫、不平衡、錯位與軸承磨損等狀況。例如，把震動計量器接上靠近選煤廠離心泵浦內部承軸處，就可以讓工程師建立起正常震動範圍的基線。超出這個範圍的震動，可能顯示滾珠軸承出現鬆動，需要更換。

磁感測器融合

磁感測器利用磁性浮筒與一系列可以感應並與液體表面一起移動的感測器，測量液面的高低。所有的這些應用都使用一個固定面上的磁感測器，它與附近平面的磁鐵一起作動，與這個磁鐵相對應的感測器也會移動。

聲學分析(聲音)

與震動分析相似，聲測方位分析也是供潤滑技師使用，主要是專注在主動採取潤滑措施。這意味我們可以避免移動設備時產生的過度磨損，否則會為了修理造成代價高昂的停機。實際的例子可能包括測量輸送皮帶的承軸狀況。出現過度磨損時，承軸會因為潤滑不足或錯位出現故障，可能造成整個生產流程的中斷。

聲學分析(超音波)

聲音聲學分析雖然可以用來進行主動與預測性維護，超音波聲學分析卻只能用於預測性維護。它可以在超音波範圍內找出與機器摩擦及壓力相關的聲音，並使用在會發出較細微聲音的電氣設備與機器設備。我們可以說這一類型的分析與震動或油量分析相比，更可以預測即將出現的故障。目前它部署起來比其他種類的預防性維護花費較高，但終端 AI 的進展可以促成這種細微層級的聲學檢測，大幅降低部署的費用。

熱顯影

熱顯影利用紅外線影像來監控互動機器零件的溫度，讓任何異常情況很快變得顯而易見。具備終端 AI 能力的裝置，可以長期檢測微細的變化。與其他對事故敏感的監視器一樣，它們會觸發排程系統，自動採取適當的行動來預防零件故障。

消費者與智慧家庭

將語音運用在消費者與智慧家庭，是最常看到的場景之一。這包括智慧型手機與平板電腦上、未包含電話整合功能的裝置，例如螢幕尺寸有限的穿戴式裝置。這類型的裝置包含智慧手錶與健康穿戴式裝置，可以為各種功能提供免動手的語音啟動。像 Amazon 的 Echo 或 Google 的 Home 等智慧音箱市場的成長，說明消費者對於可接收與提供語音互動等現有裝置的強勁需求，與日俱增。

消費者基於各種理由使用智慧音箱，最常見的使用場景為：

聽音樂；
控制如照明等智慧家庭裝置；
取得新聞與天氣預報的更新；
建立購物與待辦事項清單。

除了像智慧音箱與智慧電視等消費裝置，智慧家庭裝置語音的使用，也顯現相當的潛力。諸如連網門鈴(如 ring.com)等裝置與連網的煙霧偵測器(例如 Nest Protect 煙霧與一氧化碳警報)目前都已上市可供消費者選購，它們結合了語音與視覺的感測器融合功能以及運動檢測。有了連網的煙霧偵測器，裝置在偵測到煙霧或一氧化碳時，可以發出語音警告。

終端 AI 為強化這些能力提供了全新機會，而且常常結合震動(動作)、視覺與語音控制。例如，增加姿態辨識來控制例如電視等家電，或是把語音控制嵌入白色家電，即是以最低成本強化功能性最直接的方式。

健康照護

用來發現醫護資訊的 AI 驅動終端裝置的應用，將為病況的治療與診斷，提供更多的價值。這種資訊可能是資料，也可能是影像、影片以及說出的話，我們可以透過 AI 進行型態與診斷分析。這些資料將引發全新、更有效的治療方法，為整個產業節省成本。受惠於終端 AI 的進展，像 Google Duplex 等語音系統的複雜性將會降低。例如門診預約等勞力密集的工作，也可以轉換成 AI 活動。利用自然語言語音來延伸 AI 的使用，也可以把 AI 用在第一線的病人診斷，然後再由醫師接手提供諮詢。

其他健康照護實例包括像 Wewalk5 等物件，這是一個供半盲與全盲人員使用的智慧拐杖。它使用感測器來檢測胸口水平以上的物件，並搭配 Google Maps 與 Amazon Alexa 等 app，方便使用者提出問題。

結論

由於連網的終端裝置數量越來越多，這個世界也越來越複雜。連接到網際網路的裝置已經超過 300 億個，而微控制器的數量也超過 2,500 億，每年還會增加約 300 億個。越來越多的程序開始進行自動化，不過，把大量資料傳送到雲端涉及的延遲以及邊緣運算的額外費用，意味著許多全新、令人興奮且引人矚目的物聯網使用場景，可能無法開花結果。

解決這些挑戰的答案，並不是為雲端資料中心持續增添運算力。降低出現在邊緣的延遲雖然會有幫助，但不會解決日益分散的世界的所有挑戰。我們需要把智能應用到基礎架構中。

儘管為終端裝置增添先進的運算能力在十年前仍不可行，TinyML 技術近來的提升，已經讓位處相當邊緣的裝置 (也就是終端本身)增添智能的機會大大改觀。在終端增加運算與人工智慧能力，可以讓我們在源頭搜集到更多更具關聯性與相關的資訊。隨著裝置與資料的數量持續攀升，在源頭掌握情境化與具關聯性的資料，具有極大的價值，並將開啟全新的使用場景與營收機會。

終端裝置的機器學習，可以促成全新的終端 AI 世界。新的應用場景正在崛起，甚至跳過傳送大量資料的需求，因而紓解資料傳輸的瓶頸與延遲，並在各種作業環境中創造全新機會。終端 AI 將為我們開啟一個充滿全新機會與應用場景的世界，其中還有很多我們現在想像不到的機會。

附圖：圖1：從集中式到分散式運算的轉變。
(資料來源：《The End of Cloud Computing》，by Peter Levine，Andreessen Horowitz)
圖2：全球上網裝置安裝量。
(資料來源：Strategy Analytics)
圖3：深度學習流程。
圖4：MCU的視覺、震動與語音。
(資料來源：意法半導體)
圖5：AI 工具集執行模型轉換，以便在MCU上執行經最佳化的神經網路推論。
(資料來源：意法半導體)
圖6：物聯網企業對企業應用的使用-目前與未來。
(資料來源：Strategy Analytics)
圖7：促成情境感知的感測器融合。
(資料來源：恩智浦半導體)

資料來源：https://www.eettaiwan.com/20210303nt31-the-dawn-of-endpoint-ai-bringing-compute-closer-to-data/?fbclid=IwAR0JTRpNsJUl-DmSNpfIcymGQpkQaUgXixEaczwDpELxGCaCeJpkTyoqUtI

Tags: google物件辨識

台灣物聯網實驗室 IOT Labs

About author

本專頁將不定時網羅搜集國內外與物聯網相關新聞及技術，並無條件與 IOT 從業人員或對物聯網有興趣的大眾分享，若有任何不足或建議之處，歡迎隨時留言，一起研究研究。^.^

google物件辨識在 iThome Facebook 的精選貼文

By iThome

2020-08-26 19:00:15 有 7 人按讚

不少人工智慧應用需要使用資料集，才能完成訓練與測試模型，但Google普查網際網路上的資料集，發現其中只有1成擁有數位物件辨識碼（DOI），資料集重用的方便性仍不足
https://www.ithome.com.tw/news/139611

Tags: google物件辨識

iThome

About author

iThome Online 是臺灣第一個網路原生報，提供IT產業即時新聞、企業IT產品報導與測試、技術專題、IT應用報導、IT書訊，以及面向豐富的名家專欄。

IT職場必備第一手的IT產品情報、企業科技趨勢、IT技術動向、資訊管理心法，通通都在iThome

google物件辨識在台灣物聯網實驗室 IOT Labs Facebook 的最佳解答

By 台灣物聯網實驗室 IOT Labs

2020-02-07 22:10:10 有 1 人按讚

AI機器人將如何顛覆製造業？

面對AI機器人帶來的破壞式創新，台灣製造業該怎麼把握機會，在自動化典範轉移的亂局中，占有一席之地？

Bastiane Huang
Feb 6 · 1

在先前Robotics 2.0系列文章中，我們討論了AI如何讓機器人做到過去做不到的靈巧工作，並能夠開始自主學習。第一篇文章介紹了AI如何開啟Robot2.0時代。第二篇文章則描述AI機器人在倉儲運輸業的應用，透過觀察這個新技術的第一個應用場景，來預測這一切將如何影響我們的生產力、就業狀況以及日常生活。

這篇文章我們將聚焦目前大量運用傳統機器手臂及自動化設備，同時占台灣產值最高（30%）的製造業。具有自主學習能力而且靈巧的AI機器人，將如何影響製造業流程及整體產業結構？供應鏈上的各廠商又該如何因應Robotics 2.0帶來的破壞性創新？

「未來已經到來，只是先被一部分人看見。」 — 作家威廉．吉布森

The future is already here — it’s just not very evenly distributed. — William Gibson

製造業自動化現況

根據國際機器人聯合會（IFR）發布的最近報告，全球工業機器手臂的出貨量在2018年創下新紀錄，來到38萬4,000台。其中中國仍是最大市場（占比35%)，接著是日本，美國，台灣排名全球第六。

汽車以及電子製造業依然是工業手臂的最大應用市場（占比60%)，遠遠領先其他包含金屬，塑膠及食品等產業。具體原因我們在第一篇文章也討論過，由於傳統機器人和電腦視覺的限制，目前除汽車業和電子業以外，倉儲、農業和其他產業幾乎都還沒開始使用機械手臂。而這樣的情形將會被AI機器人及深度學習等新技術所改變。看到這裡，你可能會想：自動化及工業機器手臂在製造業既然已經有幾十年的歷史，該自動化或可以被自動化的部分應該都已經自動化了，還有什麼創新的空間呢？

出乎意料地，就連自動化程度最高的汽車製造業，離所謂的全自動化關燈工廠（lights out factory）也還有很大一段距離。舉例來說，汽車組裝的部分大多依然是由人工來完成。這也是車廠最勞力密集的部分，平均一間汽車工廠裡有3分之2的員工都在裝配車間。就連一向追求革新與顛覆，主張追求最高自動化的特斯拉執行長馬斯克，都不得不公開承認，特斯拉生產線自動化的進度不如預期。

究竟為什麼自動化這麼困難？

自動化至今無法跨越的技術限制

現今的自動化生產線普遍為大量生產設計，因此能有效降低成本，但也因此缺乏彈性。面對消費者越來越短的產品生命週期，越來越多的少量多樣客製化生產需求，人類往往比機器人更能夠因應新的產品線，也不需要花費很多時間去重新編寫程式或更改製造工序。

1. 靈巧度與複雜度

儘管科技在快速進步，人類還是比機器人靈巧許多。在訪談電子代工廠商的過程中發現，儘管組裝產品（assembly）已經高度自動化，但備料（kitting）的程序還是必須由人來完成。

備料在製造及倉儲業都很普遍，是提高生產效率的重要步驟。指的是把組裝產品需要的各個零散部件集合起來，打包並放置在工具包（kit）的過程。之後機器人再從工具包中拿取各個零件並進行組裝作業，這時候因為各個零件都在一個固定的位置和角度，自動化編程相對容易。相反地，備料時必須從雜亂無序的零件盒中辨識並拿取零件，零件的位置角度不一，甚至可能重疊或纏繞在一起，這對現有的機器視覺及機器人技術都是一項挑戰。

2. 視覺與非視覺性的回饋

另外一方面，很多複雜的裝配作業需要靠作業員的經驗或「感覺」。不論是安裝汽車座椅或是將零件放入工具包裡，這些看似簡單的動作，事實上都需要作業員或機器人接收，並根據各種視覺甚至觸覺訊號，來調整動作的角度及力道。

這些精細的微調使得傳統的自動化編程幾乎派不上用場，因為每次撿取或放置物品都不完全相同，需要像人一樣有從多次的嘗試當中，自主學習歸納的能力，而這正是機器學習，特別是深度及強化學習，能夠帶給機器人的最大改變。

Robotics 2.0：AI可以讓工廠機器人做到哪些事？

AI帶給機器手臂最大的改變就是：以往機械手臂只能重複執行工程師編寫程序，雖然精準度及速度都很高，但卻無法應對任何環境或製程改變。但是現在因為AI，機器可以自主學習更複雜的任務。具體來說，AI機器人較傳統機械手臂在3大方面有重大突破：

1. 視覺（Vision System）

就算是最高階的3D工業相機，仍然無法像人眼一樣，既可以精準判斷深度距離，又可以辨識透明的包裝、反射表面、或是可變形物體。這也是為什麼很難找到一款相機，既可以提供準確的深度，又能夠辨識大多數的包裝及物品，然而，這樣的情形很快就會被AI改變。

機器視覺在過去幾年取得了巨大的進展，幾間來自於矽谷及波士頓的新創，包括OSARO和Covariant，利用深度學習（deep learning），語意分割（semantic segmentation），及場景理解（scene understanding）提高了低階相機的深度及影像辨識，讓製造商不需要使用昂貴的相機，也能得到足夠準確的影像訊息，成功辨識透明或反射物體包裝。

2. 可擴充性（Scalability）

深度學習不需像傳統機器視覺一樣，需要事先建構每一個物品的3D模型。只需要輸入圖片，經過訓練，人工神經網路就能自動辨識影像中物體。甚至能使用非監督或自監督學習，降低人工標籤數據或特徵的需要，讓機器更近接近人一樣的學習，免去人為干預，讓機器人面對新的零件再也不需要工程師重新編寫程序。隨著機台運作，收集到的數據越來越多，機器學習模型的準確度也會進一步提升。

目前一般生產線通常有震動台、送料器、輸送帶等週邊設備，確保機器人能夠正確拿取需要的部件。如果機器學習再進一步發展，讓機器手臂更加智能，或許有一天這些比機械手臂更昂貴四五倍以上的週邊設備將不再被需要。
另一方面，由於深度學習模型一般儲存在雲端，這也讓機器人能夠互相學習，共享知識。舉例來說，若有一台機器手臂經過一個晚上的嘗試，學會如何組合兩個零件，便能夠很輕易地將這個新的模型更新到雲端，並分享給其他同樣也連結到雲端的機器手臂。這不但省去了其他機器的學習時間，也確保了品質的一致性。

3. 智能放置（Intelligent Placement）

一些對我們來說一點也不困難的指令：請小心輕放，或把物品排列整齊，對機器手臂而言卻是巨大的技術挑戰。
如何定義「小心輕放」？是在物體碰觸到桌面的瞬間停止施力？還是在移動到距離桌面6公分處放手讓物體自然落下？或是越靠近桌面就越降低速度？這些不同的定義又會怎麼樣影響物品放置的速度和精確度？

至於將物品「排列整齊」就更困難了，先不論每個人對整齊的定義都有所不同，為了能將物品精準地放置在想要的位置及角度，我們首先必須要先從正確的位置拿取物品：機械手臂依然不如人手靈巧，且目前一般機器手臂大多使用吸盤或是夾子，要做到人類關節及手指的靈活度，還有一大段距離。

其次我們要能即時判斷夾取物體的角度位置及形狀大小，以下圖的杯子為例，需要知道杯口朝上或朝下，要側放或直放，也要知道放置的地方有沒有其他物品或障礙物，才能判斷將杯子放在哪裡才能最節省空間。我們因為從出生開始就在學習各種取放物品的任務，這些複雜的作業幾乎不加思索就可以完成，但機器並沒有這樣的經驗，必須重新學習。

經由AI，機器手臂可以更精準地判斷深度，還可以透過訓練，學習判斷及做到杯子朝上，朝下等不同狀態。也可以利用對象建模（Object Modeling），或是體素化（Voxelization），來預測及重建3D物體，讓機器可以更準確掌握實際物品的大小和形狀，進一步將物品放到該放的位置。

AI機器人將如何顛覆製造業？

現在我們知道AI可以讓機器做到許多以往做不到的事，但這對製造業現行的產業結構又會有什麼影響？誰能夠把握住新科技典範轉移技術帶來的機會？哪些公司又會面臨前所未有的挑戰？

AI機器人帶來的破壞式創新（Disruptive Innovation）

破壞式創新由哈佛商學院教授克雷頓‧克里斯汀生（Clayton Christensen）在其著作《創新的兩難》（Innovator’s Dilemma）當中提出。理論的中心思想是：
產業中的既有業者一般會為了服務現有客戶（通常也是利潤最高的客群），而選擇專注於「持續式創新」，改善現有的產品及服務。此時，一些資源較少的小公司把握機會，瞄準被忽略的市場需求，而取得進入市場的立足點。
破壞式創新又分為以下兩種：

（1）低階市場創新

一般大家較為熟悉的是「低階市場創新」，數位照相技術就是一例。早期的數位相機不僅解析度不佳，而且還有快門延遲很長的問題，但隨著數位照相品質及解析度逐漸進步，數位相機逐漸從低階市場晉升為主流。諷刺的是，柯達雖然研發出數位相機，但卻因為無法放棄當時該公司占據全球3分之2的底片市場，而最終被新技術淘汰。這正是所謂的「創新的兩難」，既有業者雖然看到新科技的威脅，但卻因為現有公司結構，策略等種種原因無法及時因應。

（2）新市場創新

「新市場創新」則是指新進公司瞄準既有公司尚未服務到的「新市場」進行創新。例如，電話剛推出的時候只能被用來做短距離的本地溝通，因此電報產業當時的領先者Western Union拒絕購買發明家貝爾的專利，因為該公司最賺錢的是長途電報市場，當時甚至不認為短途溝通會是一個市場，更不用說預見後來人人都用電話溝通的情景了。

而AI機器人帶來的，正是「新市場的破壞式創新」！

目前汽車及電子製造業占工業機器手臂出貨量的60%，這也導致市場領先者發那科（FANUC）、ABB、KUKA、安川（YASKAWA）專注於「持續式創新」：做他們最擅長，客戶也最需要的，進一步提高速度及精度。這也使得其他諸如倉儲業、食品製造業，或製造業中的「備料程序」成為被忽略新市場。這些客戶並不需要這麼高速度，高精度的作業，但需要機器手臂更靈活，更能彈性自主學習辨識及處理不同的零件或是工作。

新創AI機器人公司看到這樣未被滿足的需求，開始將人工智慧應用在機器人上，使得機器手臂可以被用在備料，包裝，倉儲等新市場。他們使用較低階的相機搭配機器學習模型，讓以往只能由人工作業的備料，貨物分撿等程序自動化，讓機器手臂可以被運用在更多不同的地方，甚至整個產業。

有趣的是，這些新創公司一般不自行生產機器手臂，而是專注於開發機器學習模型、機器視學及控制軟體，在硬體方面則選擇跟既有機器手臂廠商合作。因此，你可能會想，就算這些機器手臂公司不追求AI創新，他們也不會被時代淘汰，因為自動化還是需要硬體的供應。

但是，這樣想忽略了幾件事：

首先，有些機器手臂公司已經先嗅到了商機，並開始一邊與這些新創公司合作，一邊建立自己的AI團隊。這些公司因為率先採取行動，可以更快地在這些以往服務不到的新市場中建立客群，進一步領先競爭對手。

其次，隨著AI應用的普及，產業鏈中的最大價值，會逐漸由硬體轉向軟體及數據。這點，我們已經可以從無人車的發展趨勢中看出。一但無人車可以做到高度自主，大部分的價值都會在掌握無人車機器學習模型及自駕數據的特斯拉，或Google等公司的手裡。這也是為什麼車廠人人自危，不是積極併購就是跟矽谷的軟體AI新創公司合作。相比起來，機器手臂及製造商對AI技術的接受速度似乎還不及汽車製造商。

AI機器人帶來的挑戰與機會

AI及機器人的結合帶來許多的可能性，但是這些改變絕非一蹴可幾。機器手臂公司縱使開始投資AI，也依然會面臨當初柯達所面臨的「創新者的兩難」。

要如何重新打造組織及發展策略，才能夠讓轉型的負面影響降到最低，也考驗各個公司管理階層的判斷與決心。

另一方面，開發全新市場也絕非簡單的事，新創公司仍需要和製造廠商密切合作，開發更貼合客戶需求的解決方案。製造業的流程甚至比倉儲更複雜多樣，新創公司雖然了解AI及機器人技術，但卻不一定了解製造流程。這也給台灣製造廠商一個搶得先機成長轉型的最佳機會。

如果台灣廠商能夠率先和這些新創公司合作，不僅能透過流程自動化提升生產效率及品質，還能做到以往較難做到的少量多樣客製需求，擺脫大量製造，削價競爭的紅海策略。更可以成為新一代AI機器人的試驗場，和國際新創合作開發針對電子或半導體製造業的專屬解決方案，進而銷售到其他國家。

日前，曾任職於Google與百度的吳恩達（Andrew Ng）受邀來台演講中也指出，台灣應該善用自己在半導體與製造業的既有優勢，發展人工智慧，成為除了矽谷、北京之外的下一個AI Hub。相較於其他像是零售或是消費性網路領域這些現在發展相對成熟的AI應用，台灣在製造產業中發展人工智慧，不但更具有了解應用案例、掌握數據等優勢，也有機會能夠藉由AI機器人等新技術，達到產業轉型的目的。

附圖：KIT工具包 — source: kitting-assembly.ca
深度學習物件辨識範例，由左至右分別為Mask-RCNN, Object Modeling, Grasp Point Prediction。OSARO
傳統及AI機器人創新策略比較 — source: Bastiane Huang
製造業自動化產業鏈- source: Bastiane Huang

資料來源：https://medium.com/marketingdatascience/ai%E6%A9%9F%E5%99%A8%E4%BA%BA%E5%B0%87%E5%A6%82%E4%BD%95%E9%A1%9B%E8%A6%86%E8%A3%BD%E9%80%A0%E6%A5%AD-ee2dbc3db7e4