關於圖形辨識演算法，我們在網路上蒐集到這些相關的討論、資訊與評價

「圖形辨識演算法」的推薦目錄：

關於圖形辨識演算法在吹著魔笛的浮士德 Facebook 的最佳解答
關於圖形辨識演算法在台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
關於圖形辨識演算法在台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文

關於圖形辨識演算法在 YOLOv3 監視器圖形辨識的評價
關於圖形辨識演算法在 OpenCV 程式設計介紹的評價
關於圖形辨識演算法在小吳哥教學中心- TensorFlow+Keras程式設計-----TensorFlow ... 的評價

圖形辨識演算法在吹著魔笛的浮士德 Facebook 的最佳解答

2021-09-30 10:59:55 有 231 人按讚

【Google 幫你解決「那個那個」問題】
　
「啊就那個有沒有，那個啊，黑黑的那個壞掉了啦！」
　
「哪個黑黑的啦？」
　
「就那個啊！你沒看過嗎？黑黑的那個咩！我不知道名字啦！」
　
--
　
Google 在 29 號的「 Search On」活動上發表了整合全新搜尋演算法的「「MUM (Multitask Unified Model)」。
　
MUM 的亮點之一，就是透過圖片與文字搜尋的「Google Lens」圖形辨識技術；使用者只要對著講不出名稱的東西拍照，就會馬上顯示出正確的名字以及你想查詢的東西。
　
以這張範例來說，只要拍一張......這是叫啥？
　
只要拍一張這個腳踏車零件的照片，並說出「怎麼修理」，就會自動帶出修理這東西的結果給你。

Tags: 圖形辨識演算法

吹著魔笛的浮士德

About author

遊戲情報部落格《吹著魔笛的浮士德》之個人粉絲專頁，除分享發表的文章外，也定時提供日、韓、歐美等海外遊戲情報予台、港網友。

遊戲情報部落格《吹著魔笛的浮士德》之經營者，旅居海外，長期關注亞洲?

圖形辨識演算法在台灣物聯網實驗室 IOT Labs Facebook 的精選貼文

By 台灣物聯網實驗室 IOT Labs

2021-07-27 11:56:34 有 1 人按讚

摩爾定律放緩　靠啥提升AI晶片運算力？

作者 : 黃燁鋒，EE Times China
2021-07-26

對於電子科技革命的即將終結的說法，一般認為即是指摩爾定律的終結——摩爾定律一旦無法延續，也就意味著資訊技術的整棟大樓建造都將出現停滯，那麼第三次科技革命也就正式結束了。這種聲音似乎是從十多年前就有的，但這波革命始終也沒有結束。AI技術本質上仍然是第三次科技革命的延續……

人工智慧(AI)的技術發展，被很多人形容為第四次科技革命。前三次科技革命，分別是蒸汽、電氣、資訊技術(電子科技)革命。彷彿這“第四次”有很多種說辭，比如有人說第四次科技革命是生物技術革命，還有人說是量子技術革命。但既然AI也是第四次科技革命之一的候選技術，而且作為資訊技術的組成部分，卻又獨立於資訊技術，即表示它有獨到之處。

電子科技革命的即將終結，一般認為即是指摩爾定律的終結——摩爾定律一旦無法延續，也就意味著資訊技術的整棟大樓建造都將出現停滯，那麼第三次科技革命也就正式結束了。這種聲音似乎是從十多年前就有，但這波革命始終也沒有結束。

AI技術本質上仍然是第三次科技革命的延續，它的發展也依託於幾十年來半導體科技的進步。這些年出現了不少專門的AI晶片——而且市場參與者相眾多。當某一個類別的技術發展到出現一種專門的處理器為之服務的程度，那麼這個領域自然就不可小覷，就像當年GPU出現專門為圖形運算服務一樣。

所以AI晶片被形容為CPU、GPU之後的第三大類電腦處理器。AI專用處理器的出現，很大程度上也是因為摩爾定律的發展進入緩慢期：電晶體的尺寸縮減速度，已經無法滿足需求，所以就必須有某種專用架構(DSA)出現，以快速提升晶片效率，也才有了專門的AI晶片。

另一方面，摩爾定律的延緩也成為AI晶片發展的桎梏。在摩爾定律和登納德縮放比例定律(Dennard Scaling)發展的前期，電晶體製程進步為晶片帶來了相當大的助益，那是「happy scaling down」的時代——CPU、GPU都是這個時代受益，不過Dennard Scaling早在45nm時期就失效了。

AI晶片作為第三大類處理器，在這波發展中沒有趕上happy scaling down的好時機。與此同時，AI應用對運算力的需求越來越貪婪。今年WAIC晶片論壇圓桌討論環節，燧原科技創始人暨CEO趙立東說：「現在訓練的GPT-3模型有1750億參數，接近人腦神經元數量，我以為這是最大的模型了，要千張Nvidia的GPU卡才能做。談到AI運算力需求、模型大小的問題，說最大模型超過萬億參數，又是10倍。」

英特爾(Intel)研究院副總裁、中國研究院院長宋繼強說：「前兩年用GPU訓練一個大規模的深度學習模型，其碳排放量相當於5台美式車整個生命週期產生的碳排量。」這也說明了AI運算力需求的貪婪，以及提供運算力的AI晶片不夠高效。

不過作為產業的底層驅動力，半導體製造技術仍源源不斷地為AI發展提供推力。本文將討論WAIC晶片論壇上聽到，針對這個問題的一些前瞻性解決方案——有些已經實現，有些則可能有待時代驗證。

XPU、摩爾定律和異質整合

「電腦產業中的貝爾定律，是說能效每提高1,000倍，就會衍生出一種新的運算形態。」中科院院士劉明在論壇上說，「若每瓦功耗只能支撐1KOPS的運算，當時的這種運算形態是超算；到了智慧型手機時代，能效就提高到每瓦1TOPS；未來的智慧終端我們要達到每瓦1POPS。這對IC提出了非常高的要求，如果依然沿著CMOS這條路去走，當然可以，但會比較艱辛。」

針對性能和效率提升，除了尺寸微縮，半導體產業比較常見的思路是電晶體結構、晶片結構、材料等方面的最佳化，以及處理架構的革新。

(1)AI晶片本身其實就是對處理器架構的革新，從運算架構的層面來看，針對不同的應用方向造不同架構的處理器是常規，更專用的處理器能促成效率和性能的成倍增長，而不需要依賴於電晶體尺寸的微縮。比如GPU、神經網路處理器(NPU，即AI處理器)，乃至更專用的ASIC出現，都是這類思路。

CPU、GPU、NPU、FPGA等不同類型的晶片各司其職，Intel這兩年一直在推行所謂的「XPU」策略就是用不同類型的處理器去做不同的事情，「整合起來各取所需，用組合拳會好過用一種武器去解決所有問題。」宋繼強說。Intel的晶片產品就涵蓋了幾個大類，Core CPU、Xe GPU，以及透過收購獲得的AI晶片Habana等。

另外針對不同類型的晶片，可能還有更具體的最佳化方案。如當代CPU普遍加入AVX512指令，本質上是特別針對深度學習做加強。「專用」的不一定是處理器，也可以是處理器內的某些特定單元，甚至固定功能單元，就好像GPU中加入專用的光線追蹤單元一樣，這是當代處理器普遍都在做的一件事。

(2)從電晶體、晶片結構層面來看，電晶體的尺寸現在仍然在縮減過程中，只不過縮減幅度相比過去變小了——而且為緩解電晶體性能的下降，需要有各種不同的技術來輔助尺寸變小。比如說在22nm節點之後，電晶體變為FinFET結構，在3nm之後，電晶體即將演變為Gate All Around FET結構。最終會演化為互補FET (CFET)，其本質都是電晶體本身充分利用Z軸，來實現微縮性能的提升。

劉明認為，「除了基礎元件的變革，IC現在的發展還是比較多元化，包括新材料的引進、元件結構革新，也包括微影技術。長期賴以微縮的基本手段，現在也在發生巨大的變化，特別是未來3D的異質整合。這些多元技術的協同發展，都為晶片整體性能提升帶來了很好的增益。」

他並指出，「從電晶體級、到晶圓級，再到晶片堆疊、引線接合(lead bonding)，精準度從毫米向奈米演進，互連密度大大提升。」從晶圓/裸晶的層面來看，則是眾所周知的朝more than moore’s law這樣的路線發展，比如把兩片裸晶疊起來。現在很熱門的chiplet技術就是比較典型的並不依賴於傳統電晶體尺寸微縮，來彈性擴展性能的方案。

台積電和Intel這兩年都在大推將不同類型的裸晶，異質整合的技術。2.5D封裝方案典型如台積電的CoWoS，Intel的EMIB，而在3D堆疊上，Intel的Core LakeField晶片就是用3D Foveros方案，將不同的裸晶疊在一起，甚至可以實現兩片運算裸晶的堆疊、互連。

之前的文章也提到過AMD剛發佈的3D V-Cache，將CPU的L3 cache裸晶疊在運算裸晶上方，將處理器的L3 cache大小增大至192MB，對儲存敏感延遲應用的性能提升。相比Intel，台積電這項技術的獨特之處在於裸晶間是以混合接合(hybrid bonding)的方式互連，而不是micro-bump，做到更小的打線間距，以及晶片之間數十倍通訊性能和效率提升。

這些方案也不直接依賴傳統的電晶體微縮方案。這裡實際上還有一個方面，即新材料的導入專家們沒有在論壇上多說，本文也略過不談。

1,000倍的性能提升

劉明談到，當電晶體微縮的空間沒有那麼大的時候，產業界傾向於採用新的策略來評價技術——「PPACt」——即Powe r(功耗)、Performance (性能)、Cost/Area-Time (成本/面積-時間)。t指的具體是time-to-market，理論上應該也屬於成本的一部分。

電晶體微縮方案失效以後，「多元化的技術變革，依然會讓IC性能得到進一步的提升。」劉明說，「根據預測，這些技術即使不再做尺寸微縮，也會讓IC的晶片性能做到500~1,000倍的提升，到2035年實現Zetta Flops的系統性能水準。且超算的發展還可以一如既往地前進；單裸晶儲存容量變得越來越大，IC依然會為產業發展提供基礎。」

500~1,000倍的預測來自DARPA，感覺有些過於樂觀。因為其中的不少技術存在比較大的邊際遞減效應，而且有更實際的工程問題待解決，比如運算裸晶疊層的散熱問題——即便業界對於這類工程問題的探討也始終在持續。

不過1,000倍的性能提升，的確說明摩爾定律的終結並不能代表第三次科技革命的終結，而且還有相當大的發展空間。尤其本文談的主要是AI晶片，而不是更具通用性的CPU。

矽光、記憶體內運算和神經型態運算

在非傳統發展路線上(以上內容都屬於半導體製造的常規思路)，WAIC晶片論壇上宋繼強和劉明都提到了一些頗具代表性的技術方向(雖然這可能與他們自己的業務方向或研究方向有很大的關係)。這些技術可能尚未大規模推廣，或者仍在商業化的極早期。

(1)近記憶體運算和記憶體內運算：處理器性能和效率如今面臨的瓶頸，很大程度並不在單純的運算階段，而在資料傳輸和儲存方面——這也是共識。所以提升資料的傳輸和存取效率，可能是提升整體系統性能時，一個非常靠譜的思路。

這兩年市場上的處理器產品用「近記憶體運算」(near-memory computing)思路的，應該不在少數。所謂的近記憶體運算，就是讓儲存(如cache、memory)單元更靠近運算單元。CPU的多層cache結構(L1、L2、L3)，以及電腦處理器cache、記憶體、硬碟這種多層儲存結構是常規。而「近記憶體運算」主要在於究竟有多「近」，cache記憶體有利於隱藏當代電腦架構中延遲和頻寬的局限性。

這兩年在近記憶體運算方面比較有代表性的，一是AMD——比如前文提到3D V-cache增大處理器的cache容量，還有其GPU不僅在裸晶內導入了Infinity Cache這種類似L3 cache的結構，也更早應用了HBM2記憶體方案。這些實踐都表明，儲存方面的革新的確能帶來性能的提升。

另外一個例子則是Graphcore的IPU處理器：IPU的特點之一是在裸晶內堆了相當多的cache資源，cache容量遠大於一般的GPU和AI晶片——也就避免了頻繁的訪問外部儲存資源的操作，極大提升頻寬、降低延遲和功耗。

近記憶體運算的本質仍然是馮紐曼架構(Von Neumann architecture)的延續。「在做處理的過程中，多層級的儲存結構，資料的搬運不僅僅在處理和儲存之間，還在不同的儲存層級之間。這樣頻繁的資料搬運帶來了頻寬延遲、功耗的問題。也就有了我們經常說的運算體系內的儲存牆的問題。」劉明說。

構建非馮(non-von Neumann)架構，把傳統的、以運算為中心的馮氏架構，變換一種新的運算範式。把部分運算力下推到儲存。這便是記憶體內運算(in-memory computing)的概念。

記憶體內運算的就現在看來還是比較新，也有稱其為「存算一體」。通常理解為在記憶體中嵌入演算法，儲存單元本身就有運算能力，理論上消除資料存取的延遲和功耗。記憶體內運算這個概念似乎這在資料爆炸時代格外醒目，畢竟可極大減少海量資料的移動操作。

其實記憶體內運算的概念都還沒有非常明確的定義。現階段它可能的內涵至少涉及到在儲記憶體內部，部分執行資料處理工作；主要應用於神經網路(因為非常契合神經網路的工作方式)，以及這類晶片具體的工作方法上，可能更傾向於神經型態運算(neuromorphic computing)。

對於AI晶片而言，記憶體內運算的確是很好的思路。一般的GPU和AI晶片執行AI負載時，有比較頻繁的資料存取操作，這對性能和功耗都有影響。不過記憶體內運算的具體實施方案，在市場上也是五花八門，早期比較具有代表性的Mythic導入了一種矩陣乘的儲存架構，用40nm嵌入式NOR，在儲記憶體內部執行運算，不過替換掉了數位週邊電路，改用類比的方式。在陣列內部進行模擬運算。這家公司之前得到過美國國防部的資金支援。

劉明列舉了近記憶體運算和記憶體內運算兩種方案的例子。其中，近記憶體運算的這個方案應該和AMD的3D V-cache比較類似，把儲存裸晶和運算裸晶疊起來。

劉明指出，「這是我們最近的一個工作，採用hybrid bonding的技術，與矽通孔(TSV)做比較，hybrid bonding功耗是0.8pJ/bit，而TSV是4pJ/bit。延遲方面，hybrid bonding只有0.5ns，而TSV方案是3ns。」台積電在3D堆疊方面的領先優勢其實也體現在hybrid bonding混合鍵合上，前文也提到了它具備更高的互連密度和效率。

另外這套方案還將DRAM刷新頻率提高了一倍，從64ms提高至128ms，以降低功耗。「應對刷新率變慢出現拖尾bit，我們引入RRAM TCAM索引這些tail bits」劉明說。

記憶體內運算方面，「傳統運算是用布林邏輯，一個4位元的乘法需要用到幾百個電晶體，這個過程中需要進行資料來回的移動。記憶體內運算是利用單一元件的歐姆定律來完成一次乘法，然後利用基爾霍夫定律完成列的累加。」劉明表示，「這對於今天深度學習的矩陣乘非常有利。它是原位的運算和儲存，沒有資料搬運。」這是記憶體內運算的常規思路。

「無論是基於SRAM，還是基於新型記憶體，相比近記憶體運算都有明顯優勢，」劉明認為。下圖是記憶體內運算和近記憶體運算，精準度、能效等方面的對比，記憶體內運算架構對於低精準度運算有價值。

下圖則總結了業內主要的一些記憶體內運算研究，在精確度和能效方面的對應關係。劉明表示，「需要高精確度、高運算力的情況下，近記憶體運算目前還是有優勢。不過記憶體內運算是更新的技術，這幾年的進步也非常快。」

去年阿里達摩院發佈2020年十大科技趨勢中，有一個就是存算一體突破AI算力瓶頸。不過記憶體內運算面臨的商用挑戰也一點都不小。記憶體內運算的通常思路都是類比電路的運算方式，這對記憶體、運算單元設計都需要做工程上的考量。與此同時這樣的晶片究竟由誰來造也是個問題：是記憶體廠商，還是數文書處理器廠商？(三星推過記憶體內運算晶片，三星、Intel垂直整合型企業似乎很適合做記憶體內運算…)

(2)神經型態運算：神經型態運算和記憶體內運算一樣，也是新興技術的熱門話題，這項技術有時也叫作compute in memory，可以認為它是記憶體內運算的某種發展方向。神經型態和一般神經網路AI晶片的差異是，這種結構更偏「類人腦」。

進行神經型態研究的企業現在也逐漸變得多起來，劉明也提到了AI晶片「最終的理想是在結構層次模仿腦，元件層次逼近腦，功能層次超越人腦」的「類腦運算」。Intel是比較早關注神經型態運算研究的企業之一。

傳說中的Intel Loihi就是比較典型存算一體的架構，「這片裸晶裡面包含128個小核心，每個核心用於模擬1,024個神經元的運算結構。」宋繼強說，「這樣一塊晶片大概可以類比13萬個神經元。我們做到的是把768個晶片再連起來，構成接近1億神經元的系統，讓學術界的夥伴去試用。」

「它和深度學習加速器相比，沒有任何浮點運算——就像人腦裡面沒有乘加器。所以其學習和訓練方法是採用一種名為spike neutral network的路線，功耗很低，也可以訓練出做視覺辨識、語言辨識和其他種類的模型。」宋繼強認為，不採用同步時脈，「刺激的時候就是一個非同步電動勢，只有工作部分耗電，功耗是現在深度學習加速晶片的千分之一。」

「而且未來我們可以對不同區域做劃分，比如這兒是視覺區、那兒是語言區、那兒是觸覺區，同時進行多模態訓練，互相之間產生關聯。這是現在的深度學習模型無法比擬的。」宋繼強說。這種神經型態運算晶片，似乎也是Intel在XPU方向上探索不同架構運算的方向之一。

(2)微型化矽光：這個技術方向可能在層級上更偏高了一些，不再晶片架構層級，不過仍然值得一提。去年Intel在Labs Day上特別談到了自己在矽光(Silicon Photonics)的一些技術進展。其實矽光技術在連接資料中心的交換機方面，已有應用了，發出資料時，連接埠處會有個收發器把電訊號轉為光訊號，透過光纖來傳輸資料，另一端光訊號再轉為電訊號。不過傳統的光收發器成本都比較高，內部元件數量大，尺寸也就比較大。

Intel在整合化的矽光(IIIV族monolithic的光學整合化方案)方面應該是商業化走在比較前列的，就是把光和電子相關的組成部分高度整合到晶片上，用IC製造技術。未來的光通訊不只是資料中心機架到機架之間，也可以下沉到板級——就跟現在傳統的電I/O一樣。電互連的主要問題是功耗太大，也就是所謂的I/O功耗牆，這是這類微型化矽光元件存在的重要價值。

這其中存在的技術挑戰還是比較多，如做資料的光訊號調變的調變器調變器，據說Intel的技術使其實現了1,000倍的縮小；還有在接收端需要有個探測器(detector)轉換光訊號，用所謂的全矽微環(micro-ring)結構，實現矽對光的檢測能力；波分複用技術實現頻寬倍增，以及把矽光和CMOS晶片做整合等。

Intel認為，把矽光模組與運算資源整合，就能打破必須帶更多I/O接腳做更大尺寸處理器的這種趨勢。矽光能夠實現的是更低的功耗、更大的頻寬、更小的接腳數量和尺寸。在跨處理器、跨伺服器節點之間的資料互動上，這類技術還是頗具前景，Intel此前說目標是實現每根光纖1Tbps的速率，並且能效在1pJ/bit，最遠距離1km，這在非本地傳輸上是很理想的數字。

還有軟體…

除了AI晶片本身，從整個生態的角度，包括AI感知到運算的整個鏈條上的其他組成部分，都有促成性能和效率提升的餘地。比如這兩年Nvidia從軟體層面，針對AI運算的中間層、庫做了大量最佳化。相同的底層硬體，透過軟體最佳化就能實現幾倍的性能提升。

宋繼強說，「我們發現軟體最佳化與否，在同一個硬體上可以達到百倍的性能差距。」這其中的餘量還是比較大。

在AI開發生態上，雖然Nvidia是最具發言權的；但從戰略角度來看，像Intel這種研發CPU、GPU、FPGA、ASIC，甚至還有神經型態運算處理器的企業而言，不同處理器統一開發生態可能更具前瞻性。Intel有個稱oneAPI的軟體平台，用一套API實現不同硬體性能埠的對接。這類策略對廠商的軟體框架構建能力是非常大的考驗——也極大程度關乎底層晶片的執行效率。

在摩爾定律放緩、電晶體尺寸微縮變慢甚至不縮小的前提下，處理器架構革新、異質整合與2.5D/3D封裝技術依然可以達成1,000倍的性能提升；而一些新的技術方向，包括近記憶體運算、記憶體內運算和微型矽光，能夠在資料訪存、傳輸方面產生新的價值；神經型態運算這種類腦運算方式，是實現AI運算的目標；軟體層面的最佳化，也能夠帶動AI性能的成倍增長。所以即便摩爾定律嚴重放緩，AI晶片的性能、效率提升在上面提到的這麼多方案加持下，終將在未來很長一段時間內持續飛越。這第三(四)次科技革命恐怕還很難停歇。

資料來源：https://www.eettaiwan.com/20210726nt61-ai-computing/?fbclid=IwAR3BaorLm9rL2s1ff6cNkL6Z7dK8Q96XulQPzuMQ_Yky9H_EmLsBpjBOsWg

Tags: 圖形辨識演算法

台灣物聯網實驗室 IOT Labs

About author

本專頁將不定時網羅搜集國內外與物聯網相關新聞及技術，並無條件與 IOT 從業人員或對物聯網有興趣的大眾分享，若有任何不足或建議之處，歡迎隨時留言，一起研究研究。^.^

圖形辨識演算法在台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文

By 台灣物聯網實驗室 IOT Labs

2021-05-29 18:18:27 有 0 人按讚

機器學習識別特徵阻絕代測　上鏈回送監理資料庫防竄改

人臉辨識加酒精鎖阻酒駕　串區塊鏈上傳比對告警

2021-05-24社團法人台灣E化資安分析管理協會元智大學多媒體安全與影像處理實驗室

本文將介紹酒精防偽人臉影像辨識系統，結合了人臉辨識、酒精鎖以及區塊鏈應用，以解決酒駕問題，並透過監控系統避免代測狀況發生。且利用區塊鏈不可修改的特性，將車輛與人臉資料串上區塊鏈，以確保駕駛人的不可否認性。

長長期以來「酒駕」都是一個很嚴肅且必須被重視的議題，儘管在2019年立法院修法酒駕及拒絕酒測的罰則，但是抱持僥倖心態的人還是數不勝數，導致因酒駕釀成車禍的悲劇還是一再重演，讓不少的家庭因此破滅。

據統計，從2015年到2018年的酒駕取締件數都逾10萬件，而因為酒駕車禍的死亡人數逾百人。在2019年酒駕新制上路以後，2020年警方酒駕取締件數有明顯下降至約6萬件，雖然成功達到嚇阻效果，但是死亡人數仍與去年前年持平，可見離完全遏止酒駕還有很長的路需要努力。

立法院於2018年三讀通過了「道路交通管理處罰條例部分條文修正案」，酒駕者必須重新考照，並且只能駕駛具有酒精鎖（Alcohol Interlock）的車輛，所謂酒精鎖，屬於車輛點火自動鎖定裝置，在汽車發動前必須進行酒測，通過才能將汽車發動，而且在每45分鐘至60分鐘後酒精鎖系統就會要求駕駛人在一定時間內進行重新酒測，以便防範在行車過程中有飲酒的情況發生，若駕駛人未遵守其要求，車子就會強制熄火並鎖死，必須回酒精鎖服務中心才能將鎖解開。

由於法案的方式無法完全遏止酒駕，因此許多創新科技或是企業致力於研究相關科技來解決酒駕的問題。

其中本田（Honda）汽車與日立（Hitachi）公司研發出手持型酒精含量檢測裝置，讓駕駛人必須在駕駛之前都先進行酒測，若酒精濃度超標就會將汽車載具上鎖，藉此避免酒駕意外或事故發生，且該技術結合了智慧鑰匙功能，若偵測到酒測值超標，車輛中的顯示面板將會發出警告訊號告知駕駛人，避免酒駕上路之問題。

另一方面則是解決酒精殘值之問題，因為有許多駕駛人都會認為，休息一下後，身體也無感到不適，即駕車出門，等到駕駛人被警方臨檢時才知道酒測未通過，因此收到罰單，甚至是吊銷駕照處罰等。

根據醫學研究指出，酒精是在人體體內由肝臟代謝，實際代謝時間必須看體質以及飲酒量而定。台灣酒駕防制社會關懷協會建議，喝酒後至少要10至20小時後再駕車比較安全。多數人無具備酒精代謝時間的觀念，導致駕駛人貿然上路，待意外發生或罰單臨頭時，已經為時已晚。

背景知識說明

本文介紹的方法為酒精鎖結合攝影鏡頭進行人臉辨識，並將人臉特徵資料與車輛資料串上區塊鏈，並利用區塊鏈不可篡改的特性，來避免駕駛人在解鎖酒精鎖時發生他人代測的問題。

由於人臉辨識技術具備防偽性、身分驗證的特性，因此將酒精鎖的技術結合人臉辨識，便可確認為駕駛本人。

何謂人臉辨識

人臉辨識技術屬於生物辨識的一種，基於人工智慧、機器學習、深度學習等技術，將大量人臉的資料輸入至電腦中做為模型訓練的素材，讓電腦透過演算法學習人類的面部特徵，藉以歸納其關聯性最後輸出人臉的特徵模型。

目前人臉辨識技術已經遍佈在日常生活之中，其應用面廣泛，最為常見的應用即為智慧型手機的解鎖、行動支付如LINE Pay、Apple Pay等，其他應用還包括行動網路銀行、網路郵局、社區大樓門禁管理系統、企業監控系統、機場出入關、智能ATM、中國天眼系統等。一般來說，人臉辨識皆具備以下幾個特性：

‧ 普遍性：屬於任何人皆擁有的特徵。

‧ 唯一性：除本人以外，其他人不具相同的特徵。

‧ 永續性：特徵不易隨著短時間有大幅的改變。

‧ 方便性：人臉辨識容易實施，設備容易取得，如相機鏡頭。

‧ 非接觸性：不須直接接觸儀器，也可以進行辨識，這部分考量到衛生問題以及辨識速度。

人臉辨識透過人臉特徵的分析比對進行身分的驗證，別於其他生物辨識如虹膜辨識、指紋辨識，無須近距離接觸，也可以精準地辨識身分，且具有同時辨識多人的能力。因應新冠肺炎疫情肆虐全球，人臉辨識技術也被用來管理人來人往的人流。人臉辨識的儀器可以搭配紅外線攝影機來測量人體體溫，在門禁進出管制系統中，利於提高管理效率，有效掌握到進出人員的身分，以及幫助衛生福利部在做疫調時更容易掌握到確診病患行經的足跡。

人臉辨識的步驟

人臉辨識的過程與步驟，包括人臉偵測、人臉校正、人臉特徵值的摘取，進行機器學習與深度學習、輸出人臉模型，從影像中先尋找目標人臉，偵測到目標後會將人臉進行預處理、灰階化、校正，並摘取特徵值，接著人臉資料交給電腦進行機器學習與深度學習運算，最後輸出已訓練好的模型。相關辨識的步驟，如圖1所示。

人臉偵測

基於Haar臉部檢測器的基本思想，對於一個一般的正臉而言，眼睛周圍的亮度較前額與臉頰暗、嘴巴比臉頰暗等其他明顯特徵。基於這樣的模式進行數千、數萬次的訓練，所訓練出的人臉模型，其訓練時間可能為幾個小時甚至幾天到幾周不等。利用已經訓練好的Haar人臉特徵模型，可以有效地在影像中偵測到人臉。

Python中的Dilb函式庫提供了訓練好的人臉模型，可以偵測出人臉的68個特徵點，包括臉的輪廓、眉毛、眼睛、鼻子、嘴巴。基於這些特徵點的資料就能夠進行人臉偵測，如圖2～4所示。圖中左上角的部分是偵測到的分數，若分數越高，代表該張影像就越可能是人臉，右側括弧中的編號代表子偵測器的編號，代表人臉的方向，其中0為正面、1為左側、2為右側。

人臉的預處理

偵測到人臉後，要針對圖片進行預處理。通常訓練的影像與攝影鏡頭拍出來的照片會有很大的不同，尤其會受到燈光、角度、表情等影響，為了改善這類問題，必須對圖片進行預處理以減少這類的問題，其中訓練的資料集也很重要：

‧ 幾何變換與裁剪：將影像中的人臉對齊與校正，將影像中不重要的部分進行裁切，並旋轉人臉，並使眼睛保持水平。

‧ 針對人臉的兩側用直方圖均衡化：可以增強影像中的對比度，可以改善過曝的影像或是曝光不足的問題，更有效地顯示與取得人臉目標的特徵點。

‧ 影像平滑化：影像在傳遞的過程中若受到通道、劣質取樣系統或是受到其他干擾導致影像變得粗糙，藉由使用圖形平滑處理，可以減少影像中的鋸齒效應和雜訊。

人臉特徵摘取

關於人臉特徵摘取，相關的技術說明如下：

‧ 歐式距離：人臉辨識是一個監督式學習，利用建立好的人臉模型，將測試資料和訓練資料進行匹配，最直觀的方式就是利用歐式距離來計算所有測試資料與訓練資料之間的距離，選擇差距最小者的影像作為辨識結果。由於人臉資料過於複雜，且需要大量的訓練集資料與測試集資料，會導致計算量過大，使辨識的速度過於緩慢，因此需要透過主成分分析法（Principal Components Analysis，PCA）來解決此問題。

‧ 主成分分析法：主成分分析法為統計學中的方法，目的是將大量且複雜的人臉資料進行降維，只保留影像中的主成分，即為影像中的關鍵像素，以在維持精確度的前提下加快辨識的速度。先將原本的二維影像資料每列資料減掉平均值，並計算協方差矩陣且取得特徵值與特徵向量，接著將訓練集與測試集的資料進行降維，讓新的像素矩陣中只保留主成分，最後則將降維後的測試資料與訓練資料做匹配，選擇距離最近者為辨識的結果。由於影像資料經過了降維的步驟，因此人臉辨識的速度將會大幅度地提升。

‧ 卷積神經網路：卷積神經網路（Convolutional Neural Network，CNN）是一種神經網路的架構，在影像辨識、人臉辨識至自駕車領域中都被廣泛運用，是深度學習（Deep Learning）中重要的一部分。主要的目的是透過濾波器對影像進行卷積、池化運算，藉此來提取圖片的特徵，並進行分類、辨識、訓練模型等作業。在人臉辨識的應用中，首先會輸入人臉的影像，再透過CNN從影像提取像素特徵並轉換成特定形式輸出，並用輸出的資料集進行訓練、辨識等等。

何謂酒精鎖

酒精鎖（圖5）是一種裝置在車輛載體中的配備，讓駕駛人必須在汽車發動前進行酒測，通過後才能將車輛發動。且每隔45分鐘至60分鐘會發出要求，讓駕駛人在時間內再次進行檢測。

根據歐盟經驗，提高罰款金額以及吊銷駕照只有在短期實施有效，只有勸阻的效果，若在執法上不夠嚴謹，被吊照者會轉變成無照駕駛，因此防止酒駕最有效的方法就是強制讓駕駛人無法上路，這就是「酒精鎖」的設計精神。

在本國2020年3月1日起酒駕新制通過後，針對酒駕犯有了更明確且更嚴厲的規定，在酒駕被吊銷駕照者重考後，一年內車輛要裝酒精鎖，未通過酒測者無法啟動，且必須上15小時的教育訓練才能重考，若酒駕累犯三次，要接受酒癮評估治療滿一年、十二次才能重考。

許多民眾對於「酒精鎖」議論紛紛，懷疑是否會發生找其他人代吹酒精鎖的疑慮，為防範此問題，酒精鎖在啟動後的五分鐘內重新進行吹氣，且汽車在行駛期間的每45至60分鐘內，便會隨機要求駕駛重新進行酒測，如果沒有通過測量或是沒有測量，整合在汽車智慧顯示面板的酒精鎖便會發出警告，並勸告駕駛停止駕車。

對於酒精鎖的實施，目前無法完全普及到每一台車子，而且對於沒有飲酒習慣的民眾而言，根本是多此一舉，反而增加不少麻煩給駕駛。若還有每45～60分鐘的隨機檢測，會導致多輛汽車必須臨時停靠路邊進行檢測，可能加劇汽車違規停車的發生頻率。

認識區塊鏈

區塊鏈技術是一種不依賴於第三方，透過分散式節點（Peer to Peer，P2P）來進行網路數據的存儲、交易與驗證的技術方法。本質上就是一個去中心化的資料庫，任何人在任何時間都可以依照相同的技術標準將訊息打包成區塊並串上區塊鏈，而這些被串上區塊鏈的區塊無法再被更改。區塊鏈技術主要依靠了密碼學與HASH來保護訊息安全，也是賦予區塊鏈技術具有高安全性、不可篡改性以及去中心化的關鍵。區塊鏈相關概念，如圖6所示。

區塊鏈的原理與特性

可以將區塊鏈想像成是一個大型公開帳本，網路上的每個節點都擁有完整的帳本備份，當產生一筆交易時，會將這筆交易廣播到各個節點，而每個節點會將未驗證的交易HASH值收集至區塊內。接著，每個節點進行工作量證明，選取計算最快的節點進行這些交易的驗證，完成後會把區塊廣播給到其他節點，其他節點會再度確認區塊中包含的交易是否有效，驗證過後才會接受區塊並串上區塊鏈，此時就無法再將資料進行篡改。

關於區塊鏈的特性，可分成以下四部分做說明：

1. 去中心化：區塊鏈其中一個最重要的核心宗旨，就是「去中心化」，區塊鏈採用分散式的點對點傳輸，該概念架構中，節點與節點之中沒有所謂的中心，所有的操作都部署在分散式的節點中，而無須部署在中心化機構的伺服器，一筆交易或資料的傳輸不再需要第三方的介入，因此又可以說每個節點就是所謂的「中心」。這樣的結構也加強了區塊鏈的穩定性，不會因為其中的部分節點故障而癱瘓整個區塊鏈的結構。

2. 不可篡改性：透過密碼學與雜湊函數的運用來將資料打包成區塊並上鏈，所有區塊都有屬於它的時間戳記，並依照時間順序排序，而所有節點的帳本資料中又記錄了完整的歷史內容，讓區塊鏈無法進行更改或是更改成本很高，因此使區塊鏈具備「不可篡改性」，並且同時確保了資料的完整性、安全性以及真實性。

3. 可追溯性：區塊鏈是一種鏈式的資料結構，鏈上的訊息區塊依照時間的順序環環相扣，這便使得區塊鏈具有可追溯的特性。可追本溯源的特性適用在廣泛的領域中，如供應鏈、版權保護、醫療、學歷認證等。區塊鏈就如同記帳帳本一般，每筆交易記錄著時間和訊息內容，若要進行資料的更改，則會視為一筆新的交易，且舊的紀錄仍會存在無法更動，因此仍可依照過去的交易事件進行追溯。

4. 匿名性：在去中心化的結構下，節點與節點之間不分主從關係，且每個節點中都擁有一本完整的帳本，因此區塊鏈系統是公開透明的。此時，個人資料與訊息內容的隱私就非常重要，區塊鏈技術運用了HASH運算、非對稱式加密與數位簽章等其他密碼學技術，讓節點資料在完全開放的情況下，也能保護隱私以及用戶的匿名性。

區塊鏈與酒精鎖

由於區塊鏈的技術具備去中心化、記錄時間以及不可篡改的特性，且更加強酒精鎖的檢測需要身分驗證的保證性。當進行酒精鎖檢測解鎖時，系統記錄駕駛人吹氣時間以及車輛的相關資訊，還有人臉特徵資料打包成區塊並串上區塊鏈。因此，在同一時間當監控系統偵測到當前駕駛人與吹氣人不同時，此時區塊鏈中所記錄的資料便能成為一個強而有力的依據，同時也能讓其他的違規或違法事件可以更容易進行追溯。

酒駕防偽人臉辨識系統介紹

為了解決酒精鎖發生駕駛人代測的問題，酒精鎖產品應導入具有身分驗證性的人臉辨識技術。酒駕防偽人臉辨識系統即為駕駛人在進行酒精鎖解鎖時，要同時進行人臉辨識，來確保駕駛人與吹氣人為同一人。

在駕駛座前方的位置會安裝攝影鏡頭，作為駕駛的監控裝置。進行酒測吹氣的人臉資料將會輸入到該系統中的資料庫儲存，並將人臉資料以及酒測的時間戳記打包成區塊串上區塊鏈，當汽車已經駛動時，攝影鏡頭將會將當前駕駛人畫面傳回系統進行人臉比對驗證。如果驗證成功，會將通過的紀錄與時間戳一同上傳至區塊鏈，若是系統偵測到駕駛人與吹氣人為不同對象，系統將發出警示要求駕駛停車並重新進行檢測，並同時將此次異常的情況進行記錄上傳到區塊鏈中。

如果駕駛持續不遵循系統指示仍持續行駛，該系統會將區塊鏈的紀錄傳送回給開罰的相關單位，並同時發出警報以告知附近用路人該車輛處於異常情況，應先行迴避。且該車輛於熄火後，酒精鎖會將車輛上鎖，必須聯絡酒精鎖廠商或酒精鎖服務中心才能解鎖。相關的系統概念流程圖，如圖7所示。

區塊鏈打包上鏈模擬

在進行酒測解鎖完畢以及進行人臉資料儲存後，會透過CNN將影像轉換輸出成128維的特徵向量作為人臉資料的測量值，接著將128個人臉特徵向量資料取出，並隨著車輛資訊一起打包到同一個區塊，然後串上區塊鏈。取出的人臉特徵資料，如圖8所示。

要打包成區塊和上鏈的內容，包括了人臉特徵資料、車牌號碼、酒測解鎖時間點等相關輔助資料，接著透過雜湊函數將相關的資料打包成區塊。以車牌號碼ABC-1234為例，圖9顯示將車輛資料和人臉資料進行區塊鏈的打包，並進行HASH運算。

將人臉資料和車輛相關資料作為一次的交易內容，並打包區塊，經過HASH後的結果如圖10所示，其中prev_hash屬性代表鏈結串列指向前一筆資料，由於這是實作模擬情境，並無上一筆資料，其中messages屬性代表內容數，一筆代表車牌資料，另一筆則為人臉資料。time屬性則代表區塊上鏈的時間點，代表車輛解鎖的時間點。

情境演練說明

話說小禛是一間企業的上班族，平時以開車為上下班的交通工具，他的汽車配置了酒駕防偽影像辨識系統，以下模擬小禛下班後準備開車的情境。

已經下班的小禛今天打算從公司開車回家，當小禛上車準備發動車子時，他必須先拿起安裝在車上的酒測器進行吹氣，並將臉對準攝影鏡頭讓系統取得小禛的人臉影像。小禛在汽車發動前的人臉影像，如圖11所示。

待攝影鏡頭偵測到小禛的人臉後，接著系統便會擷取臉上五官的68個特徵點，如圖12所示。然後，相關數據再透過CNN轉換輸出成128維的特徵向量作為人臉資料的測量值，如圖13所示。

酒精鎖通過解鎖後，車輛隨之發動，解鎖成功的時間點將會記錄成時間戳記，隨著影像與相關資料串上區塊鏈。在行駛途中，設置在駕駛座前方的鏡頭將擷取目前駕駛的人臉，以取得駕駛人的128維人臉特徵向量測量值，並且與汽車發動前所存入的人臉資料進行比對，藉以判斷目前的駕駛人與剛才的吹氣人臉是否為同一位駕駛。當驗證通過後，也會再將通過的紀錄與時間戳上傳至區塊鏈中，如此一來，區塊鏈的訊息內容便完整記載了這一次駕車的紀錄，檢測通過的示意圖如圖14所示。

系統通過辨識後，便確認了駕駛人的身分與吹氣人一致。且透過時戳的紀錄和區塊鏈的輔助，也確保了駕駛的不可否認性。若有其他違規事件發生時，區塊鏈的紀錄便成為一個強而有力的依據來進行追溯。

如此一來，便可以預防小禛喝酒卻找其他人代吹酒測器的情況發生。在駕駛的途中，如果有需要更換駕駛人，必須待車輛靜止時，從車載系統發出更換駕駛要求，再重新進行酒測以及重複上述流程，才可以更換駕駛人。如果沒有按照該流程更換駕駛，系統將視為異常情況。

結語

酒駕一直是全球性的問題，將有高機率導致重大交通事故，造成人員傷亡、家庭破碎，進而醞釀後續更多的社會問題，皆是酒駕所引發的不良效益。為了解決酒駕的問題，各個國家都有不同的酒駕標準或是法律規範，但是大部分國家的規範和制度都只有嚇阻作用卻無法完全遏止。在不同的國家防止酒駕的方式不盡相同，有的國家如新加坡，透過監禁及鞭刑來遏止酒駕犯，又或者是薩爾瓦多，當發現酒駕直接判定死刑，這樣的制度雖嚇阻力極強，但是若讓其他國家也跟進，會造成違憲或是違反人權等問題。因此，各國都在酒駕的問題方面紛紛投入研究，想要達到零酒駕的社會。

為達成此理想，本文介紹了基於區塊鏈的酒駕防偽辨識系統，利用酒精鎖搭配人臉辨識技術以及區塊鏈技術，使有飲酒的駕駛人無法發動汽車。且該系統搭載在行車電腦中，結合攝影鏡頭的監控對駕駛進行酒測防制管理，將人臉資料、酒精鎖、解鎖時間點與相關資訊打包成區塊並上鏈。基於區塊鏈技術內容的不易篡改，可加強駕駛人的不可否認性，當汽車發生異常情況時，便能利用有效且可靠的依據進行追溯。人工智慧和物聯網時代已經來臨，透過酒駕防偽辨識系統來改善酒駕問題，在未來能夠普及並結合法規，智慧汽車以及智慧科技的應用將會帶給人們更安全、更便利的社會。

附圖：圖1 人臉辨識的步驟。
圖2 人臉特徵點偵測（正臉）。
圖3 人臉特徵點偵測（左側臉）。
圖4 人臉特徵點偵測（右側臉）。
圖5 酒精鎖。（圖片來源：https://commons.wikimedia.org/wiki/File:Guardian_Interlock_AMS2000_1.jpg with Author: Rsheram）
圖6 區塊鏈分散式節點的概念圖。
圖7 系統概念流程圖。
圖8 取出人臉128維特徵向量。
圖9 儲存車輛相關資料及人臉資料到區塊。
圖10 HASH後及打包成區塊的結果。
圖11 汽車發動前小禛的人臉影像。
圖12 小禛的人臉影像特徵點。
圖13 小禛的人臉特徵向量資料。
圖14 系統通過酒測檢測者與駕駛人為同一人。

資料來源：https://www.netadmin.com.tw/netadmin/zh-tw/technology/CC690F49163E4AAF9FD0E88A157C7B9D

Tags: 圖形辨識演算法

台灣物聯網實驗室 IOT Labs

About author

社群媒體上有些相關的討論：

圖形辨識演算法在 YOLOv3 監視器圖形辨識的推薦與評價

以YOLO(version 3)作為圖形辨識演算法，辨識監視器畫面中之物件分類為何。監視器影片源自：https://www.youtube.com/watch?v=QHMbA1zULLA. ... <看更多>

圖形辨識演算法在 OpenCV 程式設計介紹的推薦與評價

OpenCV (Open Source Computer Vision) 是由Intel 公司所開發出來的Open Source 圖形演算法的函式庫(Image Process Libary) 可以製做圖片，視訊，矩陣運算，統計，圖 ... ... <看更多>

圖形辨識演算法在小吳哥教學中心- TensorFlow+Keras程式設計-----TensorFlow ... 的推薦與評價

MNIST手寫辨識演算法 https://youtu.be/7D5XACigNco TensorFlow 手寫辨識實作 ... TensorFlow+Keras CNN卷積深度學習Cifar-10圖形辨識 https://youtu.be/zYgBZNXAlt8 ... <看更多>

你可能也想看看

搜尋相關連結

#1. 圖像特徵比對(一)-取得影像的特徵點 - CH.Tseng

Keypoint detection關鍵點偵測. Keypoint detection的演算法有很多，openCV便提供了十一種方法：. “FAST" – FastFeatureDetector.

#2. 關於影像辨識，所有你應該知道的深度學習模型 - Medium

要做到這就需要靠深度學習中的Object Detection 演算法，這也是最近幾年來深度學習最蓬勃發展的一塊領域。

#3. 物體偵測(Object Detection) + 影像標題(Image Captioning)

影像辨識的發展，可以從ImageNet ILSVRC 挑戰賽(Large Scale Visual Recognition ... 這種方法較Region Proposals 慢，但適合即時(Real Time)偵測，目前相關演算法有 ...

#4. 影像辨識準確度大提升靠這兩種演算法進步| AI微學習

電腦視覺領域的發展進步快速，在深層學習演算法和卷積神經網路(Convolutional Neural Network，CNN)的分析架構下，2015年微軟研究團隊在圖像辨識系統 ...

#5. 螺旋空間之物件辨識與應用

物件辨識是判斷在待測影像中搜尋是否存在一個或多個參考圖形。 ... 主要目的是利用螺旋座標表達方式發展一個物件辨識演算法，可以解決物體圖形經過縮放與旋轉之影響。

#6. Image - 演算法筆記

圖片影片處理函式庫OpenCV 、圖片處理函式庫CImg 、圖形使用者介面函式庫GTK ，都是不錯的選擇。 ... Image 的演算法，早已經製作成套裝軟體。完全不需要學習程式語言 ...

#7. 圖形辨識演算法使用成對的區域圖形觀察與樸素貝氏分類器

on Computer Vision and Pattern Recognition. Vol. 2. 2006. 連結：; [5] Yang, Jianchao, Kai Yu, Yihong Gong, and Thomas Huang. "Linear spatial pyramid matching ...

#8. 8. 影像特徵擷取

(link) 成一個比較完整或有意義的圖形；例如， ... d 演算法. S1.將影像做一次微分，根據微分絕對值的大小. 做二值化。 ... 1988 年Harris-Stephens 角偵測法.

#9. 應用向量內積演算法對圓形物體偵測之研究The Study of Circle ...

本. 文所提出向量內積偵測演算法，是利用圓形幾何性質中的圓周角特性，以向量內. 積的方法來判斷影像圖片中是否存在圓形物體，計算其圓心及半徑，並且描繪偵. 測圓的圖形。

#10. 基於LBP 演算法之紅外線光譜影像辨識率研究

為減少人為判斷誤差之可能性，藉由電腦快速運算與資料查詢之準. 確性，本研究運用圖形辨識（Pattern Recognition）之特徵運算特性進行相似度演算並排序，以減少人工查. 詢 ...

#11. GPU運算與深度學習 - Leadtek

深度學習是需要大量資料來訓練演算法模型的，以影像辨識為例，通常會需要數百萬張圖片資料來訓練模型，才能找出演算法最合適的權重參數，達到最佳的準確率。當神經網路收到 ...

#12. OpenCV 教學：實作Selective Search 物體偵測候選區域演算法

Selective Search 使用階層群聚演算法，以Graph Based Segmentation（實作可參考實作Graph Based Segmentation 圖形分割演算法）的結果為基礎，進行 ...

#13. 影像辨識於圖形識別之探討與次像素演算法之研究與應用

Jeng-Ho Yang · 影像辨識於圖形識別之探討與次像素演算法之研究與應用 · Exploration Of Image Recognition On Specific Patterns and Research Of Sub-pixel Algorithm.

#14. 影像辨識 - 南華大學

我們辨識影像的邊界值檢測法仍然有許多缺點，還需. 要更精確的邊界值演算法來更有效的辨識出邊界值，以達. 到完整辨識其影像圖形的形狀。希望在未來的研究裡能夠讓辨識的 ...

#15. 任意運動中的多面體物件之近似與精確碰撞偵測

本論文提出在電腦系統所模擬的三度空間圖形環境中之物件間的碰撞偵測演算法。在此環境中，所有物件係由凸多邊形所構成之凸或凹多面體，它們能進行任意平移或且旋轉的 ...

#16. 圖形辨識應於眼動研究作者

現在試想運⽤圖形辨識原理，藉由以影像⽅式追蹤，將其應⽤在眼動研究。 ... 影像讀進演算法前，會先判斷出眼睫毛的位置，再進⼀步找出眼睛可能的移動範圍。之後再.

#17. 2020 - 影像處理實驗室

在二維條碼辨識上，利用影像處理技術對條碼圖形做校正、復原與條碼辨識。 ... 並對其後續預測影像做不同演算法處理，包含凹凸面瑕疵演算法、瑕疵電路圖案橫跨演算法， ...

#18. 影像辨識演算法 - Brigitte

影像辨識於圖形識別之探討與次像素演算法之研究與應用論文名稱(外文): Exploration Of Image Recognition On Specific Patterns and Research Of Sub-pixel Algorithm ...

#19. 資訊工程研究所 - 國立交通大學機構典藏

過現有演算法的整合以及改善，提出最適合此環境及應用的辨識方. 法。本系統分為三個階段，第一 ... 一張影像若做完斷開的運算，則先收縮再膨脹後，圖形特徵會有雜點消.

#20. 從AI到deep learning影像辨識

... 針對動態影像的辨識準確度卻仍比不上人類，而因此各種演算法也如雨後春筍 ... 影像辨識的發展相當早，早期從圖形識別(pattern recognition)演進而 ...

#21. 研究人才詳細資料 - 學術研發服務網- 科技部

年度補助類別學門代碼擔任工作 109 專題研究計畫 (一般研究計畫) 圖形辨識計畫主持人 107 專題研究計畫 (一般研究計畫) 資訊科技應用及系統整合計畫主持人 106 專題研究計畫 (一般研究計畫) 人工智慧與仿生計算計畫主持人

#22. AI物件偵測暨辨識整合應用 - 中華民國經濟部

影像處理與辨識基礎理論載入圖檔並顯示色彩空間圖片檔案處理 ... 物體偵測人臉偵測與識別機器學習演算法資料訓練與分類模型建立圖形分類手寫資料測試 ...

#23. 影像辨識於圖形識別之探討與次像素演算法之研究與應用

影像辨識於圖形識別之探討與次像素演算法之研究與應用. Front Cover. 楊証賀. 撰者, 2002 - 200 pages. 0 Reviews. What people are saying - Write a review.

#24. 使用物聯網技術與熱影像圖形辨識演算法之視訊式雲端居家安全 ...

使用物聯網技術與熱影像圖形辨識演算法之. 視訊式雲端居家安全監控與自動警示系統之研究. IoT and pattern recognition technology of thermal image with ...

#25. 基於階層式時序記憶的多角度手勢辨識方法Multi-Angle Hand ...

在圖形辨識(Pattern Recognition)的領域內，角度變化一直以來都是影響辨識效果 ... 相較於Adaboost 和SVM 兩個演算法的86.8%和85.5%辨識率，的確可以達到更好的.

#26. 人機共處的新世界(2/2) | 科學Online

以讓深度學習在學界奠定地位的大規模視覺辨識競賽（Large Scale Visual ... 換句話說，深度學習演算法造就機器學習速度與效率上的突破，讓某些過去 ...

#27. 利用MATLAB進行電腦視覺深度學習 - 鈦思科技

在MATLAB中，只要具備一個預先已訓練過(pretrained)的CNN和幾張狗跟貓的圖片，就可已建立物件偵測與辨識演算法。我們利用CNN從影像中擷取出具有鑑別性的特徵，接著利用 ...

#28. 圖形辨識- 資訊工程/智慧計算

2020年圖形辨識領域 · 重點子領域一、電腦視覺(Computer Vision) · 重點子領域二、機器學習與深度學習(Machine Learning and Deep Learning) · 重點子領域三、影像處理(Image ...

#29. 圖型識別- 維基百科，自由的百科全書

以光學字元識別之「漢字辨識」為例：首先將漢字圖像進行處理，抽取主要表達特徵並將特徵與漢字 ... OpenNN: Open Neural Networks Library · 國家教育研究院-圖形辨識 ...

#30. Python 機器學習–徹底研究-從零開始親手打造影像辨識系統。

使用Python作大數據運算基礎認知演算法學會K-nearest最鄰近分類演算法KNN 實作KNN演算法使用手寫辨識MNIST 強化學習車載平衡使用Tensorflow 和Keras-RL

#31. 深度學習技術及影像辨識應用剖析

以機器視覺演算法為影像辨識核心，預期將. 因截然不同的深度學習技術，迎來 ... 深度學習、圖形識別、電腦視覺、影像處理、機器學習、多媒體. 應用. 【萬世澤】先生.

#32. 知識天地

電腦視覺因應用性廣泛，因而有許多基礎研究議題，例如人臉偵測、物件辨識、影像 ... 比對來進行，比對的單位為所謂的「特徵點」（feature point），其比對演算法可分為 ...

#33. 貨櫃碼辨識 - 政府研究資訊系統GRB

關鍵字：圖形識別；稀疏表示；貨櫃碼辨識；最佳化；壓縮性感測 ... (4) 利用量子遺傳演算法來偵測數位影像中的邊緣和輪廓,進而應用至各種圖型識別的問題,包括文字識別 ...

#34. 【圖像特徵比對二】資訊整理& 圖形比對演算法相關消息

本文將. 更進一步提升演算法之精度與速度，以期能將本文所提出之基於梯度資訊之物件定位技術應用於工業. 級影像定位應用上。關鍵字：梯度向量積、次像素物件辨識定位、 ..

#35. AI100新創公司之電腦視覺技術分析 - 科技政策觀點

而相較於辨識技術，演算法(G06N)相關專利數量則明顯較低，僅有12筆相關 ... 技術落在電腦視覺中辨識的區塊上，其中以圖形辨識為重，未來將往影像辨識 ...

#36. 成果展示 - 國立東華大學資訊工程學系暨研究所

整合聽覺視覺多模式互動小畫家本系統利用語音辨識技術讓使用者以語音操控電腦 ... 我們提出一個快速且有效的偽造偵測演算法針對inpainting偽造影像。

#37. AI深度學習與影像辨識實戰 - 艾鍗學院

充分活用OpenCV 函式庫，包含：影像處理、影片(視訊)處理、高階GUI 工具(圖形互動介面)、Image Processing 演算法實務、Computer Vision 演算法實務。主題實戰-AOI測量、 ...

#38. 圖像辨識的威脅與挑戰 - NordVPN

在人工智慧演算法的幫助之下，圖像辨識的準確度越來越高，也促成了許多 ... 如果圖形辨識技術被廣泛使用，有心人士可能會利用他人的照片或人像偽造 ...

#39. 理解優缺點及應用概況人臉辨識簡易實作動手玩

人臉辨識技術屬於電腦視覺的範疇，現今結合了人工智慧的技術，讓電腦視覺的效用提升，以影像分析為素材，並透過深度學習訓練，再利用演算法歸納出其 ...

#40. 電腦視覺、影像處理與人機互動

電腦視覺則涵蓋了對視覺內容的各種分析，包括立體視覺相關的攝影機校正、三維建模、自動導航與環境學習等，監控系統的人物辨識、物件偵測、事件偵測、物件追蹤等，以及視訊 ...

#41. Innovate Asia – Altera Design Contest 2010 - TW080

而在高複雜度的影像辨識演算法，使用NIOS II建構處理器來進行運算。 ... 由Altera DE2-70來進行設計，除了使用Verilog來實踐部分的演算法外，主要進行圖形辨識的演算法 ...

#42. 【玩轉電腦視覺與影像辨識為工程師職能加分】OpenCV 電腦 ...

4.充分活用OpenCV 函式庫，包含：影像處理、影片(視訊)處理、高階GUI 工具(圖形互動介面)、Image Processing 演算法實務、Computer Vision 演算法實務。 5.融會貫通基礎 ...

#43. 離散小波轉換應用於圖形識別及影像搜尋系統之研究 - 朝陽科技 ...

離散小波轉換為基礎，設計一個應用於圖形辨識及影像處理的演算法並實現成一個單晶片。然而二度空間的離散小波轉換是一個複雜的數學運算，所以有小波轉換的VLSI 架構設.

#44. GPU 程式設計-使用Eigenfaces 演算法在GPU 上的臉部偵測

有數種演算法目前用來偵測的表面，但在本文中，我利用eigenfaces 方法，其中一種 ... 此外，其他的圖形作業，例如模糊或反白顯示，通常執行臉部偵測程式和臉部偵測的 ...

#45. 第三章交通標誌偵測與辨識

除了一般常見的RGB 顏色系統外，實際上在電腦視覺或是圖形處理中，比較常用 ... 這個演算法所採取的做法，是由左到右，由上到下一列一列的掃描圖片，在第一列.

#46. 基於影像辨識之嵌入式系統設計與實現

即時性。關鍵字：嵌入式系統、人臉辨識、Haar-like 特徵、AdaBoost 演算法、即時的 ... 入式系統內核、作業系統和相關套件OpenCV 及Qt 圖形介面，最後為實際驗證本嵌.

#47. YOLOv3 監視器圖形辨識

以YOLO(version 3)作為圖形辨識演算法，辨識監視器畫面中之物件分類為何。監視器影片源自：https://www.youtube.com/watch?v=QHMbA1zULLA.

#48. AI電腦視覺/AI演算法/或邊緣運算實現研發工程師/或產品開發 ...

... 歡迎對AI視覺或圖形辨識廣泛應用有熱情者(開發人工智慧/機器學習相關產品，尤其是視覺)，熟悉AI演算法/深度學習/模型分析優化等，喜歡學習AI與新技術整合者或者AI ...

#49. AI & Big Data的演變趨勢(中)—演算法篇 - TAcc+

然而，當時的電腦的運算性能有限、Machine Learning的演算法都尚未成熟 ... 需要處理Deep Learning、3D遊戲等功能，這時候就需要圖形處理器(Graphics ...

#50. 影像辨識

影像辨識陳協成、游展昆吳旭祐、賴尚敬指導教授：黃冠雄教授摘要本專題主要在介紹幾種可以判斷出影像邊緣的演算法，並且以演算法的方式可以讓使用者輸入影像時，可以 ...

#51. 以AI建構工程新智慧－影像辨識技術之工程應用 - CTCI 中鼎集團

目前，影像辨識已可實現人臉辨識、入侵者偵測、車牌辨識等功能，而隨著相關資源的 ... 在深度學習系統中，機器會透過處理大量資料和演算法，來學會如何完成特定工作。

#52. 圖形辨識演算法 - NSQI

階層群聚演算法Selective Search 使用階層群聚演算法，以Graph Based Segmentation（實作可參考實作Graph Based Segmentation 圖形分割演算法）的結果為基礎，進行階層式的 ...

#53. 人眼辨識於FPGA 之初步研究Human Eyes Recognition by ...

然而，高解析度虹膜影像擷取需特殊裝備，因此吾人為了測試演算法正 ... 研究所圖形辨識實驗室等人所開發出CASIA[10]虹膜資料庫來解決。檢測完成會顯示瞳孔邊緣與瞳孔 ...

#54. 以影像辨識實現智慧型導覽系統

科技技術的快速發展，許多數位元影像處理工具不斷的發展，其中OpenCV（Open Source Computer. Vision Library）是一種跨平臺的影像演算法的函式庫（Gary and Adrian,2008） ...

#55. 完整解析AI人工智慧：3大浪潮＋3大技術＋3大應用｜大和有話說

遺傳演算法（Genetic algorithm；GA），又稱為演化式演算 ... 以影像辨識為例，為了讓AI學習類神經網路的模型，首先必須先將影像學習資料分割成像素 ...

#56. 機率式圖形演算法加持虹膜辨識準確率更上一層樓 - 新電子

機率式圖形演算法加持虹膜辨識準確率更上一層樓. 作者：栗永徽. 2017 年01 月03 日. 在過去幾十年以來，由於生物辨識大量的應用於法律認證身分、國家邊境管制、國土 ...

#57. 國立勤益科技大學電子工程系碩士班

本演算法為兩個階段，第一個階段將象棋影像作能量轉換。其方法. 為將輸入的影像經過前處理 ... 第三章象棋辨識演算法. ... 在圖形辨識中，其最大用途在於分離觀測的.

#58. 卷積神經網路Convolutional Neural Networks - 資料科學・機器 ...

CNN 最棒的地方是在一步一步說明原理的情況下，它是個很好理解的演算法。 ... 為了說明CNN，我們可以從一個非常簡單的例子開始：辨識圖片上的符號是圈還叉。

#59. OpenCV計算機視覺學習（13）——影像特徵點檢測（Harris角 ...

SIFT的應用範圍包括物體辨識，機器人地圖感知與導航，影像拼接，3D模型建立，手勢識別，影像追蹤等。 2.1.1 SIFT演算法具有的特徵. 影像的區域性特徵，對 ...

#60. OpenCV影像創意邁向AI視覺王者歸來（全彩印刷） - momo ...

24-3 修復蒙娜麗莎的微笑第二十五章辨識手寫數字 25-1 認識KNN演算法 25-2 認識Numpy與KNN演算法相關的知識 25-3 OpenCV的KNN演算法函數

#61. 本授權書所授權之論文為授權人在國立台中師範學院教育測驗統計

題答案辨識演算法及實作一套閱卷系統。在手寫是非、選擇題答案辨識系統方面,利用數位影像 ... 答案在前置處理後,將圖形細線化,然後計算其端點數,做為辨識用之特徵值;.

#62. 圖形辨識與物聯網之發展將日趨密切 - 每日頭條

前言圖形識別（Pattern recognition，或稱模式識別），為透過計算機運算 ... 圖形辨識(recognition)則是要判斷影像中物體所屬條件，相對於偵測，以人 ...

#63. 以垂直邊緣為基礎的自動景深估測方法之研究An Automatic ...

人類的雙眼具有辨識影像深度的功能，立體顯示技術一直是顯示. 技術的主要發展目標，而立體顯示的 ... 求得，otsu 演算法是以灰階影像來求得一個最佳的門檻值，且不會消.

#64. OpenCV 程式設計介紹

OpenCV (Open Source Computer Vision) 是由Intel 公司所開發出來的Open Source 圖形演算法的函式庫(Image Process Libary) 可以製做圖片，視訊，矩陣運算，統計，圖 ...

#65. 在NVIDIA Jetson nano 上執行深度學習範例：影像辨識

我們使用NVIDIA提供的jetson-inference範例，其中包含了影像辨識(Image Recognition)、物件偵測(Object Detection)、以及影像分割(Segmentation)。它是 ...

#66. 圖像辨識– 定義、技術原理、及其應用領域| OOSGA

根據Allied Market Research的調查，圖像辨識的市場非常有可能在2025年成長至860 ... 機器辨識狗時，若是同樣的演算法，我們需要同樣大小的數據才能讓模型表現的相當。

#67. AI 於影像分析

深度學習演算法更精細，並且若專⾨訓練，可以偵測更複雜的物 ... (機器學習處理單元)和DLPU (深度學習處理單元)，能夠以較CPU或GPU (圖形處理單元)更節.

#68. 導入並行運算功能向量處理器實現即時人臉偵測 - 新通訊

由於19×19畫素大小的人臉圖形可能的灰度值組合就有256361種，所以需要極 ... 通常人臉偵測演算法的即時執行是在中央處理器(CPU)較強大和記憶體容量較 ...

#69. 全球搶用的物件偵測演算法上線，最神速精準一眼揪出你有沒有 ...

YOLOv4是一種利用人工智慧執行即時物件偵測(Object Detection)的技術，能偵測物件、追蹤及判斷，可應用於交通車流計算、自駕車研發、工廠瑕疵檢測、醫療影像分析、五官定位 ...

#70. AI物件偵測暨辨識整合應用 - 中華行動數位

AIOT人工智慧OpenCV影像辨識應用白天職訓課程,Artificial Intelligence ... 人臉偵測與人臉識別; 機器學習演算法; 資料訓練與分類模型建立; 圖形分類; 視覺化二維資料 ...

#71. 人工智慧的大腦～演算法（algorithm） Topic - SI

以圖形辨識為例～辨識. 辨識「D」. 與「C」. D C. 定義黑為1，. 白為0. 圖形反覆. 辨識紀錄. 紀錄辨識. 計算的. 「值」. C. 辨識與結果對應. 計算「值」. 與結果的.

#72. AI 紙本資料辨識之經驗分享- Shu-Yu Huang - 台灣人工智慧學校

A.2.2. Table-OCR影像分割. 基於框線的特性，透過影像分割演算法將原本的標籤中有框線的部分一條一條偵測出來，接著 ...

#73. 【科技救地球】用演算法辨識水流！AI 偵測到962 起汙水排放事件

人工智慧技術如何發揮作用？「水流型態」是關鍵. 該研究由UKCEH 的Peter Hammond 教授領導，研究使用了一種圖形辨識（Pattern Recognition）演算 ...

#74. 機器的「深度學習」將為生物影像學帶來重大變革 - 元照

此研究使用「卷積神經網路」（Convolutional Neural Networks, CNN），為一種「深度學習」的演算法，此技術使影像處理變得更加容易、用途更加廣泛，運用在 ...

#75. OCR文字識別用的是什麼演算法？ - GetIt01

最好具體說一下OCR整個過程的步驟根據近期的一些paper總結一下，說的不對請多指正。General OCR一般包含兩步: 1. detection--&>找到包含文字的 ...

#76. 何謂語音辨識？ - 台灣| IBM

語音辨識演算法 · 自然語言處理(NLP)：雖然NLP 未必一定是語音辨識中所使用的特定演算法，但它屬於人工智慧的領域，它透過語音和文字聚焦人類與機器之間的 ...

#77. 如果你能辨識這些圖像內容，那你還是比AI 聰明 - 科技新報

July 22, 2019 by 愛范兒 Tagged: AI, 圖像辨識, 深度學習, 演算法AI 人工智慧, 軟體、系統 · Telegram share !

#78. 小吳哥教學中心- TensorFlow+Keras程式設計-----TensorFlow ...

MNIST手寫辨識演算法 https://youtu.be/7D5XACigNco TensorFlow 手寫辨識實作 ... TensorFlow+Keras CNN卷積深度學習Cifar-10圖形辨識 https://youtu.be/zYgBZNXAlt8

#79. 讓敵人無所遁形的軍事鷹眼！以多頻譜影像處理演算法進行目標 ...

因此如何更迅速捕捉敵軍的動向蹤跡，便成為國防軍備的一大研發重點。多頻譜影像技術能確切捕捉到物體反射的光譜資訊，並已在衛星、醫學、動植物辨識領域取得可行的成果。

#80. ‪黃雅軒‬ - ‪Google 學術搜尋‬

中華大學 - ‪影像處理、電腦視覺、圖形辨識、神經網路‬ ... 適應性日夜間速限路標偵測與辨識. 黃雅軒，李允善 ... 以AdaBoost 演算法為基礎的性別辨識.

#81. 讓敵人無所遁形的軍事鷹眼！以多頻譜影像處理演算法進行目標 ...

兩種模式最大的差異在於，三原色光模式的原理是紅、藍、綠的光線同時照射在視網膜上，我們眼睛會辨識成白光。四分色模式則是青色、洋紅、黃色顏料疊色 ...

#82. Amazon Rekognition – 常見問答集

Rekognition Video 可從存放或即時串流影片擷取動態內容，以協助您進行分析。 Rekognition Image 是一種影像辨識服務，可在影像中偵測物件、場景和人臉；擷取文字；辨識 ...

#83. Scikit-Learn 教學：Python 與機器學習

機器學習是一門設計如何讓演算法能夠學習的電腦科學，讓機器能夠透過觀察已知 ... 到9，意即我們的模型是要辨識手寫數字圖片是0 到9 中的哪一個數字。

#84. 北美智權報第235期：將人工智慧投入產業應用，台灣該怎麼做？

詹文男分析，因為電腦運算和儲存技術提升、演算法突破、以及各種物聯裝置 ... 美國一家農業新創公司Blue River，使用圖形辨識以及機器學習技術，發展 ...

#85. 運算密集、自訂機械視覺專用架構 - Texas Instruments

OpenCV 開放原始碼程式庫搭載. 許多可輕易匯至DSP 的視覺相關演算法。 DSP 可處理運算密集影像分析和處理運算，例如物件偵測、物件識別、邊緣偵測、色彩.

#86. 圖形辨識與物聯網之發展將日趨密切 - 壹讀

Hough Transform(霍式轉換)為此技術之經典算法，將圖形轉換成特徵空間，再由投票選取圖形。圖形辨識(recognition)則是要判斷影像中物體所屬條件，相對於偵 ...

#87. 辨識Strict 2-threshold 圖形的平行演算法 - 中興大學機構典藏 ...

Strict 2-threshold graph 為 Perfect Graph 之一種在本篇論文中, 我們提出幾項此圖之性質. 同時設計了一個平行演算法, 使用 CREN PRAM 的模式來辨認它 .

#88. 圖形識別應用

影像辨識於圖形識別之探討與次像素演算法之研究與應用論文名稱(外文): Exploration Of Image Recognition On Specific Patterns and Research Of Sub-pixel Algorithm ...

#89. 請問影像辨識與處理

各位大大: 有一圖形如下我想要得知矩形及圓形的邊綠資料須不須要作一些演算法如: RGB轉成其它模式、二值化、轉灰階、 ...

#90. 【看見改變】影像辨識正在改變你的生活！ - MakerPRO

此外，這項技術也能夠在攝影鏡頭偵測到的指定物件上畫上笑臉，再利用Google 大腦團隊開發的Tensorflow.js 進行深度學習，提升其偵測物體技術及準確度。

#91. 圖形辨識演算法《演算法圖鑑》第四章：圖形搜尋. - Pweon

影像辨識於圖形識別之探討與次像素演算法之研究與應用論文名稱(外文): Exploration Of Image Recognition On Specific Patterns and Research Of Sub-pixel Algorithm ...

#92. 深度學習與傳統機器視覺有何不同 - Cognex

傳統機器視覺系統在辨識一致且製造良好的組件時的表現穩定可靠。這類系統透過逐步篩檢和基於規則的演算法來運作，比人工檢測更具成本效率。

#93. 是否有一些眾所周知的演算法可以將使用者的繪圖變成平滑的 ...

首先，我想將繪圖轉換為盡可能類似於原始圖形的矩形。（如果使用者故意繪製其他東西 ... 更新：也許圖形辨識演算法會幫助我。有一些電話要求使用者 ...

#94. 圖形辨識c - Xvux

然而辨識圖片中的字母、數字的方法有很多，例如使用” 隨機森林(Random forest) 演算法”。作者: 0xde. A、C圖→ 很難判別，平淡的局部影像，沒有明顯的特性可供識別， ...

#95. 圖形辨識程式 - Mofy

圖形辨識期末專案—車輛顏色分類(Final Project – Car Color Classification) 期末 ... 圖片中的字母、數字的方法有很多，例如使用” 隨機森林(Random forest) 演算法”。

關於 圖形辨識演算法 ，我們在網路上蒐集到這些相關的討論、資訊與評價

「圖形辨識演算法」的推薦目錄：

圖形辨識演算法 在 吹著魔笛的浮士德 Facebook 的最佳解答

About author

圖形辨識演算法 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文

About author

圖形辨識演算法 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文

About author

你可能也想看看

搜尋相關連結

關於圖形辨識演算法，我們在網路上蒐集到這些相關的討論、資訊與評價

圖形辨識演算法在吹著魔笛的浮士德 Facebook 的最佳解答

圖形辨識演算法在台灣物聯網實驗室 IOT Labs Facebook 的精選貼文

圖形辨識演算法在台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文