本文是一篇機(jī)械論文,本文的主要工作以及研究?jī)?nèi)容總結(jié)如下: 1)介紹了智能自動(dòng)分類垃圾箱產(chǎn)品相關(guān)核心技術(shù)(深度學(xué)習(xí)、圖像識(shí)別、物聯(lián)網(wǎng))的發(fā)展情況,不銹鋼宣傳欄,闡述了目前全球垃圾資源現(xiàn)狀與國(guó)內(nèi)外對(duì)于垃圾分類所采取的政策與制度,最后對(duì)現(xiàn)有智能化垃圾分類產(chǎn)品做了分析; 2)設(shè)計(jì)了一種新的智能自動(dòng)分類垃圾箱產(chǎn)品解決方案并申請(qǐng)了國(guó)家發(fā)明專利,完成了包括垃圾箱機(jī)械結(jié)構(gòu)、傳動(dòng)系統(tǒng)、傳感器以及上下位機(jī)的嵌入式硬件設(shè)計(jì)部分,在完成了步進(jìn)電機(jī)選型后又對(duì)其 PID 控制做了深入研究;
1 緒論
1.1 課題研究背景及意義
垃圾分類作為建設(shè)和諧綠色社會(huì)環(huán)境所要達(dá)成的重要指標(biāo)之一。最早是在 1904 年的德國(guó)開(kāi)始相關(guān)政策的實(shí)行[1]。那時(shí)雖然垃圾分類制度并不完善,但人們漸漸地認(rèn)識(shí)到了保護(hù)自然環(huán)境和回收可再生資源的重要性。另一方面,垃圾分類回收處置可以幫助垃圾清理人員提高工作效率,降低資源損耗,對(duì)自然環(huán)境與社會(huì)經(jīng)濟(jì)都起到了良好的促進(jìn)作用[2]。因此,在過(guò)去這 117 年里,許多國(guó)家都開(kāi)始制定較為完善的法律制度,通過(guò)罰款等方式來(lái)約束市民強(qiáng)制進(jìn)行垃圾分類。
在國(guó)外,如日本[3]等發(fā)達(dá)國(guó)家由于垃圾分類政策制定較早,市民也基本形成了環(huán)保的意識(shí),故這些國(guó)家目前對(duì)垃圾的類別分的更細(xì),且對(duì)每種垃圾的丟棄方法和丟棄時(shí)間均有嚴(yán)格的要求,未按規(guī)定進(jìn)行垃圾分類將面臨巨額罰款,情節(jié)嚴(yán)重者將面臨坐牢的懲罰。在國(guó)內(nèi)也是如此,自從 2019 年 7 月份開(kāi)始,我國(guó)開(kāi)始針對(duì)省會(huì)城市及各直轄市實(shí)行垃圾分類政策,擬定于 2025 年末,國(guó)家地級(jí)及以上城市將基本建成垃圾分類處理系統(tǒng)[4]。從國(guó)內(nèi)外對(duì)垃圾分類的舉措可以看出垃圾分類儼然已經(jīng)成為社會(huì)亟需解決的問(wèn)題之一,這不僅僅關(guān)系到國(guó)家,更關(guān)系到我們每一個(gè)人。
...................................
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 深度學(xué)習(xí)發(fā)展現(xiàn)狀
深度學(xué)習(xí)起源于 2006 年,在神經(jīng)網(wǎng)絡(luò)算法經(jīng)歷了十多年的沉寂之后,加拿大 Hinton教授率先提出深度置信網(wǎng)絡(luò)的概念,在當(dāng)時(shí)的學(xué)術(shù)界引起了巨大轟動(dòng)。Hinton 教授提出深度置信網(wǎng)絡(luò)是由一系列受限波爾茲曼機(jī)構(gòu)成,并采用無(wú)監(jiān)督的逐層貪婪訓(xùn)練提取特征[8]。受到此項(xiàng)研究成果的啟發(fā),在 2012 年的 ImageNet 挑戰(zhàn)賽上,Hinton 教授團(tuán)隊(duì)?wèi){借其提出的 AlexNet[9]以極低的分類錯(cuò)誤率拉開(kāi)了與傳統(tǒng)方法之間的差距,一舉奪得該比賽的冠軍。2014 年在基于 AlexNet 結(jié)構(gòu)下繼續(xù)增大網(wǎng)絡(luò)深度的 VGGNet[10]和 GoogleNet[11]、2015 年時(shí)為了解決神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)過(guò)深時(shí)產(chǎn)生梯度消失現(xiàn)象而提出的 ResNet[12],以及之后人工智能落地在嵌入式設(shè)備中運(yùn)行的輕量級(jí)網(wǎng)絡(luò) ShuffleNet[13]和 MobileNet[14]??v觀深度學(xué)習(xí)的發(fā)展,深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)在不斷地向更深的層數(shù)探索,因?yàn)槠毡檎J(rèn)為更深層更復(fù)雜的網(wǎng)絡(luò)往往能夠?qū)W習(xí)到不同的特征,所以深度學(xué)習(xí)主要是通過(guò)增加網(wǎng)絡(luò)的層數(shù)(深度)來(lái)提高預(yù)測(cè)和識(shí)別精度。
傳統(tǒng)的分類方法如樸素貝葉斯[15]、Logistic 回歸[16]、支持向量機(jī)[17]等,在使用這些方法時(shí)最關(guān)鍵的一步就是要對(duì)不同種類垃圾圖像進(jìn)行手動(dòng)特征提取,分類結(jié)果的好壞很大程度上也是由選取特征的好壞和閾值的設(shè)置是否合適來(lái)決定。這項(xiàng)工作無(wú)疑給人們?cè)斐珊艽蟮睦_,
不銹鋼宣傳欄,當(dāng)要分類的對(duì)象更加復(fù)雜或不能很容易的找到其特征時(shí),分類效果會(huì)大幅下降。而深度學(xué)習(xí)方法則打破了傳統(tǒng)分類算法這一要求,在我們給予神經(jīng)網(wǎng)絡(luò)大量訓(xùn)練集時(shí),神經(jīng)網(wǎng)絡(luò)就可以自己在眾多訓(xùn)練集里提取特征,當(dāng)待識(shí)別對(duì)象越復(fù)雜時(shí)和傳統(tǒng)方法的差距也就越明顯。
目前,深度學(xué)習(xí)已經(jīng)融入到各個(gè)領(lǐng)域中,常見(jiàn)的有視頻監(jiān)控、語(yǔ)義分析、災(zāi)害預(yù)測(cè)、實(shí)物識(shí)別等[18],在這些應(yīng)用背景中深度學(xué)習(xí)已經(jīng)越來(lái)越成為其中最為核心的技術(shù),分類與識(shí)別的準(zhǔn)確率往往也都在 90%以上。但即使深度學(xué)習(xí)有著看似非常不錯(cuò)的成績(jī),我們對(duì)它的了解也少之甚少,這就是深度學(xué)習(xí)的“黑箱”問(wèn)題[19]。我們并不知道深度神經(jīng)網(wǎng)絡(luò)究竟提取了些什么特征,就像我們并不知道大腦是如何進(jìn)行訓(xùn)練才使得我們能夠判斷出眼睛所看到的東西,要真正的解決掉這個(gè)問(wèn)題,需要計(jì)算機(jī)科學(xué)、腦神經(jīng)科學(xué)、數(shù)學(xué)、認(rèn)知科學(xué)等多學(xué)科知識(shí)相互促進(jìn)、共同發(fā)展,所以深度學(xué)習(xí)在未來(lái)還有許多值得我們?nèi)ミM(jìn)一步探索的地方。
..............................
2 智能自動(dòng)分類垃圾箱核心技術(shù)概況
2.1 圖像分類識(shí)別技術(shù)
2.1.1 K 最近鄰分類法(KNN)
K 最近鄰(K-Nearest Neighbor)分類法[36]是機(jī)器學(xué)習(xí)領(lǐng)域內(nèi)一種常見(jiàn)的有監(jiān)督分類算法,其早在 1968 年就被提出,并很好的詮釋了“物以類聚”的思想。算法的原理是通過(guò)大量標(biāo)定數(shù)據(jù)集樣本中的不同特征,而實(shí)驗(yàn)證明,相同類別的數(shù)據(jù)所包含的特征也是相同或者相似的,當(dāng)碰到未知類別的數(shù)據(jù)時(shí),
指路牌燈箱,通過(guò)計(jì)算該數(shù)據(jù)和各類樣本集之間的“距離”,從而選取“距離”最近的樣本集類別作為該未知數(shù)據(jù)的類別。
使用前兩節(jié)所述的 K 最近鄰分類法和支持向量機(jī)算法做垃圾圖像的分類識(shí)別。當(dāng)待分類垃圾類別過(guò)多時(shí),識(shí)別率會(huì)顯著降低。還有最重要的一點(diǎn),對(duì)于垃圾圖像數(shù)據(jù)集而言,很難找到一個(gè)或多個(gè)非常合適的特征將不同類別垃圾分開(kāi)。而在 1989 年時(shí),LeCun 教授提出的卷積神經(jīng)網(wǎng)絡(luò)算法[41]解決了這一問(wèn)題,實(shí)現(xiàn)了圖像特征的自動(dòng)提取,也實(shí)現(xiàn)了多類別非線性圖像的分類識(shí)別,且層數(shù)越深效果越好。
卷積神經(jīng)網(wǎng)絡(luò)算法極好的詮釋了人類腦神經(jīng)網(wǎng)絡(luò)的機(jī)理。在人類大腦中,有數(shù)以億計(jì)的神經(jīng)元共同構(gòu)成了神經(jīng)網(wǎng)絡(luò)系統(tǒng),每個(gè)神經(jīng)元之間通過(guò)軸突和樹(shù)突(細(xì)胞體)相連接,并且各個(gè)神經(jīng)元間通過(guò)電信號(hào)和化學(xué)信號(hào)相互產(chǎn)生“交流”。
據(jù) 2.1.3 節(jié)所述,當(dāng)卷積神經(jīng)網(wǎng)絡(luò)層數(shù)增加時(shí),相應(yīng)的模型參數(shù)數(shù)量也會(huì)呈現(xiàn)爆炸式增長(zhǎng),對(duì)于普通的 CPU 硬件已經(jīng)不能夠承受如此規(guī)模的計(jì)算量。所以,一般在云服務(wù)器上做模型的訓(xùn)練。當(dāng)圖像數(shù)據(jù)集輸入模型后,模型參數(shù)從初始設(shè)定值到訓(xùn)練完成需要較長(zhǎng)的時(shí)間,而當(dāng)輸入發(fā)生變化時(shí)模型又得從頭開(kāi)始訓(xùn)練以適應(yīng)新的數(shù)據(jù)集。如此一來(lái),使用卷積神經(jīng)網(wǎng)絡(luò)做生活垃圾圖像的分類時(shí)效率極低。
遷移學(xué)習(xí)[43]就是為了解決這個(gè)問(wèn)題而引入的,這是由于圖像在邊緣、紋理和角點(diǎn)等特征具有許多相似之處,這樣就為遷移學(xué)習(xí)提供了理論基礎(chǔ)。故在數(shù)據(jù)集發(fā)生改變時(shí),可以繼續(xù)使用之前已經(jīng)訓(xùn)練過(guò)的模型做進(jìn)一步訓(xùn)練,對(duì)模型參數(shù)做微調(diào),而試驗(yàn)結(jié)果也證實(shí)了遷移學(xué)習(xí)的有效性。
.............................
2.2 深度卷積神經(jīng)網(wǎng)絡(luò)技術(shù)
2.2.1 基本構(gòu)件
卷積神經(jīng)網(wǎng)絡(luò)的基本構(gòu)件可分為卷積層、池化層和全連接層。其中,卷積層主要是用來(lái)獲取圖像特征的,而池化層則是用來(lái)降維,最后一步的全連接層是處理分類得到結(jié)果的。三種構(gòu)件按一定順序組合可將圖像完成分類。
通過(guò)卷積運(yùn)算來(lái)提取數(shù)據(jù)集特征。首先,需要設(shè)計(jì)一個(gè)核函數(shù)(Kernel Function),再使用設(shè)計(jì)好的核函數(shù)對(duì)輸入矩陣自左上開(kāi)始到右下按 strides 逐一進(jìn)行計(jì)算,當(dāng)希望學(xué)習(xí)和獲取到更多細(xì)節(jié)時(shí),就要擴(kuò)充卷積核的數(shù)量。