158資源整合網(wǎng)提供各大名師講座視頻全集下載,企業(yè)管理培訓(xùn)課程視頻下載等;您想學(xué)習(xí)的資源,幾乎這里都有!
講座名師講座視頻網(wǎng)名師講座視頻名師講座視頻
資源整合導(dǎo)航
當(dāng)前位置: 講座視頻網(wǎng)首頁(yè) > 名師講座視頻 > 大學(xué)課程 > 【大學(xué)課堂】-模式識(shí)別

【大學(xué)課堂】-模式識(shí)別

Time:2013-11-03

大小:448 MB (14)

方式:百度網(wǎng)盤觀看下載

Tags:

課程講座內(nèi)容簡(jiǎn)介

【大學(xué)課堂】清華大學(xué)模式識(shí)別 內(nèi)容簡(jiǎn)介:模式識(shí)別(Pattern Recognition)是人類的一項(xiàng)基本智能,在日常生活中,人們經(jīng)常在進(jìn)行“模式識(shí)別”。隨著20世紀(jì)40年代計(jì)算機(jī)的出現(xiàn)以及50年代人工智能的興起,人們當(dāng)然也希望能用計(jì)算機(jī)來(lái)代替或擴(kuò)展人類的部分腦力勞動(dòng)。(計(jì)算機(jī))模式識(shí)別在20世紀(jì)60年代初迅速發(fā)展并成為一門新學(xué)科。
模式識(shí)別(Pattern Recognition)是指對(duì)表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進(jìn)行處理和分析,以對(duì)事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過(guò)程,是信息科學(xué)和人工智能的重要組成部分。模式識(shí)別又常稱作模式分類,從處理問(wèn)題的性質(zhì)和解決問(wèn)題的方法等角度,模式識(shí)別分為有監(jiān)督的分類(Supervised Classification)和無(wú)監(jiān)督的分類(Unsupervised Classification)兩種。二者的主要差別在于,各實(shí)驗(yàn)樣本所屬的類別是否預(yù)先已知。一般說(shuō)來(lái),有監(jiān)督的分類往往需要提供大量已知類別的樣本,但在實(shí)際問(wèn)題中,這是存在一定困難的,因此研究無(wú)監(jiān)督的分類就變得十分有必要了。
模式還可分成抽象的和具體的兩種形式。前者如意識(shí)、思想、議論等,屬于概念識(shí)別研究的范疇,是人工智能的另一研究分支。我們所指的模式識(shí)別主要是對(duì)語(yǔ)音波形、地震波、心電圖、腦電圖、圖片、照片、文字、符號(hào)、生物傳感器等對(duì)象的具體模式進(jìn)行辨識(shí)和分類。
模式識(shí)別研究主要集中在兩方面,一是研究生物體(包括人)是如何感知對(duì)象的,屬于認(rèn)識(shí)科學(xué)的范疇,二是在給定的任務(wù)下,如何用計(jì)算機(jī)實(shí)現(xiàn)模式識(shí)別的理論和方法。前者是生理學(xué)家、心理學(xué)家、生物學(xué)家和神經(jīng)生理學(xué)家的研究?jī)?nèi)容,后者通過(guò)數(shù)學(xué)家、信息學(xué)專家和計(jì)算機(jī)科學(xué)工作者近幾十年來(lái)的努力,已經(jīng)取得了系統(tǒng)的研究成果。
應(yīng)用計(jì)算機(jī)對(duì)一組事件或過(guò)程進(jìn)行辨識(shí)和分類,所識(shí)別的事件或過(guò)程可以是文字、聲音、圖像等具體對(duì)象,也可以是狀態(tài)、程度等抽象對(duì)象。這些對(duì)象與數(shù)字形式的信息相區(qū)別,稱為模式信息。
模式識(shí)別所分類的類別數(shù)目由特定的識(shí)別問(wèn)題決定。有時(shí),開(kāi)始時(shí)無(wú)法得知實(shí)際的類別數(shù),需要識(shí)別系統(tǒng)反復(fù)觀測(cè)被識(shí)別對(duì)象以后確定。
模式識(shí)別與統(tǒng)計(jì)學(xué)、心理學(xué)、語(yǔ)言學(xué)、 計(jì)算機(jī)科學(xué) 、生物學(xué)、控制論等都有關(guān)系。它與 人工智能 、 圖像處理 的研究有交叉關(guān)系。例如自適應(yīng)或自組織的模式識(shí)別系統(tǒng)包含了人工智能的學(xué)習(xí)機(jī)制;人工智能研究的景物理解、自然語(yǔ)言理解也包含模式識(shí)別問(wèn)題。又如模式識(shí)別中的預(yù)處理和特征抽取環(huán)節(jié)應(yīng)用圖像處理的技術(shù);圖像處理中的圖像分析也應(yīng)用模式識(shí)別的技術(shù)。
一、模式識(shí)別方法
1、決策理論方法
又稱統(tǒng)計(jì)方法,是發(fā)展較早也比較成熟的一種方法。被識(shí)別對(duì)象首先數(shù)字化,變換為適于計(jì)算機(jī)處理的數(shù)字信息。一個(gè)模式常常要用很大的信息量來(lái)表示。許多模式識(shí)別系統(tǒng)在數(shù)字化環(huán)節(jié)之后還進(jìn)行預(yù)處理,用于除去混入的干擾信息并減少某些變形和失真。隨后是進(jìn)行特征抽取,即從數(shù)字化后或預(yù)處理后的輸入模式中抽取一組特征。所謂特征是選定的一種度量,它對(duì)于一般的變形和失真保持不變或幾乎不變,并且只含盡可能少的冗余信息。特征抽取過(guò)程將輸入模式從對(duì)象空間映射到特征空間。這時(shí),模式可用特征空間中的一個(gè)點(diǎn)或一個(gè)特征矢量表示。這種映射不僅壓縮了信息量,而且易于分類。在決策理論方法中,特征抽取占有重要的地位,但尚無(wú)通用的理論指導(dǎo),只能通過(guò)分析具體識(shí)別對(duì)象決定選取何種特征。特征抽取后可進(jìn)行分類,即從特征空間再映射到?jīng)Q策空間。為此而引入鑒別函數(shù),由特征矢量計(jì)算出相應(yīng)于各類別的鑒別函數(shù)值,通過(guò)鑒別函數(shù)值的比較實(shí)行分類。
2、句法方法
又稱結(jié)構(gòu)方法或語(yǔ)言學(xué)方法。其基本思想是把一個(gè)模式描述為較簡(jiǎn)單的子模式的組合,子模式又可描述為更簡(jiǎn)單的子模式的組合,最終得到一個(gè)樹(shù)形的結(jié)構(gòu)描述,在底層的最簡(jiǎn)單的子模式稱為模式基元。在句法方法中選取基元的問(wèn)題相當(dāng)于在決策理論方法中選取特征的問(wèn)題。通常要求所選的基元能對(duì)模式提供一個(gè)緊湊的反映其結(jié)構(gòu)關(guān)系的描述,又要易于用非句法方法加以抽取。顯然,基元本身不應(yīng)該含有重要的結(jié)構(gòu)信息。模式以一組基元和它們的組合關(guān)系來(lái)描述,稱為模式描述語(yǔ)句,這相當(dāng)于在語(yǔ)言中,句子和短語(yǔ)用詞組合,詞用字符組合一樣。基元組合成模式的規(guī)則,由所謂語(yǔ)法來(lái)指定。一旦基元被鑒別,識(shí)別過(guò)程可通過(guò)句法分析進(jìn)行,即分析給定的模式語(yǔ)句是否符合指定的語(yǔ)法,滿足某類語(yǔ)法的即被分入該類。
模式識(shí)別方法的選擇取決于問(wèn)題的性質(zhì)。如果被識(shí)別的對(duì)象極為復(fù)雜,而且包含豐富的結(jié)構(gòu)信息,一般采用句法方法;被識(shí)別對(duì)象不很復(fù)雜或不含明顯的結(jié)構(gòu)信息,一般采用決策理論方法。這兩種方法不能截然分開(kāi),在句法方法中,基元本身就是用決策理論方法抽取的。在應(yīng)用中,將這兩種方法結(jié)合起來(lái)分別施加于不同的層次,常能收到較好的效果。
二、模式識(shí)別的應(yīng)用
模式識(shí)別可用于文字和語(yǔ)音識(shí)別、遙感和醫(yī)學(xué)診斷等方面。
① 文字識(shí)別
漢字已有數(shù)千年的歷史,也是世界上使用人數(shù)最多的文字,對(duì)于中華民族燦爛文化的形成和發(fā)展有著不可磨滅的功勛。所以在信息技術(shù)及計(jì)算機(jī)技術(shù)日益普及的今天,如何將文字方便、快速地輸入到計(jì)算機(jī)中已成為影響人機(jī)接口效率的一個(gè)重要瓶頸,也關(guān)系到計(jì)算機(jī)能否真正在我過(guò)得到普及的應(yīng)用。目前,漢字輸入主要分為人工鍵盤輸入和機(jī)器自動(dòng)識(shí)別輸入兩種。其中人工鍵入速度慢而且勞動(dòng)強(qiáng)度大;自動(dòng)輸入又分為漢字識(shí)別輸入及語(yǔ)音識(shí)別輸入。從識(shí)別技術(shù)的難度來(lái)說(shuō),手寫(xiě)體識(shí)別的難度高于印刷體識(shí)別,而在手寫(xiě)體識(shí)別中,脫機(jī)手寫(xiě)體的難度又遠(yuǎn)遠(yuǎn)超過(guò)了聯(lián)機(jī)手寫(xiě)體識(shí)別。到目前為止,除了脫機(jī)手寫(xiě)體數(shù)字的識(shí)別已有實(shí)際應(yīng)用外,漢字等文字的脫機(jī)手寫(xiě)體識(shí)別還處在實(shí)驗(yàn)室階段。
② 語(yǔ)音識(shí)別
語(yǔ)音識(shí)別技術(shù)技術(shù)所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽(tīng)覺(jué)機(jī)理、人工智能等等。近年來(lái),在生物識(shí)別技術(shù)領(lǐng)域中,聲紋識(shí)別技術(shù)以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢(shì)受到世人矚目,并日益成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌豺?yàn)證方式。而且利用基因算法訓(xùn)練連續(xù)隱馬爾柯夫模型的語(yǔ)音識(shí)別方法現(xiàn)已成為語(yǔ)音識(shí)別的主流技術(shù),該方法在語(yǔ)音識(shí)別時(shí)識(shí)別速度較快,也有較高的識(shí)別率。
③ 指紋識(shí)別
我們手掌及其手指、腳、腳趾內(nèi)側(cè)表面的皮膚凹凸不平產(chǎn)生的紋路會(huì)形成各種各樣的圖案。而這些皮膚的紋路在圖案、斷點(diǎn)和交叉點(diǎn)上各不相同,是唯一的。依靠這種唯一性,就可以將一個(gè)人同他的指紋對(duì)應(yīng)起來(lái),通過(guò)比較他的指紋和預(yù)先保存的指紋進(jìn)行比較,便可以驗(yàn)證他的真實(shí)身份。一般的指紋分成有以下幾個(gè)大的類別:環(huán)型(loop),螺旋型(whorl),弓型(arch),這樣就可以將每個(gè)人的指紋分別歸類,進(jìn)行檢索。指紋識(shí)別基本上可分成:預(yù)處理、特征選擇和模式分類幾個(gè)大的步驟。
③ 遙感
遙感圖像識(shí)別已廣泛用于農(nóng)作物估產(chǎn)、資源勘察、氣象預(yù)報(bào)和軍事偵察等。
④ 醫(yī)學(xué)診斷
在癌細(xì)胞檢測(cè)、X射線照片分析、血液化驗(yàn)、染色體分析、心電圖診斷和腦電圖診斷等方面,模式識(shí)別已取得了成效。
三、統(tǒng)計(jì)模式識(shí)別
統(tǒng)計(jì)模式識(shí)別(statistic pattern recognition)的基本原理是:有相似性的樣本在模式空間中互相接近,并形成“集團(tuán)”,即“物以類聚”。其分析方法是根據(jù)模式所測(cè)得的特征向量Xi=(xi1,xi2,…,xid)T(i=1,2,…,N),將一個(gè)給定的模式歸入C個(gè)類ω1,ω2,…, ωc中,然后根據(jù)模式之間的距離函數(shù)來(lái)判別分類。其中,T表示轉(zhuǎn)置;N為樣本點(diǎn)數(shù);d為樣本特征數(shù)。
統(tǒng)計(jì)模式識(shí)別的主要方法有:判別函數(shù)法,近鄰分類法,非線性映射法,特征分析法,主因子分析法等。
在統(tǒng)計(jì)模式識(shí)別中,貝葉斯決策規(guī)則從理論上解決了最優(yōu)分類器的設(shè)計(jì)問(wèn)題,但其實(shí)施卻必須首先解決更困難的概率密度估計(jì)問(wèn)題。BP神經(jīng)網(wǎng)絡(luò)直接從觀測(cè)數(shù)據(jù)(訓(xùn)練樣本)學(xué)習(xí),是更簡(jiǎn)便有效的方法,因而獲得了廣泛的應(yīng)用,但它是一種啟發(fā)式技術(shù),缺乏指定工程實(shí)踐的堅(jiān)實(shí)理論基礎(chǔ)。統(tǒng)計(jì)推斷理論研究所取得的突破性成果導(dǎo)致現(xiàn)代統(tǒng)計(jì)學(xué)習(xí)理論——VC理論的建立,該理論不僅在嚴(yán)格的數(shù)學(xué)基礎(chǔ)上圓滿地回答了人工神經(jīng)網(wǎng)絡(luò)中出現(xiàn)的理論問(wèn)題,而且導(dǎo)出了一種新的學(xué)習(xí)方法——支持向量機(jī)(SVM)。
四、模式識(shí)別技術(shù)的近乎無(wú)限的發(fā)展?jié)摿?br/> 模式識(shí)別技術(shù)是人工智能的基礎(chǔ)技術(shù),21世紀(jì)是智能化、信息化、計(jì)算化、網(wǎng)絡(luò)化的世紀(jì),在這個(gè)以數(shù)字計(jì)算為特征的世紀(jì)里,作為人工智能技術(shù)基礎(chǔ)學(xué)科的模式識(shí)別技術(shù),必將獲得巨大的發(fā)展空間。在國(guó)際上,各大權(quán)威研究機(jī)構(gòu),各大公司都紛紛開(kāi)始將模式識(shí)別技術(shù)作為公司的戰(zhàn)略研發(fā)重點(diǎn)加以重視。
1、語(yǔ)音識(shí)別技術(shù)
語(yǔ)音識(shí)別技術(shù)正逐步成為信息技術(shù)中人機(jī)接口(Human Computer Interface, HCI)的關(guān)鍵技術(shù),語(yǔ)音技術(shù)的應(yīng)用已經(jīng)成為一個(gè)具有競(jìng)爭(zhēng)性的新興高技術(shù)產(chǎn)業(yè)。中國(guó)互聯(lián)網(wǎng)中心的市場(chǎng)預(yù)測(cè):未來(lái)5年,中文語(yǔ)音技術(shù)領(lǐng)域?qū)?huì)有超過(guò)400億人民幣的市場(chǎng)容量,然后每年以超過(guò)30%的速度增長(zhǎng)。
2、生物認(rèn)證技術(shù)
生物認(rèn)證技術(shù)(Biometrics)本世紀(jì)最受關(guān)注的安全認(rèn)證技術(shù),它的發(fā)展是大勢(shì)所趨。人們?cè)敢馔羲械拿艽a、扔掉所有的磁卡,憑借自身的唯一性來(lái)標(biāo)識(shí)身份與保密。國(guó)際數(shù)據(jù)集團(tuán)(IDC)預(yù)測(cè):作為未來(lái)的必然發(fā)展方向的移動(dòng)電子商務(wù)基礎(chǔ)核心技術(shù)的生物識(shí)別技術(shù)在未來(lái)10年的時(shí)間里將達(dá)到100億美元的市場(chǎng)規(guī)模。
3、數(shù)字水印技術(shù)
90年代以來(lái)才在國(guó)際上開(kāi)始發(fā)展起來(lái)的數(shù)字水印技術(shù)(Digital Watermarking)是最具發(fā)展?jié)摿εc優(yōu)勢(shì)的數(shù)字媒體版權(quán)保護(hù)技術(shù)。IDC預(yù)測(cè),數(shù)字水印技術(shù)在未來(lái)的5年內(nèi)全球市場(chǎng)容量超過(guò)80億美元。
五、結(jié) 語(yǔ)
模式識(shí)別從20世紀(jì)20年代發(fā)展至今,人們的一種普遍看法是不存在對(duì)所有模式識(shí)別問(wèn)題都適用的單一模型和解決識(shí)別問(wèn)題的單一技術(shù),我們現(xiàn)在擁有的只是一個(gè)工具袋,所要做的是結(jié)合具體問(wèn)題把統(tǒng)計(jì)的和句法的識(shí)別結(jié)合起來(lái),把統(tǒng)計(jì)模式識(shí)別或句法模式識(shí)別與人工智能中的啟發(fā)式搜索結(jié)合起來(lái),把統(tǒng)計(jì)模式識(shí)別或句法模式識(shí)別與支持向量機(jī)的機(jī)器學(xué)習(xí)結(jié)合起來(lái),把人工神經(jīng)元網(wǎng)絡(luò)與各種已有技術(shù)以及人工智能中的專家系統(tǒng)、不確定推理方法結(jié)合起來(lái),深入掌握各種工具的效能和應(yīng)有的可能性,互相取長(zhǎng)補(bǔ)短,開(kāi)創(chuàng)模式識(shí)別應(yīng)用的新局面。
對(duì)于識(shí)別二維模式的能力,存在各種理論解釋。模板說(shuō)認(rèn)為,我們所知的每一個(gè)模式,在長(zhǎng)時(shí)記憶中都有一個(gè)相應(yīng)的模板或微縮副本。模式識(shí)別就是與視覺(jué)刺激最合適的模板進(jìn)行匹配。特征說(shuō)認(rèn)為,視覺(jué)刺激由各種特征組成,模式識(shí)別是比較呈現(xiàn)刺激的特征和儲(chǔ)存在長(zhǎng)時(shí)記憶中的模式特征。特征說(shuō)解釋了模式識(shí)別中的一些自下而上過(guò)程,但它不強(qiáng)調(diào)基于環(huán)境的信息和期待的自上而下加工。基于結(jié)構(gòu)描述的理論可能比模板說(shuō)或特征說(shuō)更為合適。

158資源整合網(wǎng):提供各類學(xué)習(xí)資源,名師講座視頻,培訓(xùn)課程視頻,音頻,文檔等···各類教程下載觀看。

推薦:只需¥98 充值開(kāi)通(終身VIP會(huì)員)就可以終身免費(fèi)下載學(xué)習(xí)全部資源,非常超值!【點(diǎn)擊立即開(kāi)通】
或者【點(diǎn)擊咨詢客服】開(kāi)通 ··· 更多名師講座內(nèi)容,點(diǎn)擊網(wǎng)站首頁(yè) tpyzk.cn 查看

微信掃一掃關(guān)注,158資源整合網(wǎng)

在線咨詢 加入VIP會(huì)員 加盟代理