眾賞文庫
全部分類
  • 抗擊疫情 >
    抗擊疫情
    病毒認(rèn)知 防護(hù)手冊 復(fù)工復(fù)產(chǎn) 應(yīng)急預(yù)案 防控方案 英雄事跡 院務(wù)工作
  • 成品畢設(shè) >
    成品畢設(shè)
    外文翻譯 畢業(yè)設(shè)計(jì) 畢業(yè)論文 開題報(bào)告 文獻(xiàn)綜述 任務(wù)書 課程設(shè)計(jì) 相關(guān)資料 大學(xué)生活 期刊論文 實(shí)習(xí)報(bào)告
  • 項(xiàng)目策劃 >
    項(xiàng)目策劃
    土地準(zhǔn)備 規(guī)劃設(shè)計(jì) 開工開盤 項(xiàng)目綜合 竣工移交 售后移交 智慧方案 安全專項(xiàng) 環(huán)境影響評估報(bào)告 可行性研究報(bào)告 項(xiàng)目建議書 商業(yè)計(jì)劃書 危害評估防治 招投標(biāo)文件
  • 專業(yè)資料 >
    專業(yè)資料
    人文法律 環(huán)境安全 食品科學(xué) 基礎(chǔ)建設(shè) 能源化工 農(nóng)林牧畜 綜合待分類 教育經(jīng)驗(yàn) 行政人力 企業(yè)管理 醫(yī)學(xué)衛(wèi)生 IT技術(shù) 土木建筑 考研專題 財(cái)會(huì)稅務(wù) 公路隧道 紡織服裝
  • 共享辦公 >
    共享辦公
    總結(jié)匯報(bào) 調(diào)研報(bào)告 工作計(jì)劃 述職報(bào)告 講話發(fā)言 心得體會(huì) 思想?yún)R報(bào) 事務(wù)文書 合同協(xié)議 活動(dòng)策劃 代理加盟 技術(shù)服務(wù) 求職簡歷 辦公軟件 ppt模板 表格模板 融資協(xié)議 發(fā)言演講 黨團(tuán)工作 民主生活
  • 學(xué)術(shù)文檔 >
    學(xué)術(shù)文檔
    自然科學(xué) 生物科學(xué) 天文科學(xué) 醫(yī)學(xué)衛(wèi)生 工業(yè)技術(shù) 航空、航天 環(huán)境科學(xué)、安全科學(xué) 軍事 政學(xué) 文化、科學(xué)、教育、 交通運(yùn)輸 經(jīng)濟(jì) 語言、文字 文學(xué) 農(nóng)業(yè)科學(xué) 社會(huì)科學(xué)總論 藝術(shù) 歷史、地理 哲學(xué) 數(shù)理科學(xué)和化學(xué) 綜合性圖書 哲學(xué)宗教
  • 經(jīng)營營銷 >
    經(jīng)營營銷
    綜合文檔 經(jīng)濟(jì)財(cái)稅 人力資源 運(yùn)營管理 企業(yè)管理 內(nèi)控風(fēng)控 地產(chǎn)策劃
  • 教學(xué)課件 >
    教學(xué)課件
    幼兒教育 小學(xué)教育 初中教育 高中教育 職業(yè)教育 成人教育 高等教育 考研資源 試題真題 作業(yè)習(xí)題 課后答案 綜合教學(xué)
  • 土木建筑 >
    土木建筑
    專項(xiàng)施工 應(yīng)急預(yù)案 建筑規(guī)范 工藝方案 技術(shù)交底 施工表格 圖片圖集
  • 課程導(dǎo)學(xué) >
    課程導(dǎo)學(xué)
    醫(yī)學(xué)綜合 中醫(yī)養(yǎng)生 醫(yī)學(xué)研究 身心發(fā)展 醫(yī)學(xué)試題 影像醫(yī)學(xué) 醫(yī)院辦公 外科醫(yī)學(xué) 老年醫(yī)學(xué) 內(nèi)科醫(yī)學(xué) 婦產(chǎn)科 神經(jīng)科 醫(yī)學(xué)課件 眼鼻喉科 皮膚病科 腫瘤科 兒科醫(yī)學(xué) 康復(fù)醫(yī)學(xué) 全科醫(yī)學(xué) 護(hù)理學(xué)科 針灸學(xué)科 重癥學(xué)科 病毒學(xué)科 獸醫(yī) 藥學(xué)
  • 漢語 (共10000 份)
  • 用時(shí):17ms
    資源分類:
    全部 抗擊疫情 成品畢設(shè) 項(xiàng)目策劃 專業(yè)資料 共享辦公 學(xué)術(shù)文檔 經(jīng)營營銷 教學(xué)課件 土木建筑 課程導(dǎo)學(xué)
    二級分類:
    全部 自然科學(xué) 生物科學(xué) 天文科學(xué) 醫(yī)學(xué)衛(wèi)生 工業(yè)技術(shù) 航空、航天 環(huán)境科學(xué)、安全科學(xué) 軍事 政學(xué) 文化、科學(xué)、教育、體育 交通運(yùn)輸 經(jīng)濟(jì) 語言、文字 文學(xué) 農(nóng)業(yè)科學(xué) 社會(huì)科學(xué)總論 藝術(shù) 歷史、地理 哲學(xué) 數(shù)理科學(xué)和化學(xué) 綜合性圖書 哲學(xué)宗教
    三級分類:
    全部 政學(xué) 環(huán)境科學(xué)、安全科學(xué) 經(jīng)濟(jì) 數(shù)理科學(xué)和化學(xué) 自然科學(xué)總論 航空、航天 軍事 哲學(xué) 生物科學(xué) 工業(yè)技術(shù) 歷史、地理 文化、科學(xué)、教育、體育 醫(yī)學(xué)、衛(wèi)生 交通運(yùn)輸 語言、文字 天文學(xué)、地球科學(xué) 藝術(shù) 農(nóng)業(yè)科學(xué) 哲學(xué)、宗教 文學(xué) 社會(huì)科學(xué)總論
    四級分類:
    全部 語言學(xué) 常用外國語 漢語 中國少數(shù)民族語言 漢藏語系
    上傳類型:
    全部 互聯(lián)網(wǎng)共享 作者原創(chuàng) 獨(dú)家資料
    資源格式:
    不限 doc ppt pdf 圖片 flash 視頻 音頻 壓縮包
    上架時(shí)間:
    不限 三天內(nèi) 一周內(nèi) 一個(gè)月內(nèi) 一年內(nèi)
    特色搜索:
    不限 文件包巨大 瀏覽量超巨 購買量排行 子文件超多好評如潮
    • 簡介:文語轉(zhuǎn)換是一種比較高級的、有廣泛應(yīng)用價(jià)值的計(jì)算機(jī)語音輸出的形式具有廣泛的應(yīng)用前景該論文針對主要合成基元為詞的漢語文語轉(zhuǎn)換系統(tǒng)從制約其合成音質(zhì)的幾個(gè)角度出發(fā)進(jìn)行研究由于詞的切分的準(zhǔn)確率和歧義切分正確率直接影響輸出語音的自然度該文對詞的切分和歧義消除算法進(jìn)行研究并給出了改進(jìn)方案即在雙向最大匹配分詞算法的基礎(chǔ)上采用NNSVM來消除交集型歧義韻律特征與合成語句的自然度和連貫性關(guān)系極大該文還從音高、時(shí)長和能量幾個(gè)角度來研究文語轉(zhuǎn)換系統(tǒng)中的韻律處理概括了詞的基頻、時(shí)長、能量在連續(xù)語流中的變化規(guī)則最后從實(shí)用化角度出發(fā)開發(fā)出應(yīng)用于首都機(jī)場終端信息系統(tǒng)ATIS的實(shí)用的漢語文語轉(zhuǎn)換系統(tǒng)此系統(tǒng)運(yùn)用波形拼接的合成方法以詞為主要合成基元專用語句為輔助基元系統(tǒng)經(jīng)測聽合成質(zhì)量可以達(dá)到新聞廣播水平
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-11
      頁數(shù): 80
      8人已閱讀
      ( 4 星級)
    • 簡介:關(guān)鍵詞檢出是語音識別研究中的一個(gè)重要領(lǐng)域,其目的是從連續(xù)語音中檢測出并確認(rèn)給定的若干個(gè)特定關(guān)鍵詞。跟關(guān)鍵詞檢出相比,目前連續(xù)語音識別有資源耗費(fèi)大,速度慢,抗噪能力不強(qiáng)等缺點(diǎn),這是連續(xù)語音識別短期內(nèi)難以突破的問題所在。而關(guān)鍵詞檢出允許在嘈雜的環(huán)境中使用,因此在當(dāng)前技術(shù)水平下,許多應(yīng)用領(lǐng)域不適合連續(xù)語音識別,而要求關(guān)鍵詞檢出,這一課題的研究如能取得突破性進(jìn)展,則將大大有助于拓寬語音識別系統(tǒng)的應(yīng)用領(lǐng)域。由于本論文在關(guān)鍵詞檢出方面的研究剛剛起步,且非特定人大詞匯量關(guān)鍵詞檢出系統(tǒng)需要建立詞典,涉及到很多語言學(xué)知識,并且需要大型語料庫,因此本論文主要研究了漢語小詞匯量非特定人關(guān)鍵詞檢出算法,結(jié)合漢語語音的特點(diǎn),提出了一種新的關(guān)鍵詞檢出算法在語音信號預(yù)處理階段,首先對信號進(jìn)行小波變換,然后引入TEAGER能量算子,將連續(xù)語音信號切分成音節(jié);選用MEL倒譜系數(shù)(MFCC)作為語音信號的特征參數(shù);采用連續(xù)隱馬爾可夫模型對關(guān)鍵詞和非關(guān)鍵詞建模;在搜索識別階段,以詞(雙音節(jié))為搜索單位,采用VITERBI算法進(jìn)行詞內(nèi)解碼,大大減少了搜索空間,提高了搜索效率,降低了算法復(fù)雜度;在關(guān)鍵詞確認(rèn)階段,采用似然比檢驗(yàn)的值作為置信度,實(shí)現(xiàn)了無語法限制的基于識別一確認(rèn)兩級結(jié)構(gòu)的關(guān)鍵詞檢出。本文用MATLAB70軟件作為編程和測試平臺,用ADOBEAUDITION15在實(shí)驗(yàn)室環(huán)境下錄制語音信號,建立小型語料庫進(jìn)行離線訓(xùn)練和在線識別。實(shí)驗(yàn)結(jié)果表明,本論文提出的算法具有有效性及可行性,適用于漢語非特定人小詞匯量關(guān)鍵詞檢出系統(tǒng)。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 43
      4人已閱讀
      ( 4 星級)
    • 簡介:漢語數(shù)字語音識別MDSR,MARINDIGITSPEECHRECOGNITION是語音識別領(lǐng)域中一個(gè)具有廣泛應(yīng)用背景的分支,在電話語音撥號,門禁系統(tǒng)、身份證號碼確認(rèn)等領(lǐng)域都有重要的應(yīng)用價(jià)值。但漢語數(shù)字語音識別存在語音的音節(jié)較少等缺點(diǎn),導(dǎo)致各個(gè)數(shù)字之間的混淆度很高,識別起來有相當(dāng)?shù)睦щy。本文主要研究了目前的漢語數(shù)字語音識別技術(shù),并通過改進(jìn)來提高其系統(tǒng)的識別性能。從基于語音信號產(chǎn)生的數(shù)字模型出發(fā),研究了一個(gè)完整語音識別系統(tǒng)的各個(gè)組成部分,包括前期的預(yù)處理、語音模型的訓(xùn)練、識別算法的處理等。本文的主要工作如下1、在討論和比較語音信號各種傳統(tǒng)特征參數(shù)的提取方案,包括線性預(yù)測倒譜系數(shù)LPCC、MEL頻率倒譜系數(shù)MFCC的基礎(chǔ)上,研究了基于聽覺特性BARK尺度子波變換的語音特征參數(shù)提取方案來提高參數(shù)的穩(wěn)定性。初步研究了一種基于生物視覺機(jī)制基礎(chǔ)上產(chǎn)生的脈沖耦合神經(jīng)網(wǎng)絡(luò)來提取語音特征,并對其進(jìn)行改進(jìn)。2、在模式匹配上,在討論傳統(tǒng)的動(dòng)態(tài)時(shí)間彎折DTW算法基礎(chǔ)上,提出了基于密度函數(shù)估計(jì)和貝葉斯決策理論而建立的人工神經(jīng)網(wǎng)絡(luò)即概率神經(jīng)網(wǎng)絡(luò)PNN來建立識別模型。3、對模型訓(xùn)練和識別算法進(jìn)行了軟件仿真,建立了用于訓(xùn)練和測試的數(shù)字語音數(shù)據(jù)庫,創(chuàng)建了人機(jī)交互界面,并對識別算法的實(shí)時(shí)性和準(zhǔn)確性進(jìn)行了測試,給出主要的仿真結(jié)果和結(jié)論。最后提出了本課題今后進(jìn)一步研究和改進(jìn)的方向。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 57
      5人已閱讀
      ( 4 星級)
    • 簡介:本研究探討了漢語句子歧義消除的眼動(dòng)行為研究,分別涉及漢語的詞組、第三人稱代詞與動(dòng)詞偏向的理解過程,由四個(gè)大部分構(gòu)成,第一部分介紹了眼動(dòng)行為的研究方法與基本理論。具體地講,具有信息加工系統(tǒng)的人在閱讀句子時(shí)出現(xiàn)了一系列眼動(dòng)行為之后便獲得了新的信息,從而構(gòu)成了課文意義的心理表征。目前解釋眼動(dòng)行為的模型主要有最簡控制模型、視覺控制模型和認(rèn)知控制理論。跳讀、詞匯加工、視敏度、注意和強(qiáng)化學(xué)習(xí)都是影響眼動(dòng)的主要因素。第二部分研究在兩個(gè)實(shí)驗(yàn)中以眼動(dòng)控制方法探討了影響漢語四字詞組歧義出現(xiàn)的因素。INHOFF和WU2005的研究結(jié)果表明在句子理解過程中偏正詞組??茖W(xué)生中間的兩個(gè)字符出現(xiàn)了歧義效應(yīng),我們的實(shí)驗(yàn)21結(jié)果得到了相反的結(jié)論;實(shí)驗(yàn)22檢驗(yàn)了這種詞組出現(xiàn)歧義效應(yīng)的必要條件即這兩個(gè)字符作為先行詞必須出現(xiàn)在句首,這是一種新近性效應(yīng)。結(jié)果表明這個(gè)先行詞是漢語四字詞組歧義出現(xiàn)的必要條件,這符合單一方向的句法分析假設(shè)與先行詞聯(lián)想效應(yīng)。第三部分研究報(bào)告的一項(xiàng)眼動(dòng)實(shí)驗(yàn)研究以漢語的單數(shù)第三人稱代詞句子探討了潛在先行詞的詞匯特征及其句法特征與代詞所指之間的關(guān)系,結(jié)果表明如果第三人稱代詞的性別與它的所指一致時(shí)閱讀的時(shí)間便會(huì)減少,在不一致時(shí)閱讀的時(shí)間更長一些,這與第一個(gè)句子的主動(dòng)結(jié)構(gòu)或者被動(dòng)結(jié)構(gòu)無關(guān),這表明在語言加工過程中如何理解第三人稱代詞,兩個(gè)因素即潛在先行詞的詞匯特征及其句法特征強(qiáng)烈地影響著代詞所指的難度。第四部分研究在兩個(gè)實(shí)驗(yàn)中以眼動(dòng)技術(shù)檢驗(yàn)了影響暫時(shí)歧義出現(xiàn)的兩個(gè)因素即動(dòng)詞的偏向效應(yīng)與可能性效應(yīng),實(shí)驗(yàn)41檢驗(yàn)了DOSC歧義句與SVO句子之間的關(guān)系,與無歧義的SVO句子相比,DOSC結(jié)構(gòu)句子出現(xiàn)歧義是由于主要?jiǎng)釉~的偏向效應(yīng)引起的;實(shí)驗(yàn)42檢驗(yàn)了動(dòng)詞偏向效應(yīng)對DOSC歧義句的影響,結(jié)果表明及物動(dòng)詞具有偏向效應(yīng),很有可能引起DOSC結(jié)構(gòu)句子的歧義,而不及物動(dòng)詞具有偏向效應(yīng)的可能性很低,不會(huì)引起DOSC結(jié)構(gòu)句子的暫時(shí)歧義效應(yīng)。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 58
      5人已閱讀
      ( 4 星級)
    • 簡介:本文將領(lǐng)域漢語理解應(yīng)用于機(jī)械加工過程設(shè)計(jì)專家系統(tǒng)的人機(jī)接口中,通過對用漢語形式表達(dá)的用戶需求進(jìn)行理解和分析,將分析結(jié)果轉(zhuǎn)化成概念設(shè)計(jì)的要求,從而使得專家系統(tǒng)更加智能化和人性化。針對領(lǐng)域漢語理解對知識表示和知識庫系統(tǒng)的需求,結(jié)合現(xiàn)有的知識表示方法,建立了知識庫系統(tǒng),設(shè)計(jì)并實(shí)現(xiàn)了相應(yīng)的知識庫管理系統(tǒng)。首先,分析了自然語言的特點(diǎn),以及知識庫系統(tǒng)的發(fā)展,可以看到知識庫技術(shù)對自然語言理解系統(tǒng)起著至關(guān)重要的作用。通過對比現(xiàn)有知識表示方法的優(yōu)缺點(diǎn),將產(chǎn)生式系統(tǒng)與概念從屬理論相結(jié)合作為知識表示方法。分析了概念、概念的屬性、概念的性質(zhì)、概念的內(nèi)涵與外延、知識庫中概念的關(guān)聯(lián),為以后建立領(lǐng)域過程樹模型提供了理論支持。通過對知識庫中的知識進(jìn)行分類和整理,利用領(lǐng)域過程樹和概念從屬樹等進(jìn)行知識表示,降低了知識庫的冗余度,簡化了知識庫,節(jié)省了存儲(chǔ)空間,提高了系統(tǒng)的效率。設(shè)計(jì)了知識庫管理系統(tǒng),用以對知識進(jìn)行管理。最后,將領(lǐng)域漢語理解知識庫應(yīng)用于機(jī)械加工過程設(shè)計(jì)專家系統(tǒng)的接口上,并實(shí)現(xiàn)了知識庫管理系統(tǒng),結(jié)果較為滿意。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 58
      12人已閱讀
      ( 4 星級)
    • 簡介:在自然語言處理NLP中,歧義問題一直是研究的重點(diǎn)和難點(diǎn)。它是一項(xiàng)“中間任務(wù)”,對于自然語言處理中的許多應(yīng)用領(lǐng)域具有重要的理論和實(shí)踐意義,包括機(jī)器翻譯、信息檢索、句法分析、語音合成等,該問題解決的好壞將直接關(guān)系到這些應(yīng)用問題的效果優(yōu)劣。尤其是短語結(jié)構(gòu)的歧義,它已經(jīng)成為影響句法分析效率和準(zhǔn)確率的重要因素。本文主要是在研究獲取支持短語結(jié)構(gòu)消歧的方法基礎(chǔ)上,給出了一整套基于語義相關(guān)度計(jì)算的短語結(jié)構(gòu)的歧義消解策略。論文主要從以下幾個(gè)方面作了重點(diǎn)研究和創(chuàng)新首先,介紹了短語結(jié)構(gòu)歧義的類型,比較和詳細(xì)分析了以往的短語結(jié)構(gòu)歧義消解策略,提出了基于語義的短語結(jié)構(gòu)消歧策略;同時(shí)通過比較分析了各種語義學(xué)的理論及各種語義知識表示方法后,提出了利用知識圖的知識表示方式來表示語義知識。其次,給出了知識圖中的語義知識資源是根據(jù)知網(wǎng)中語義詞典自動(dòng)生成的,及在短語分析過程中生成短語圖的原理。本文將把語義知識應(yīng)用到了語義計(jì)算上,詳細(xì)分析了基于語義詞典的相似度計(jì)算原理,并提出了基于知網(wǎng)語義相關(guān)度計(jì)算方法。該方法利用知網(wǎng)中義原之間的縱向和橫向關(guān)系及實(shí)例因素計(jì)算出不同詞性的相關(guān)度,根據(jù)相似度的對稱性計(jì)算實(shí)例的影響因素,由此提高語義相關(guān)度的準(zhǔn)確率。最后,關(guān)于短語結(jié)構(gòu)的歧義消解的進(jìn)一步工作進(jìn)行了總結(jié)和展望。本文提出的基于語義相關(guān)度計(jì)算的短語結(jié)構(gòu)消歧模型,使得漢語句法分析效率得到了進(jìn)一步的提高,在自然語言處理中歧義消歧系統(tǒng)的開發(fā)有一定的指導(dǎo)和借鑒意義。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 54
      5人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 56
      5人已閱讀
      ( 4 星級)
    • 簡介:文學(xué)碩士學(xué)位論文延邊漢語小說創(chuàng)作延邊漢語小說創(chuàng)作研究研究以天池為中心以天池為中心THESTUDYINTHEFIELDOFVISIONONTHETHESTUDYINTHEFIELDOFVISIONONTHENOVELNOVELOFCHINESEOFYANBIANOFCHINESEOFYANBIANRAGARDAGARD“TIANCHI”“TIANCHI”ASASTHETHECENTREENTRE李玲李玲中國現(xiàn)當(dāng)代文學(xué)中國現(xiàn)當(dāng)代文學(xué)延邊大學(xué)學(xué)校代碼10184分類號分類號密級UDC學(xué)號2011010294延邊大學(xué)碩士學(xué)位論文延邊大學(xué)碩士學(xué)位論文延邊漢語小說創(chuàng)作研究以天池為中心研究生姓名李玲培養(yǎng)單位人文社會(huì)科學(xué)學(xué)院指導(dǎo)教師姓名、職稱溫兆海教授學(xué)科專業(yè)中國現(xiàn)當(dāng)代文學(xué)研究方向中國現(xiàn)當(dāng)代作家作品研究論文提交日期2014年5月18日
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 59
      10人已閱讀
      ( 4 星級)
    • 簡介:詞義消歧WDSENSEDISAMBIGUATION,WSD是計(jì)算語言學(xué)和自然語言處理領(lǐng)域一個(gè)重要的研究課題,也是近些年來該領(lǐng)域的熱點(diǎn)研究問題之一。詞義消歧結(jié)果的好壞直接影響到機(jī)器翻譯、信息檢索、句法分析和語音識別等應(yīng)用領(lǐng)域。因此詞義消歧研究在自然語言處理領(lǐng)域中具有重要的理論和實(shí)踐意義。詞義消歧方法有多種,目前基于知識庫的詞義消歧方法研究相對較少。對于這種有別于統(tǒng)計(jì)消歧的方法,在開放文本領(lǐng)域表現(xiàn)出明顯的優(yōu)勢,而且該方法優(yōu)于基于語料庫的有指導(dǎo)學(xué)習(xí)方法。近幾年來本體ONTOLOGY研究迅速發(fā)展,目前在本體的內(nèi)容、本體的表達(dá)方式、構(gòu)建規(guī)則、自動(dòng)化構(gòu)建技術(shù)等諸多方面,都有持續(xù)深入的研究。隨著越來越多高質(zhì)量本體的出現(xiàn),本體的應(yīng)用越來越多的受人關(guān)注。本文沿著基于知識庫消歧的方向,提出了一種利用中文本體知識庫知網(wǎng)的相關(guān)資源、上下文信息等來進(jìn)行詞義消歧的一種方法,并通過計(jì)算詞語的相關(guān)度和相似度來實(shí)現(xiàn)本文的詞義消歧。具體的研究圍繞以下幾個(gè)方面現(xiàn)階段,很多詞義消歧的研究大多采用幾個(gè)有代表性的歧義詞作為研究與測試的對象,在實(shí)際應(yīng)用中有一定的局限性,因此本文希望能夠針對真實(shí)的應(yīng)用情況,對大規(guī)模文本進(jìn)行詞義消歧的研究。文中指出對任意輸入的文本進(jìn)行分詞和詞性標(biāo)注后,再利用知網(wǎng)字典資源識別出文本中的多義詞,解決了真實(shí)應(yīng)用中存在的問題。利用本體作為詞義消歧的知識庫,避免了人工訓(xùn)練語料庫獲取詞義的復(fù)雜過程,并能提供準(zhǔn)確的含義,同時(shí)還能對大規(guī)模的多義詞實(shí)現(xiàn)消歧。在利用上下文一定大小的窗口提取歧義詞的特征詞時(shí),提出了基于三次互信息的思想來計(jì)算歧義詞和上下文詞語的相關(guān)度,有效地區(qū)別了高頻詞和低頻詞,并根據(jù)相關(guān)度的大小,提取出帶有歧義詞大量信息的特征詞。根據(jù)本體是共享概念模型的明確的形式化的規(guī)范說明,是對世界知識的概念化描述,它可以作為自然語言處理系統(tǒng)中的世界知識庫的特點(diǎn)本文主要利用中文知網(wǎng)的資源以及概念和概念之間的關(guān)系,提出了利用改進(jìn)的相似度計(jì)算結(jié)果的大小來判斷歧義詞在特定上下文中的準(zhǔn)確含義,從而實(shí)現(xiàn)詞義消歧。實(shí)驗(yàn)證明本文的詞義消歧準(zhǔn)確率比以前的幾種方法有較大的提高,進(jìn)一步說明了論文中的詞義消歧方法是可行的和高效的。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 53
      6人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 58
      5人已閱讀
      ( 4 星級)
    • 簡介:耳語音說話人識別在公共場合下的通訊、安全場所的身份鑒定、罪犯識別、電話網(wǎng)絡(luò)查詢與電話銀行等領(lǐng)域都有著一定的實(shí)用價(jià)值。它是一個(gè)較新的研究課題有許多問題尚待解決。由于耳語發(fā)音方式的特殊性加上耳語通話常常在手機(jī)方式下進(jìn)行耳語音說話人識別受說話人發(fā)音狀態(tài)、健康狀況、心理因素及信道環(huán)境因素的影響變得更為突出。因此用正常音建立的說話人識別系統(tǒng)對耳語音說話人識別基本不適用識別性能將大為下降。目前已有的自適應(yīng)補(bǔ)償方法都將說話人變化和信道環(huán)境變化這兩種因素混在一起不加區(qū)分這樣的處理方式必然會(huì)影響耳語音說話人識別的識別效果。為此有必要針對耳語音的特點(diǎn)建立合適的識別模型來實(shí)現(xiàn)文本無關(guān)的耳語音說話人識別。本文提出采用聯(lián)合因子分析JFA的方法來解決耳語發(fā)音時(shí)受多種因素影響說話人語音特征變異大的問題該方法針對耳語音的特點(diǎn)引入了兩類變化因子說話人自身變化因子和通話信道環(huán)境變化因子。鑒于聯(lián)合因子分析的難點(diǎn)本文提出了一種適用于耳語音說話人識別的簡化的聯(lián)合因子分析方法其最主要的特點(diǎn)是分開估計(jì)說話人空間和信道空間因此在算法的復(fù)雜度和語音數(shù)據(jù)的需求量上都有很大的下降從而大大降低了運(yùn)算量和運(yùn)算時(shí)間。本文建立了一種基于簡化的JFA方法的識別模型并且給出了相應(yīng)的算法在此基礎(chǔ)上實(shí)現(xiàn)了耳語發(fā)音方式下與文本無關(guān)的說話人辨認(rèn)。對本文提出的簡化的JFA識別模型在8種不同的信道環(huán)境情況下分別進(jìn)行測試實(shí)驗(yàn)證明該模型在信道失配的情況下也能有效地辨認(rèn)耳語音說話人并與已有的采用MAP、特征映射FEATUREMAPPING和說話人模型合成SMS方法的GMM模型進(jìn)行比較識別正確率有了明顯的提高。此外還研究了說話人因子數(shù)和信道因子數(shù)對該識別模型性能的影響實(shí)驗(yàn)發(fā)現(xiàn)適當(dāng)?shù)卦黾诱f話人因子數(shù)和信道因子數(shù)有助于提高識別的正確率但是兩者均存在著一定的飽和問題即繼續(xù)增加說話人因子數(shù)和信道因子數(shù)對識別模型的性能幾乎沒有任何提高。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 84
      12人已閱讀
      ( 4 星級)
    • 簡介:在語音識別領(lǐng)域漢語語文轉(zhuǎn)換是一個(gè)熱點(diǎn)話題隱馬爾可夫模型HMM是語文轉(zhuǎn)換中常用的方法。它能很好地描述語音信號的平穩(wěn)性和可變性近年來倍受國內(nèi)外學(xué)者的高度重視但其識別性能卻不能令人滿意。在語文轉(zhuǎn)換的音庫詞庫設(shè)計(jì)模式方面也存在多種不同設(shè)計(jì)模式。而不同的模式會(huì)有不同的占比空間率和轉(zhuǎn)換效率如何找到一種高效的音庫詞庫設(shè)計(jì)模式則變得尤為重要。本論文將對這兩方面的改進(jìn)提出一種的新的算法和設(shè)計(jì)模式以提高語文轉(zhuǎn)換的轉(zhuǎn)換效率。語文轉(zhuǎn)換在采樣量化過程中的算法研究一直是一個(gè)研究難點(diǎn)且對于語音環(huán)境的要求也非常復(fù)雜本論文擬改變以往的傳統(tǒng)HMM研究方法引入了一種改進(jìn)型的識別算法NHMM進(jìn)一步提高了語文轉(zhuǎn)換中的轉(zhuǎn)換效率。傳統(tǒng)的HMM算法雖然被廣泛應(yīng)用但是它自身也存在著一定缺陷比如說由于它只是一個(gè)概率和統(tǒng)計(jì)理論算法并且是離散型概率統(tǒng)計(jì)算法所以它不能很好的描述語音信號的時(shí)間相依性且對于量化時(shí)的誤差分析也沒有著重考慮這樣會(huì)在一定程度上降低語文轉(zhuǎn)換的識別率。因此本文提出了一種能夠引入加權(quán)函數(shù)的算法NHMM算法。NHMM算法是本論文在HMM算法的基礎(chǔ)上提出的一種改進(jìn)型算法就是為了進(jìn)一步減少語音信號在量化的過程中出現(xiàn)的較大誤差。為了提高語音信號的識別率在NHMM算法中加入了一個(gè)新變量量化誤差E作為加權(quán)值加入到HMM算法的參數(shù)序列中讓其作為HMM算法的一個(gè)參數(shù)參與運(yùn)算這樣將量化誤差作為考慮因素的改進(jìn)型HMM算法在識別率上相比傳統(tǒng)的HMM算法有了很大的提高。在設(shè)計(jì)音庫詞庫方面在查閱大量的關(guān)于漢語語文轉(zhuǎn)換的相關(guān)文獻(xiàn)的過程中發(fā)現(xiàn)很多研究都是將重點(diǎn)放在語文轉(zhuǎn)換中的音庫設(shè)計(jì)上都是在力求音庫文件的最大覆蓋性但詳盡化的音庫文件設(shè)計(jì)必然導(dǎo)致庫體容量的快速增大這對終端的硬件配置提出了非常大的挑戰(zhàn)如果占用大量系統(tǒng)資源必然導(dǎo)致其可行性下降。本論文的研究切入點(diǎn)是盡量精簡語文轉(zhuǎn)換的音庫文件這必然導(dǎo)致在語文轉(zhuǎn)換時(shí)對人的口語錄入的準(zhǔn)確性進(jìn)行了忽略考慮。從粗糙采樣的設(shè)計(jì)理念出發(fā)模糊化采樣精度進(jìn)一步提高了語文轉(zhuǎn)換中詞庫匹配的效率。通過三種庫體的設(shè)計(jì)結(jié)構(gòu)的優(yōu)劣比較最終確定一種最高效的庫體設(shè)計(jì)模式。在最終的方法中詞庫結(jié)構(gòu)采用三段格式分別是單字表、雙字表和詞庫。通過這種設(shè)計(jì)模式在不降低語文轉(zhuǎn)換精確度的前提下對語音實(shí)行粗糙性錄入降低音庫容量的同時(shí)詳實(shí)化詞庫結(jié)構(gòu)。本論文提出的基于精簡語文轉(zhuǎn)換的詞庫設(shè)計(jì)理念具有較強(qiáng)的新穎性和實(shí)用性。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-11
      頁數(shù): 63
      25人已閱讀
      ( 4 星級)
    • 簡介:本文針對漢語框架語義角色自動(dòng)標(biāo)注的研究是來源于國家自然科學(xué)基金項(xiàng)目“漢語框架語義依存圖自動(dòng)抽取關(guān)鍵技術(shù)研究NO60970053”。該項(xiàng)目的漢語框架語義依存圖自動(dòng)抽取是實(shí)現(xiàn)漢語句子語義分析的一種新途徑,因此漢語框架語義角色標(biāo)注對實(shí)現(xiàn)漢語框架語義分析具有重要的意義。目前語義角色標(biāo)注的研究大多基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)模型,研究表明制約語義角色標(biāo)注性能的主要因素為統(tǒng)計(jì)機(jī)器學(xué)習(xí)中的特征選擇問題。本文基于漢語框架網(wǎng),針對特征選取問題,利用樹條件隨機(jī)場TREECONDITIONALROMFIELDS,TCRF模型,研究了基于依存特征的漢語框架語義角色標(biāo)注。主要研究內(nèi)容包括1研究了基于詞、詞性及其組合特征的基線框架語義角色標(biāo)注模型。其中選取詞、詞性及其組合為基本特征,按照窗口大小不同構(gòu)建了3種基線特征模板,最終基線模型在“發(fā)明”、“查看”、“擁有”框架下的最優(yōu)F值分別為5536%,5226%6619%。2研究了基于依存特征的漢語框架語義角色標(biāo)注模型。在基礎(chǔ)特征的基礎(chǔ)上,加入當(dāng)前節(jié)點(diǎn)的依存父子節(jié)點(diǎn)、父子依存關(guān)系及其組合特征,并依據(jù)特征組合及窗口大小不同構(gòu)建了21種擴(kuò)展特征模板,最終在“發(fā)明”“查看”“擁有”框架下獲得的最優(yōu)F值分別為5830%,5529%,6724%。3研究了漢語框架語義角色標(biāo)注中的特征貢獻(xiàn)情況。實(shí)驗(yàn)結(jié)果顯示,在詞、詞性及其組合特征的基礎(chǔ)上融入依存句法層面的特征,能夠提升漢語框架語義角色標(biāo)注的F值進(jìn)一步比較了依存特征對不同長度框架語義角色的標(biāo)注影響,發(fā)現(xiàn)依存特征對較長框架語義角色標(biāo)注的結(jié)果較好,這其中子節(jié)點(diǎn)比父節(jié)點(diǎn)特征更為重要,依存關(guān)系比依存節(jié)點(diǎn)更為重要。本文的主要貢獻(xiàn)在于全面研究了依存句法特征中的父子節(jié)點(diǎn)、父子依存關(guān)系及其組合特征對漢語框架語義角色標(biāo)注的作用,這些結(jié)論都將為進(jìn)一步面向大規(guī)模、開放式的漢語框架語義角色標(biāo)注研究提供了重要的特征選擇依據(jù)。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-11
      頁數(shù): 50
      8人已閱讀
      ( 4 星級)
    • 簡介:隨著互聯(lián)網(wǎng)的飛速發(fā)展,信息的理解和處理越來越受到人們的關(guān)注。內(nèi)容信息的理解需要自然語言的語義分析技術(shù),而自然語言的語義分析離不開相應(yīng)的語義詞典的支持,因此語義詞典的建設(shè)已經(jīng)成為自然語言處理的一項(xiàng)基礎(chǔ)性工作。語義詞典作為自然語言處理的一項(xiàng)基礎(chǔ)資源,不僅對分詞、命名實(shí)體識別、詞義消歧等自然語言處理的底層技術(shù)有幫助,而且在問答系統(tǒng)、信息檢索、文本分類等上層應(yīng)用中也大有用武之地。為了建設(shè)一部實(shí)用的、能在中文信息處理領(lǐng)域中發(fā)揮重要作用的詞典,本文構(gòu)建了一部具有簡單結(jié)構(gòu)、收詞量足夠大的漢語語義詞典詞脈,不僅整合了已有的語義詞典,如同義詞詞林(擴(kuò)展版)、知網(wǎng)等,還充分利用了互聯(lián)網(wǎng),融入了網(wǎng)絡(luò)上的詞條資源,如百度百科、搜狗細(xì)胞詞庫等,從而在擴(kuò)大詞典規(guī)模的同時(shí)融入了新詞信息。詞脈采用五層分類體系描述單詞詞義,詞語之間體現(xiàn)了良好的層次關(guān)系;每個(gè)詞義下是一個(gè)同義詞集合,每個(gè)集合中的單詞互為同義關(guān)系或同類關(guān)系。本文首先整合了同義詞詞林(擴(kuò)展版)和知網(wǎng)這兩部詞典構(gòu)建了詞脈的通用領(lǐng)域部分。將知網(wǎng)融入到同義詞詞林(擴(kuò)展版)體系中,首先采用基于同義詞的算法融合,對于采用同義詞算法沒有融入的知網(wǎng)中的單詞,再采用基于同類詞的算法。人工校對自動(dòng)融合的結(jié)果后,構(gòu)成了詞脈的通用領(lǐng)域部分。然后構(gòu)建了詞脈中的專有領(lǐng)域部分。根據(jù)百度百科的特點(diǎn),采用基于詞條的開放分類標(biāo)簽的自動(dòng)融合方法,融入了83部專有領(lǐng)域詞典,1751756個(gè)單詞;根據(jù)搜狗細(xì)胞詞庫的特點(diǎn)提出了手工標(biāo)注搜狗細(xì)胞詞庫的分類體系到詞脈的詞義體系的映射關(guān)系的融合方法,融入了26部專有領(lǐng)域詞典,4417937個(gè)單詞。接下來,對詞脈作了規(guī)范化處理。采用SVM算法識別了“人名”領(lǐng)域詞典中正確的人名,排除了分類錯(cuò)誤的單詞,在測試集上的F值達(dá)到了99926%,比BASELINE方法高出了約7個(gè)百分點(diǎn),滿足了應(yīng)用需求。最后,為了便于用戶更好地了解詞脈中的數(shù)據(jù),開發(fā)了詞脈在線系統(tǒng)。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 68
      9人已閱讀
      ( 4 星級)
    • 簡介:隨著互聯(lián)網(wǎng)的迅猛發(fā)展特別是WEB20的興起越來越多的人們以網(wǎng)絡(luò)為媒介發(fā)表他們對某個(gè)事件或事物的意見和評論。意見挖掘得到了廣泛地應(yīng)用并引起了自然語言處理等相關(guān)領(lǐng)域的極大關(guān)注主觀性識別和情感分類是意見挖掘中的兩個(gè)關(guān)鍵問題其主要任務(wù)就是將文本中人們所表達(dá)的意見信息從客觀性的信息中識別出來并確定其情感傾向。這兩個(gè)問題的解決對意見問答系統(tǒng)、信息抽取、和意見文摘等自然語言處理系統(tǒng)都有著極其重要的意義。本文在統(tǒng)計(jì)方法和模糊集合論框架下研究漢語句子的主觀性識別和情感分類問題。為了降低問題的復(fù)雜性提高系統(tǒng)性能本文根據(jù)漢語句子的特點(diǎn)分析句子中不同粒度層面的主觀性及情感傾向并以它們?yōu)榛救蝿?wù)線路根據(jù)不同層次粒度的融合策略解決漢語句子層面的主觀性識別和情感分類問題。具體地講本文從如下四個(gè)方面進(jìn)行研究1主觀性識別是意見挖掘中首先要解決的問題之一。面向大規(guī)模開放應(yīng)用本文提出了一整套漢語句子主觀性識別解決方案包括1在分析漢語主觀性表述的基礎(chǔ)上給出了一種基于CHISQUARE的主觀性特征選擇方法;2針對漢語主觀性意見表述與客觀事實(shí)表述的差異性引入情感密度概念提出一種基于情感密度的漢語句子主觀性識別方法3在漢語句子的情感密度的基礎(chǔ)上以句子的情感密度區(qū)間為特征描述了一種情感密度和貝葉斯分類器相融合的漢語句子主觀性分類方法。實(shí)驗(yàn)結(jié)果表明本文提出的漢語句子主客觀分類方法具有較強(qiáng)的適應(yīng)性能夠有效地將文本中的主觀性意見表述從客觀性事實(shí)陳述中分離出來并取得了較理想的實(shí)驗(yàn)結(jié)果。2詞語是構(gòu)成自然語言的基本單位其主觀性是進(jìn)一步進(jìn)行短語和句子主觀性分析的基礎(chǔ)。針對漢語詞語主觀性存在的兼類問題和強(qiáng)度問題本文在計(jì)算詞語的主觀性權(quán)重的基礎(chǔ)上提出一種對數(shù)線性模型和模糊集合相結(jié)合的漢語詞語主觀性強(qiáng)度學(xué)習(xí)方法。其基本思想是先采用對數(shù)線性模型對語料中的候選主觀性詞語進(jìn)行主觀性權(quán)重預(yù)測然后再在模糊集合的框架下融合詞語的主觀性權(quán)重相關(guān)信息構(gòu)造詞語主觀性強(qiáng)度的模糊集合及對應(yīng)的隸屬函數(shù)并以此判別詞語的主觀性強(qiáng)度類別最后應(yīng)用于漢語句子的主觀性識別之中。實(shí)驗(yàn)結(jié)果表明由于引入詞語的主觀性強(qiáng)度類別本文方法取得了良好的效果。3引入漢語詞語的結(jié)構(gòu)信息有助于漢語詞語的情感傾向預(yù)測。針對漢語詞語情感傾向難于預(yù)測的問題本文在深入分析了漢語詞語結(jié)構(gòu)與詞語情感傾向的規(guī)律的基礎(chǔ)上針對其中較難分辨的未登錄詞極性預(yù)測問題將詞語中語素等結(jié)構(gòu)特征有效結(jié)合提出了一種統(tǒng)計(jì)方法框架下的基于語素的漢語詞語情感傾向自動(dòng)預(yù)測方法。并在討論詞匯層面極性預(yù)測的基礎(chǔ)上提出了一種基于規(guī)則的短語極性計(jì)算方法最后在詞語和短語的極性計(jì)算基礎(chǔ)上給出了基于閾值法的句子情感分類方法。實(shí)驗(yàn)結(jié)果表明與其他方法相比較由于引入句子中多層面的語言信息本文方法較好的解決了漢語句子情感分類問題。4本文最后主要研究基于多粒度融合的漢語句子情感分類方法。在深入研究了語素、詞語和短語層面的主觀性及情感傾向的基礎(chǔ)上針對情感句子表述的隱晦性和模糊性并結(jié)合漢語本身的特點(diǎn)將上下文的多粒度信息融合并引入到整個(gè)句子的情感分類中提出了一個(gè)基于多粒度融合與模糊集合相結(jié)合的漢語句子分類方法。實(shí)驗(yàn)結(jié)果表明與傳統(tǒng)的情感分類方法相比本文提出的基于模糊集合的多粒度融合的漢語句子情感分類方法從細(xì)粒度到粗粒度較精確的識別了漢語句子中各層次的情感強(qiáng)度及情感傾向因此明顯地提高漢語句子級別的情感分類的精確率和召回率。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 88
      9人已閱讀
      ( 4 星級)
    關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服客服 - 聯(lián)系我們

    機(jī)械圖紙?jiān)创a,實(shí)習(xí)報(bào)告等文檔下載

    備案號:浙ICP備20018660號