-
簡介:隨著計算機技術的快速發(fā)展,中文信息處理作為計算語言學的一個重要的分支,在我國信息化建設過程中起到了舉足輕重的作用。中文信息處理的現(xiàn)在的主要研究有字方面的處理、詞方面的處理、句方面的處理和篇章方面的處理。目前,我國在字處理和詞處理方面,已經(jīng)有了大量研究成果,而且也有很不錯的實際應用。但是對于句處理和段處理的研究還有待加強。多重復句通常由幾個分句組成的,作為漢語語法當中重要的一部分,它在漢語語義方面的含義十分的豐富而且多樣,因此多重復句的分析和處理在現(xiàn)在自然語言處理方面是最多見而且非常艱難的階段,因此現(xiàn)在成為中文信息的研究重點。其中關系詞是連接各個分句之間的一個重要的橋梁,現(xiàn)在對于關系詞的研究正是一個方興未艾的課題。本文的研究重點是對多重復句里面的層次結構,它是根據(jù)多種邏輯關系依據(jù)某種層次結構結合而成的復雜的關系層次結構分析和識別過程?;陉P系詞語在多重復句中的重要地位,本文首先利用規(guī)則對多重復句中的關系詞語進行自動標識,在這一部分會介紹標識關系詞語用到的各種規(guī)則表,以及如何把這些規(guī)則表形式化成機器可以識別的方法。根據(jù)多重復句中的關系詞語,我們采用上下文無關文法對多重復句進行形式化的表述。由于知道關系詞語的在復句中的前、后部位置所屬是我們進行層次結構分析的必須的資源,所以我們將利用規(guī)則表和關系詞語在各個分句中的具體位置來確定其的前、后部所屬。最后我們可以利用改進的移進歸約分析算法借助已經(jīng)處理好的關系詞語對多重復句進行層次結構的分析。為了更好的顯示出我們的研究分析結果,我們根據(jù)得到的層次結構可以將其形式化為關系層次樹,以此來表示分句之間的連接關系和層次構成。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 48
大?。?1.54(MB)
子文件數(shù):
-
簡介:分類號UDC密級單位代碼Q151文化全球化視閾下漢語四字成語英譯研究盧東民指導教師劉迎春職稱教授學位授予單位大連海事大學申請學位級別碩士學科與專業(yè)外國語言學與應用語言學論文完成日期2012年LO月論文答辯日期2012年11月17日答辯委員會主席復J聞L答辯委員會主席左竺型K大連海事大學學位論文原創(chuàng)性聲明和使用授權說明原創(chuàng)性聲明本人鄭重聲明本論文是在導師的指導下,獨立進行研究工作所取得的成果,撰寫成碩士學位論文室業(yè)全蔓絲塑堡工迅亟四主盛亟墓豎硒究。除論文中已經(jīng)注明引用的內(nèi)容外,對論文的研究做出重要貢獻的個人和集體,均已在文中以明確方式標明。本論文中不包含任何未加明確注明的其他個人或集體已經(jīng)公開發(fā)表或未公開發(fā)表的成果。本聲明的法律責任由本人承擔。論文作者簽名中永RL冽2年F1月。7日學位論文版權使用授權書本學位論文作者及指導教師完全了解“大連海事大學研究生學位論文提交、版權使用管理辦法”,同意大連海事大學保留并向國家有關部門或機構送交學位論文的復印件和電子版,允許論文被查閱和借閱。本人授權大連海事大學可以將本學位論文的全部或部分內(nèi)容編入有關數(shù)據(jù)庫進行檢索,也可采用影印、縮印或掃描等復制手段保存和匯編學位論文。保密口,在年解密后適用本授權書。本學位論文屬于保密口不保密∥請在以上方框內(nèi)打“4,,論文作者簽名尹泵氏導師簽名日期沙‘≥年7J月17目
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 59
大小: 1.94(MB)
子文件數(shù):
-
簡介:本論文對語音識別的理論和關鍵技術進行了深入細致地研究。在深刻理解語音識別基本原理的基礎上,實現(xiàn)了包括語音采集、預處理、特征提取、模型選取、判決規(guī)則以及識別策略在內(nèi)的孤立詞語音識別。本文對語音信號的預處理和特征提取問題進行了研究。在傳統(tǒng)的端點檢測方法的基礎上,提出了一種基于改進的短時能頻值孤立詞端點檢測算法。該算法能有效地消除背景噪聲及DC分量的干擾,在噪聲環(huán)境下對語音信號起止點判定的準確率較傳統(tǒng)方法有明顯提高,為改善語音識別效果做了必要的前期準備工作。最后,本文將脈沖耦合神經(jīng)網(wǎng)絡PCNN模型應用于說話人特征提取中,提出了一種新的基于PCNN時間序列的語譜圖特征提取方法。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 69
大?。?2.14(MB)
子文件數(shù):
-
簡介:本文對漢語文語轉(zhuǎn)換系統(tǒng)中需要使用的時長和基頻模型均進行了深入的研究。以一個包含4848個漢語句子的大規(guī)模語音庫為基礎,將幾種機器學習算法應用于韻律模型時長和基頻的生成中。本文分別將人工神經(jīng)網(wǎng)絡和決策樹應用于時長模型的學習,并在建模的過程中使用了一些數(shù)理統(tǒng)計的方法。此外,本文還在時長的生成上試驗了基于語料庫的方法?;l模型方面,本文嘗試了基于語料庫的方法,并隨后提出了一種基于基頻模式的方法。為了區(qū)分兩個模型的性能,本文采用了常用的MOSMEANOPINIONSCE評價方法,實驗結果表明,基于基頻模式的生成方法明顯優(yōu)于基于語料庫的方法。最后,本文利用基本的統(tǒng)計學方法,在一個小規(guī)模的情感語音庫包含三種情感,每種情感310句上對情感相關的韻律參數(shù)進行了統(tǒng)計分析,并對情感語音時長和基頻均值的生成進行了深入地研究。在建模的過程中,我們成功地解決了數(shù)據(jù)稀疏導致的過擬合問題。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 58
大?。?1.96(MB)
子文件數(shù):
-
簡介:ONTRANSLATIONOFCHINESEPOLITICALNEOLOGISMSBYYANGNAJIA789963ADISSERTATIONSUBMITTEDTOCOLLEGEOFFOREIGNLANGUAGES,TIANJINPOLYTECHNICUNIVERSITYINPARTIALFULFILLMENTOFTHEREQUIREMENTSFORTHEMASTER’SDEGREEWRITTENUNDERTHESUPERVISIONOFPROFESSORSHIJINHAIJANUARY2010獨創(chuàng)性聲明本人聲明所R旱交的學位論文是本人在導師指導下進行的研究工作和取得的研究成果,除了文中特別加以標注和致謝之處外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得丞洼王些太堂或其他教育機構的學位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示了謝意。學位論文作者簽名環(huán)溯荔D簽字日期仞脾F月/D日學位論文版權使用授權書本學位論文作者完全了解丞洼王些太堂有關保留、使用學位論文的規(guī)定。特授權云洼至些盔堂可以將學位論文的全部或部分內(nèi)容編入有關數(shù)據(jù)庫進行檢索,并采用影印、縮印或掃描等復制手段保存、匯編以供查閱和借閱。同意學校向國家有關部門或機構送交論文的復印件和磁盤。保密的學位論文在解密后適用本授權說明IJ’,£學位論文作者簽名捌荔口導師簽名義【平2歷簽字日期伽FD年F月,O日簽字日期秒,O年F月,O日
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 60
大?。?1.94(MB)
子文件數(shù):
-
簡介:北京化工大學碩士學位論文基于層次隱馬爾可夫模型的漢語詞法分析和命名實體識別技術姓名俞鴻魁申請學位級別碩士專業(yè)計算機應用指導教師趙英20040523坫F層次隱馬爾町人模掣的漢語L刊法分析和命名實體識別技術關鍵詞漢語詞法分析,分詞,詞性標注,命名實體識別,層次隱馬模型,ICTCLAS
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 60
大?。?1.58(MB)
子文件數(shù):
-
簡介:在自然語言處理中,漢語零形回指是現(xiàn)代漢語指代消解工作中的一個難點。指代消解能盡可能地消除人們?yōu)榱撕喕Z言而造成對指代詞所指的歧義理解,為計算機信息處理提供正確完整的信息,避免錯誤地理解上下文。但在現(xiàn)代漢語零形回指中,零形式是一種沒有語音形式、無形有義的回指詞,是語言減縮現(xiàn)象的主要特征。解決零形式位置的自動判定,是實現(xiàn)計算機對零形回指的自動消解工作的首要前提。本文以小句間的零形式作為處理對象。根據(jù)語料庫語言學的方法,利用現(xiàn)代漢語小說文本,制定相關標注項和標注原則,在人工標注和精校對的基礎上,建立了一個小型的現(xiàn)代漢語零形式語料庫。并在構建了零形式語料庫的基礎上,通過計算零形式位置相關統(tǒng)計量和通過機器學習相關概率權值的最優(yōu)值,本文提出一種自動判定零形式位置的統(tǒng)計算法模型。同時,本文也引入了常見的統(tǒng)計模型CRF來實現(xiàn)零形式位置自動判定的工作。通過對比實驗,兩種零形式定位算法的定位精度都達到了85%左右,定位召回率都達到了90%左右。在分析兩種基于統(tǒng)計的零形式定位算法在定位原理和定位效果上的差異的基礎上,本文展望了下一步的工作方向。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 58
大?。?2.94(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 112
大小: 9.58(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 64
大小: 2.36(MB)
子文件數(shù):
-
簡介:詞性標注是為文本中的每個詞語標上正確詞性的過程。它作為自然語言處理的一項基礎性工作,是后續(xù)句法分析、組塊分析等任務的必要準備。詞性標注中出現(xiàn)的錯誤會在后續(xù)處理中被放大,影響后續(xù)處理的效果,正確的詞性標注對于自然語言處理有著非常重要的意義。本文的目的是在分詞的基礎上,研究提高漢語詞性標注準確率的方法,為后期詞法分析和其它自然語言處理任務服務。最大熵模型是一種使用靈活、精確率高的統(tǒng)計模型。最大熵模型的一般使用方法是利用模型直接獲得結果,但是通過實驗發(fā)現(xiàn),大約94%的詞語的正確標注是最大熵模型給出的最優(yōu)標注,大約3%的詞語的正確標注是最大熵模型給出的次優(yōu)標注。直接舍棄次優(yōu)標注,就舍棄了通過最大熵模型獲得的一些信息。因此可以通過一些改進手段,把這些信息也加以利用,從而提高標注精度。本文通過結合使用最大熵模型和隱馬爾可夫模型、融合多個最大熵模型的標注結果、結合使用最大熵模型和CRFS構建了三個詞性標注器。使用的三種詞性標注方法的核心就是同時考慮最大熵模型的最優(yōu)標注和次優(yōu)標注。實驗結果表明,通過同時考慮最大熵模型的最優(yōu)標注和次優(yōu)標注來改善中文詞詞性標注方法是有效的三種詞性標注方法相對于只使用最大熵模型,精確率分別提高045%、032%、153%。其中,最大熵模型結合CRFS的標注效果是最理想的。詞性標注是自然語言處理過程中的一個環(huán)節(jié),本文的研究成果可以為諸如組塊識別、命名實體識別等其它自然語言處理環(huán)節(jié)服務,也可以作為實現(xiàn)詞性標注的具體方法加入實用系統(tǒng)中去。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 53
大?。?2.16(MB)
子文件數(shù):
-
簡介:以清晰自然的合成語音準確生動地傳達語義信息是新一代語音合成系統(tǒng)所追求的目標。雙模態(tài)情感語音合成的主要任務是通過建立虛擬人臉模型使計算機在合成語音的同時生成富有情感表現(xiàn)力的視覺信息。雙模態(tài)語音合成和語音識別是人機語音交互所需的兩項關鍵技術在信息處理領域有著重要的應用價值。本文的主要研究內(nèi)容有三維人臉建模和渲染、三維動畫驅(qū)動方法、漢語情感韻律特征建模和基于基音同步疊加算法的語音合成。人臉建模方面完成了VRML模型解析和基于OPENGL的渲染。所用模型由7個人臉部件組成共包含6435個頂點和12280個面。該模型在同類相關研究中復雜度較高對人臉細節(jié)的刻確更為逼真。對比研究了參數(shù)控制和數(shù)據(jù)驅(qū)動兩種三維動畫驅(qū)動方法。通過改進控制參數(shù)的采集方式解決了齒、舌、喉等器官的運動問題。在基于MPEG4標準的FAP參數(shù)控制法中采用徑向基函數(shù)和升余弦函數(shù)控制唇動和表情變化。在基于關鍵幀插值的數(shù)據(jù)驅(qū)動法中使用三次多項式插值法對視素幀和表情幀進行空間矢量加權生成融合后的動畫幀。結果表明FAP參數(shù)法可以實現(xiàn)細微的表情和唇形變化數(shù)據(jù)驅(qū)動法通過融合多個關鍵幀可以快速產(chǎn)生新的表情種類。為提高合成語音自然度準確表達情感信息對基于波形拼接的語音合成系統(tǒng)進行了改進。在系統(tǒng)前端加入基于人工神經(jīng)網(wǎng)絡的韻律預測模型后端加入基于PSOLA算法的韻律修改模型。合成階段使用基于決策樹和代價函數(shù)相結合的基元選擇法。仿真結果顯示合成的語音感情色彩明顯經(jīng)過韻律修改的語音基元在拼接后自然度較高。本文實現(xiàn)的雙模態(tài)情感語音合成系統(tǒng)在三維模型數(shù)據(jù)量較大的情況下滿足了實時性動畫的要求。合成的語音在聽覺和視覺上都能準確的表達情感信息。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 64
大?。?2.24(MB)
子文件數(shù):
-
簡介:本文采用現(xiàn)代信號處理的方法即小波變換和希爾波特黃變換的經(jīng)驗模式分解,對大詞匯量漢語連續(xù)語音識別系統(tǒng)中若干問題進行了研究。本文的大詞匯量漢語連續(xù)語音識別系統(tǒng)主要由三個開源工具構筑而成聲學模型的訓練采用英國劍橋大學的HTK工具包、語言模型的訓練采用卡內(nèi)基梅隆大學的CMUCAMTOOLKIT統(tǒng)計語言模型工具包、識別器采用日本京都大學和日本IPAINFMATIONTECHNOLOGYPROMOTIONAGENCY聯(lián)合開發(fā)的一個日語大詞匯量連續(xù)語音識別引擎。本文提出的二次小波變換降噪方法先對信號進行小波變換,然后對重構后的信號再進行一次變換,最后進行閾值量化處理。本文提出的SWT降噪法能更有效去除掉語音信號中的加性噪聲。此外相比EMDCWT的降噪方法,EMDSWT的方法也能更有效的去除掉語音信號中的加性噪聲。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 108
大小: 3.34(MB)
子文件數(shù):
-
簡介:語音合成是一種能夠?qū)⑽淖洲D(zhuǎn)換成語音的技術。當前語音合成技術已成為人機交互的重要手段之一并且在很多領域里得到日益廣泛的應用。一般來說把文字變成語音要大致經(jīng)過這樣幾個步驟文本分析韻律控制語音生成。文本分析主要是對輸入的文本進行分析提取出后面所需要的信息。人說話都有一定的語調(diào)、語氣、停頓及發(fā)音長短這些被稱為語音韻律。語音生成主要是根據(jù)前兩階段分析得到的各項參數(shù)進行波形拼接。要使得合成語音能充分表達出文本語言所含的情感使之更貼近人的語音就必須對文本語言做韻律分析它是影響語音合成自然度的重要因素所以韻律結構預測是語音合成技術中非常重要的一環(huán)。韻律結構預測已由最初的基于人工規(guī)則的方法發(fā)展到利用統(tǒng)計模型的方法。目前它已成為信息科學領域中的一個活躍的研究分支。本文在對幾種主要的韻律結構預測算法進行分析和比對的基礎上著重研究了基于最大熵原理的韻律結構預測方法并且從人工規(guī)則和統(tǒng)計模型的結合以及統(tǒng)計模型訓練這兩個方面做了一些的探討。文中闡述了最大熵的原理、參數(shù)估計、特征模板的制定和特征選擇等相關內(nèi)容設計了基于最大熵原理的韻律結構預測模型。嘗試了通過將人工語法分析引入統(tǒng)計模型中的辦法來提高韻律結構預測模型的性能。為了改進在小規(guī)模樣本集下的訓練效果在韻律結構預測模型訓練中導入了半監(jiān)督學習算法使所設計的韻律結構預測模型具有了一定的自主學習能力。最后通過實驗對比驗證了這種改進的可行性。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 90
大?。?2.41(MB)
子文件數(shù):
-
簡介:并列結構的自動識別對提高自動句法分析器的性能和工作效率具有重要意義,同時該識別結果可以直接應用于機器翻譯、信息抽取等領域。以往對并列結構的研究大部分是進行理論探討,少部分的自動識別研究也是針對比較簡單的并列結構。本文在為提高完全句法分析性能的前提下,利用大規(guī)模語料庫,分別展開了基于規(guī)則和基于機器學習方法的并列結構自動識別研究。本文首先分析了賓州中文樹庫中并列結構的語言學特征,主要從并列結構內(nèi)部和外部兩個方面進行考察。內(nèi)部特征主要考察了并列結構中并列成分的詞性序列分布,并列結構的平行性和嵌套并列結構;外部特征主要考察了并列結構的左邊界特征詞和右邊界特征詞。這些統(tǒng)計和分析結果可以為計算機自動識別并列結構提供豐富的語言學知識。本文分析了并列結構的相似性,以及邊界特征詞分布的規(guī)則性,探索了基于規(guī)則方法的并列結構自動識別。具體地,根據(jù)并列成分中心詞詞性,將并列結構分為五大類,分別針對每類并列結構特點實現(xiàn)自動識別。本文實現(xiàn)了基于最大熵模型的并列結構自動識別。該方法將并列結構的自動識別轉(zhuǎn)化為一個分類問題,根據(jù)連接詞的位置分別向左和向右搜索出并列結構的左右邊界。本文根據(jù)并列結構呈現(xiàn)的特點,分析了探索了適合并列結構邊界識別的上下文特征。為了減少因數(shù)據(jù)稀疏導致的識別錯誤,本文使用錯誤驅(qū)動的方法對最大熵的識別結果進行了校正。該方法首先對最大熵識別出的錯誤并列結構內(nèi)部信息進行分析,獲得候選校正規(guī)則集;然后,利用評價函數(shù)進行規(guī)則篩選,得到最終的校正規(guī)則集;最后,利用校正規(guī)則集對基于最大熵模型的自動識別結果進行校正。實驗結果表明,基于規(guī)則方法的并列結構識別性能F1值為756%,而基于最大熵模型方法的性能F1值達到837%,使用錯誤驅(qū)動的方法之后進一步將性能F1值提高到843%,顯示了較好的并列結構自動識別效果。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 62
大?。?2.26(MB)
子文件數(shù):
-
簡介:單位號碼10445學號2010028003分類號H1953研究生類別全日制碩士學位論文論文題目論文題目任務型教學法在肯尼亞漢語聽說課中的應用研究THEAPPLICATIONRESEARCHOFTASKBASEDTEACHINGMETHODINLISTENINGSPEAKINGCHINESEINKENYA專業(yè)學位名稱專業(yè)學位名稱漢語國際教育碩士漢語國際教育碩士方向領域名稱方向領域名稱漢語國際教育漢語國際教育申請人姓名申請人姓名徐秀徐秀指導教師侯磊教授侯磊教授胡月寶教授胡月寶教授論文提交時間論文提交時間20122012年1010月1414日獨創(chuàng)聲明本人聲明所呈交的學位論文是本人在導師指導下進行的研究工作及取得的研究成果。據(jù)我所知,除了文中特別加以標注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得其他教育機構的學位或證書使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示謝意。學位論文作者簽名學位論文版權使用授權書學位論文版權使用授權書本學位論文作者完全了解山東師范大學有關保留、使用學位論文的規(guī)定,有權保留并向國家有關部門或機構送交論文的復印件和磁盤,允許論文被查閱和借閱。本人授權山東師范大學可以將學位論文的全部或部分內(nèi)容編入有關數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復制手段保存、匯編學位論文。(保密的學位論文在解密后適用本授權書)學位論文作者簽名導師簽字簽字日期20年月日簽字日期20年月日
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 61
大?。?2.1(MB)
子文件數(shù):