眾賞文庫
全部分類
  • 抗擊疫情 >
    抗擊疫情
    病毒認知 防護手冊 復工復產 應急預案 防控方案 英雄事跡 院務工作
  • 成品畢設 >
    成品畢設
    外文翻譯 畢業(yè)設計 畢業(yè)論文 開題報告 文獻綜述 任務書 課程設計 相關資料 大學生活 期刊論文 實習報告
  • 項目策劃 >
    項目策劃
    土地準備 規(guī)劃設計 開工開盤 項目綜合 竣工移交 售后移交 智慧方案 安全專項 環(huán)境影響評估報告 可行性研究報告 項目建議書 商業(yè)計劃書 危害評估防治 招投標文件
  • 專業(yè)資料 >
    專業(yè)資料
    人文法律 環(huán)境安全 食品科學 基礎建設 能源化工 農林牧畜 綜合待分類 教育經驗 行政人力 企業(yè)管理 醫(yī)學衛(wèi)生 IT技術 土木建筑 考研專題 財會稅務 公路隧道 紡織服裝
  • 共享辦公 >
    共享辦公
    總結匯報 調研報告 工作計劃 述職報告 講話發(fā)言 心得體會 思想匯報 事務文書 合同協議 活動策劃 代理加盟 技術服務 求職簡歷 辦公軟件 ppt模板 表格模板 融資協議 發(fā)言演講 黨團工作 民主生活
  • 學術文檔 >
    學術文檔
    自然科學 生物科學 天文科學 醫(yī)學衛(wèi)生 工業(yè)技術 航空、航天 環(huán)境科學、安全科學 軍事 政學 文化、科學、教育、 交通運輸 經濟 語言、文字 文學 農業(yè)科學 社會科學總論 藝術 歷史、地理 哲學 數理科學和化學 綜合性圖書 哲學宗教
  • 經營營銷 >
    經營營銷
    綜合文檔 經濟財稅 人力資源 運營管理 企業(yè)管理 內控風控 地產策劃
  • 教學課件 >
    教學課件
    幼兒教育 小學教育 初中教育 高中教育 職業(yè)教育 成人教育 高等教育 考研資源 試題真題 作業(yè)習題 課后答案 綜合教學
  • 土木建筑 >
    土木建筑
    專項施工 應急預案 建筑規(guī)范 工藝方案 技術交底 施工表格 圖片圖集
  • 課程導學 >
    課程導學
    醫(yī)學綜合 中醫(yī)養(yǎng)生 醫(yī)學研究 身心發(fā)展 醫(yī)學試題 影像醫(yī)學 醫(yī)院辦公 外科醫(yī)學 老年醫(yī)學 內科醫(yī)學 婦產科 神經科 醫(yī)學課件 眼鼻喉科 皮膚病科 腫瘤科 兒科醫(yī)學 康復醫(yī)學 全科醫(yī)學 護理學科 針灸學科 重癥學科 病毒學科 獸醫(yī) 藥學
    • 簡介:介詞短語是漢語中一種重要的短語類型。介詞短語識別可以縮小句子中心動詞的選擇范圍;可以簡化句子結構降低后續(xù)句法分析的難度;在基于模板的翻譯中它還能為模板匹配提供方便。由于自然語言的靈活性和復雜性使得句法分析成為一項十分艱難的工作因此淺層句法分析成了當前的研究熱點。淺層句法分析的優(yōu)點是可以識別出確定性高的部分分析結果減少句法分析中的歧義從而降低句法分析的難度。盡管目前的淺層句法分析以組塊識別為主但是由于介詞短語本身的復雜性和特殊性所以依然有必要如前人單獨討論名詞短語識別一樣分析和探討介詞短語的識別問題。語言學研究表明介詞短語的內部構成比較復雜但有著顯著的邊界特征和上下文特征。本文繼承了CHURCH提出的把BASENP識別看作詞性標注同構問題的思想利用這些特征構造了一個有效的漢語介詞短語識別模型嘗試在淺層句法分析這個層級識別介詞短語。即在分詞和詞性標注的基礎上把介詞短語作為一個整體識別出來而不對其內部構成作分析。模型分為兩部分1根據介詞和介詞短語右邊界經常出現固定搭配的特點構造了兩個搭配模板從訓練語料中自動提取可信搭配關系并用這些搭配關系對介詞短語進行初步識別。2考慮到介詞對介詞短語右邊界的影響把介詞作為一元加入到CHURCH提出的基于詞性的二元邊界統(tǒng)計模型中構成了三元模型。又根據介詞短語的上下文特征加入了規(guī)則方法。用基于詞性的三元邊界統(tǒng)計模型和規(guī)則相結合的方法識別第一步無法處理的介詞短語。對含有7324個介詞短語的語料作交叉測試精確率達到8829%。實驗結果表明在淺層句法分析中識別介詞短語是可行的。
      下載積分: 5 賞幣
      上傳時間:2024-03-11
      頁數: 66
      8人已閱讀
      ( 4 星級)
    • 簡介:文語轉換是人機交互中一個重要組成部分是最有希望首先在智能通信終端中得到普及應用的一項關鍵技術通過文本分析從中提取文本的韻律特征是目前提高輸出語音質量的一個重要研究領域漢語同其它語系相比沒有實行分詞連寫以及使用時沒有形態(tài)變化等特點使得文本分析難度更大該文在借鑒外文文本分析相關理論以及漢語文本分析研究成果的基礎上針對文本分析中文本預處理、切詞、詞性標注以及韻律短語識別等環(huán)節(jié)的特點分別給出了多步處理策略提出未登錄詞一體化識別算法改進了歧義甄別、詞性印證標注和基于邊界點特性的韻律短語識別等算法此外對語料庫建設理論也進行了深入研究
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數: 61
      13人已閱讀
      ( 4 星級)
    • 簡介:當今信息處理中占絕大比例的是語言文字的處理,與傳統(tǒng)的理性主義方式相輔的是經驗主義方法,其中大規(guī)模真實文本語料庫加工因具有實用性強、見效快的特點,普遍受人歡迎。語料庫語言學是80年代才嶄露頭角的一門計算語言學的新的分支學科,它的應用領域極廣,包括文本分類、檢索、自動摘要、信息獲取、簡單的機器翻譯和基于實例的對話系統(tǒng)。語料庫語言學研究的基礎是機器可讀的大容量語料庫,由于原始的未經加工處理的文本生語料很少直接起作用,需要先對其進行分析處理才能運用于實踐。漢語不同于印歐語種,缺乏天然的分割信息,要進行漢語的計算機處理,必須首先將漢語的詞與詞分開,即分詞也稱切分,切分是中文語料處理的第一步;為詞語標上其所屬的詞類就是詞性標注,是語料進一步加工的必須過程。由于多年來漢語語料切分標準缺乏一個全國統(tǒng)一的詳盡的加工標準,各家研究機構由于研究目的等不同,加工的語料不能兼容,造成了資源的重復建設和浪費;同時,切分中的排岐和未登錄詞特別是專有名詞的識別一直困擾著切分標注,成為語料加工的瓶頸,甚至可以說也成為整個中文信息處理平臺的瓶頸。本文主要著重解決這兩個問題。本文設計并基本實現了一個具有專名識別功能的多輸出的漢語切分標注系統(tǒng),同時考慮了系統(tǒng)的效率和可擴充性等實用方面的問題。為了能使加工的語料既符合國家制定的加工規(guī)范,又能適應不同應用的實際需求,本文提出了一個規(guī)范獨立的加工模型。在基本的分詞和標注模塊之后,有一個單獨的規(guī)范規(guī)則處理模塊,系統(tǒng)的分詞和標注模塊可同切分標注的相關規(guī)范無關,一旦規(guī)范修改,只需替換切分標注規(guī)范規(guī)則文件即可。同時,本系統(tǒng)在加工中對每個詞都加上了信息,個性化輸出模塊可以根據這些信息按需輸出不同顆粒度大小的加工結果。在切分和標注模塊,系統(tǒng)改進了前綴碼分詞算法,采用了結合前綴詞表的首尾二字哈希查找算法來提高效率,同時,針對單獨使用規(guī)則或概率方法消歧的不足,將兩種方法有機的結合起來進行歧義消減。在專名識別方面,在參考國內各家方法的基礎上,系統(tǒng)設計了自己的人名識別和地名識別的統(tǒng)計模型,提出了一套結合上下文信息,綜合運用統(tǒng)計、規(guī)則、資源庫的識別方法。方法提出了專名識別緩沖區(qū)的概念,更加注重局部范圍內專有名詞的出現頻率。在實現系統(tǒng)中獲得顯著效果在本文的最后,在對測試數據分析的基礎上,針對系統(tǒng)的不足,提出了系統(tǒng)進行進一步改進的側重點和方法。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數: 64
      14人已閱讀
      ( 4 星級)
    • 簡介:詞法分析是自然語言處理領域中最基礎的處理步驟,尤其對漢語這種沒有分割符的語言來說更是如此。本文研究的漢語詞法分析主要包括自動分詞、詞性標注和詞義相似度計算三個方面。詞法分析是句法分析的先期處理步驟,其錯誤會沿處理鏈條擴散,并最終影響信息檢索、機器翻譯等面向最終用戶的應用系統(tǒng)的質量;同時,詞法分析所用的技術也可以直接應用到音字轉換和語音識別等應用系統(tǒng)中,所以對它的研究具有極其重要的意義。本文在統(tǒng)計語言模型方面主要探討了NGRAM模型、最大熵模型、支持向量機模型和矢量空間模型。重點研究了三個方面的內容傳統(tǒng)NGRAM模型的改進方法;利用觸發(fā)對提高矢量空間模型的質量;在最大熵模型中加入轉換觸發(fā)對特征。最后利用以上統(tǒng)計語言模型的研究成果對漢語詞法分析進行了深入研究。主要內容包括四個方面第一、從兩個方面改進了傳統(tǒng)NGRAM模型。第二、分詞是漢語詞法分析中最基本的步驟,所有的漢語自然語言處理都要基于分詞的結果。第三、詞性標注可以看成是噪聲信道的解碼問題。傳統(tǒng)的HMM模型有兩個缺點首先它用聯合概率解決一個條件概率問題,而且它不能包含長距離詞法特征。針對以上問題,本文分別利用支持向量機模型和最大熵模型對復雜兼類詞標注進行了研究,試驗結果證明兩種模型都可以有效降低兼類詞標注的錯誤。在此基礎上,利用最大熵模型對基于句子的詞性標注進行了研究,重點研究了長距離聚類轉換觸發(fā)對“WA→WBTB”特征的加入以及用于系列分類的BEAMSEARCH搜索算法。最后,利用與詞性標注相同的技術對音字轉換做了初步的探討,主要試驗了簡單和復雜兩種特征模板。第四、詞義是詞法分析中的核心問題,本文重點利用矢量空間模型對詞義相似度計算進行了研究。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數: 115
      7人已閱讀
      ( 4 星級)
    • 簡介:本文研究了漢語數字語音識別技術及其實現的方法。本文基于語音信號產生的數學模型,從時域、頻域、倒譜域出發(fā),對語音信號進行分析,論述了語音識別的基本理論。在此基礎上,討論了語音識別系統(tǒng)的主要技術及其在本課題中的應用,并重點討論了本課題中語音信號特征參數的提取,并在其中加入RASTA濾波抗噪。在比較三種模式匹配方法的基礎上,本文選擇隱馬爾可夫(HMM)模型作為本課題中模式匹配的方法,并討論了經典齊次隱馬爾可夫(HMM)模型的基本原理及其用于語音識別的訓練和識別算法。接著用MATLAB65對模型訓練和識別算法進行了仿真,并分別給出了主要仿真結果。然后討論了基于C++的數字語音識別系統(tǒng)的程序設計,給出了系統(tǒng)的軟件結構圖,設計了其類庫規(guī)劃并實現了人機交互界面。本文還介紹了本課題組自己設計的錄音軟件,建立了用于訓練和測試模型的數字語音數據庫,并對系統(tǒng)算法的實時性和準確性進行了測試,結果表明,采用改進算法的DDBHMM模型準確性高于經典的HMM模型,但實時性低于經典的HMM模型。最后指出了本課題研究未來的改進方向。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數: 62
      13人已閱讀
      ( 4 星級)
    • 簡介:南開大學碩士學位論文基于AMEMM的漢語韻律短語預測系統(tǒng)的設計與實現姓名趙廷健申請學位級別碩士專業(yè)計算機應用技術指導教師朱耀庭20090601ABSTRACTABSTRACTSPEECHSYNTHESISISAHOTRESEARCHTOPICINCOMPUTERINTELLIGENCERESEARCHATPRESENTITISWIDELYUSEDINALLASPECTSOFSOCIALLIFEBUTNOWTHEDIFFICULTPOINTSISTHENATURALNESSOFTHESYNTHETICSPEECHBASEDONTHEHISTORYANDSTATUSRESEARCHOFCHINESEPROSODICPREDICTION,USINGSTATISTICALMACHINELEARNINGMETHOD,THEAUTHORPUTFORWARDAMAXIMUMENTROPYMARKOVMODEIMEMMTOPREDICTPROSODICPHRASEBOUNDARIESINUNRESTRICTEDCHINESETEXTCONSIDERINGREDUCINGTHEMANUALLABELING,THEAUTHORALSEALIZESAPROTOTYPESYSTEMBASEDONACTIVEMAXIMUMENTROPYMARKOVMODEIAMEMMFORTHEPREDICTINGOFCHINESEPROSODICPHRASEBOUNDARIESNOWTHEBESTMODELFORCHINESEPROSODICPHRASESPREDICTIONISMAXIMUMENTROPYME。MEMMISAKINDOFOUTSPREADFORMEITCOMBINESTHETHEADVANTAGESOFMEANDHMMTHEAUTHORDOSOMEEXPERIMENTSTOPOINTOUTTHATINUSINGTHESAMETEMPLATE,MEMMISMORESUITABLEFORCHINESEPROSODICPHRASESPREDICTIONTHANMEHOWEVERALMOSTALLTHEMACHINELEARNINGALGORITHMSWIDELYUSEDATPRESENTNEEDLARGEAMOUNTOFTRAININGDATAITWILLCOSTMUCHINORDERTOLABELTHEMBYHANDINCONTRAST,UNLABELEDDATAISVERYEASYTOACHIEVEMININGHIDDENINFORMATIONFROMUNLABELEDDATACANIMPROVETHECORRECTNESSOFLABELINGEFFECTIVELYWHENLABELEDDATAISLIMITEDTHETHESISWILLINTRODUCEANACTIVELEARNINGMETHODWORKSONMEMMITWORKSTOGETHERWITHPEOPMBEGINRDNGFROMPARTIALLABELEDTRAININGDINFMDINGTHEPROPERDATATOASKPEOPLETOLABELWHICHWILLHELPTRAININGTHEMODELMOSTAFTERLABELINGTHEMETHODISUSEDTOPREDICTPROSODICPHRASEBOUNDARIESINUNRESTRICTEDCHINESETEXTEXPERIMENTS011THEAMEMMPROVETHATTHEMETHODCALLSOLVETHEACTIVELEARNINGPROBLEMOFPROSODICLABELINGEFFECTIVELYWITHOUTLABELINGSOMUCHDATASOTHATTHEWORKLOADOFLABELINGWILLBEGREATLYREDUCEDKEYWORDSCHINESEPROSODICPHRASE,ACTIVELEARNING,MEMMⅡ
      下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數: 61
      5人已閱讀
      ( 4 星級)
    • 簡介:近年來,漢語普通話文語轉換系統(tǒng)的研究取得了長足的進展,但是還有許多理論和應用問題有待解決,計算機的合成語音在自然度上與人類的自然語音存在一定的距離。為此,不僅要研究如何利用漢語普通話語音數據庫拼接出高自然度的語音,而且還要從語言學方面研究中文文本,為后續(xù)的語音處理提供韻律信息和指導。本文的主要工作是面向文語轉換系統(tǒng)的中文文本智能化處理研究。本文首先研究了自動分詞所涉及的各方面技術,建立了分詞詞典和語料庫,采用了增字最大匹配算法進行切分,制定了處理歧義字段用的知識庫,提出并建立了“多音字語料庫”用于解決多音字問題,最后利用姓名本身和出現環(huán)境的特點,提出了基于規(guī)則和統(tǒng)計相結合的漢語姓名識別算法,達到了理想的效果,總的精度達到了99%。在成功地實現自動分詞后,分析了漢語的詞語兼類現象和隱馬爾可夫模型理論,認為隱馬爾可夫模型在詞性自動標注上有著非常重要的應用價值,并成功地把它引入到自動詞性標注上。為了校正應用隱馬爾可夫模型產生的少量明顯錯誤和無法保證正確標記的語料,提出了一個規(guī)則集,用于糾錯。開放和封閉測試表明該方法取得了相當好的結果。在韻律詞處理方面,提出了一種單字驅動的規(guī)則方法,即利用一些規(guī)則依據單字的詞性對單字進行向前或向后的歸并,從而減少合成語音中的單音節(jié)詞。在韻律詞內部加較小的停頓,在韻律詞間的停頓可以適當加長,使合成語音體現出一定的韻律感。為了進行韻律短語的切分,提出了一個統(tǒng)計和規(guī)則相結合的方法。使用統(tǒng)計方法從已經經過人工標注的漢語語料庫中得到的韻律短語切分點的邊界模式以及概率信息,對中文文本中的韻律短語切分點進行自動預測。對于統(tǒng)計方法預測出的長度較短的候選組塊,再利用規(guī)則及組塊的類型信息歸并為韻律短語。最后,在系統(tǒng)的實現過程中,發(fā)現語素這種詞性具有不確定性,導致韻律短語切分點預測的不合理,不利于韻律短語的統(tǒng)計和韻律短語邊界的預測。為此,修改了分詞詞典中有語素這個詞性出現的1字詞的詞性,使每一個詞都有了一個明確的詞性,再進行自動分詞和自動詞性標注,從而提高了韻律短語的切分準確率。經過上述處理,最后計算機合成的漢語普通話語音具有相當好的自然度。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數: 90
      10人已閱讀
      ( 4 星級)
    • 簡介:該文面向漢語對話理解研究了漢語對話中口語語義的表示建立了漢語對話理解的情景語義模型DSSMDIALOGUEUNDERSTINGSITUATIONALSEMANTICMODEL并將研究成果應用于人機對話系統(tǒng)上海市交通信息查詢系統(tǒng)SHTQS中對話理解不只是涉及語義學還是語用學研究的最理想的內容針對當前的語義分析和語用分析的狀況情景語義學突破了語義學和語用學的界限把許多語用學研究的課題納入其描寫的范圍在對話中句子與對話發(fā)生的情景、上下文存在著密切的關系該文作者在情景語義學基礎理論的啟迪下建立了漢語對話理解的情景語義模型DSSM實現了漢語對話的語義和語用綜合分析上下文知識包括表示和獲取該文采用一種結構化的網絡來表示上下文知識∑∑由結點和連接結點的弧構成結點表示詞語或語句的描述情景弧表示詞語和語句的描述情景間的關聯上下文知識的獲取伴隨著對話中語句的分析進行實施進一步對漢語口語對話中的語句進行理解基于漢語對話理解的情景語義模型DSSM該文著重研究了漢語口語中疑問句的形式化表示、VA動詞和形容詞構成的述補結構語句的分析以及指代問題的處理等該文以朱德熙為代表的疑問句轉換系統(tǒng)的語法理論為基礎采用結構化意義方法在分析了漢語疑問句的分類和疑問點之后基于DSSM給出了漢語疑問句語義的表示并對三類疑問句、W呢一類漢語疑問句主要包括NP呢和VP呢、多疑問點疑問句和反問句的語義進行了研究同時還研究了漢語疑問句答句并指出答句的情景語義就是漢語疑問句的語義函數作用到答句中詞或短語本身的語義之上時產生的命題該文從句子的結構及詞匯的語義知識出發(fā)建立了語義指向的形式化模型給出了VA語句語義分析的具體步驟在自然語言理解中代詞所指的確定極為復雜涉及大量話語分析知識尤其是漢語由于缺乏形態(tài)、強調意會其代詞所指在言談環(huán)境中的使用情況更加復雜該文基于漢語對話理解的情景語義模型DSSM采用形式化的方法運用情景理論的相關公理和原則通過情景錨定原則研究了情景對話內容中那短語所指稱和替代的實體對象的確定為漢語口語對話中指代問題的解決提供新的思路該文還介紹了漢語人機口語對話系統(tǒng)SHTQS的實現著重介紹了語言分析模塊中各子模塊如切分標注、句法分析和語義分析的實現同時該文給出了系統(tǒng)的測試結果和分析
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數: 114
      10人已閱讀
      ( 4 星級)
    • 簡介:隨著社會的發(fā)展計算機日益成為人類生活必不可少的一個部分如何才能方便的與計算機進行交流就成為人們需要解決的一個重要的問題語言是人類最方便的交流方式因此人們希望能夠采用語言與計算機直接進行交流也就是實現人機之間的真正的語聲通訊作為這一要求的計算機自然語言輸出部分各種語言的語音合成系統(tǒng)近幾年來得到了十分迅速的發(fā)展涌現出了大量的新技術和新設計在語音合成系統(tǒng)中韻律模型是必不可少的它將前面的文本分析和后面的語音生成聯系起來實際上起著一個重要的橋梁作用好的韻律模型使之能夠更加貼近自然語言中的各種各樣的韻律現象是高自然度語音合成系統(tǒng)中的一個重要的組成部分該文以此為目的對建立韻律模型中的基音周期的提取、基頻模式的獲取方面進行了深入的研究該文首先介紹了漢語語音中的一些基本知識重點放在基音周期估計算法的研究和基頻模式的獲取研究了頻域上的基頻周期估值算法如自相關算法、LPC殘差算法、倒譜法等時域上的基于波形外觀的基音估值算法并總結以上算法的優(yōu)缺點提出了取初值步進式尋找極值點的基音周期估值算法為了更準確的提取基音周期設計實現了音節(jié)標注工具SPEECHASSISTANT并使用該工具進行基音周期數據的采集工作研究了聚類算法克服傳統(tǒng)的K均值算法的缺點選擇改進的自組織數據分析方法ISODATA進行基頻模式的提取對聚類的基頻序列數據進行了基頻序列規(guī)整、滑動平均、零均值化等預處理在此基礎上進行聚類得到了相應的基頻模式并對其結果進行了分析最后該文對整個論文進行了總結并提出了進一步工作內容
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數: 57
      4人已閱讀
      ( 4 星級)
    • 簡介:連續(xù)數目字語音識別是當今語音識別領域的一個重要研究方向。本文簡述了漢語數目字語音識別的發(fā)展與現狀,分析了漢語數目字語音識別的困難所在,對連續(xù)數目字語音識別方法進行了研究。選取語音識別系統(tǒng)的特征參數時,對LPC倒譜參數和MFCC參數進行了比較,選擇能夠反映人的聽覺對語音感知特性的MFCC參數作為語音的特征參數,同時考慮到特征參數各維分量對于識別性能的貢獻,對各維分量進行了加權處理。實驗證明,基于MFCC的特征參數比LPC倒譜參數具有更佳的抗噪性。本文還討論了在語音信號的聲學處理環(huán)節(jié)提高語音識別魯棒性的問題和方法。利用語音聲學信號的頻譜分析來尋找連續(xù)語音信號幀的分割點,再結合音素分割方法,成功的提高了分割精度。實驗表明MEL標度頻譜法比傳統(tǒng)的以信號的短時能量,過零率等簡單特征作為判決特征參數的語音端點檢測方法更適合語音的分割。實驗結果表明,這種算法對于清音和噪聲,以及元音和輔音的區(qū)分都有很好的識別性能。系統(tǒng)采用VQHMM模型作為語音識別的聲學模型。對搜索算法,識別算法進行了研究,通過對隱馬爾柯夫模型輸入語音時間序列的矢量量化,有針對性的對搜索算法進行了簡化。從而使?jié)h語連續(xù)數目字語音識別的系統(tǒng)設計與實現的難度得到了降低。實驗結果證明①系統(tǒng)識別速度快,對于硬件的要求低。能在PC機上實現處理。②對于平穩(wěn)的孤立語音,該方法有較高的識別率。③對于連續(xù)數目字語音識別,系統(tǒng)的性能并沒有急劇下降。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數: 52
      8人已閱讀
      ( 4 星級)
    • 簡介:近年來由于計算機技術、多媒體技術和信息技術的發(fā)展語音技術迅猛發(fā)展并取得了很大進步為獲得較好的人機交互環(huán)境對TTS技術的研究引發(fā)空前的興趣并得到廣泛的應用TTS漢語文本到語音的轉換是指通過軟件和硬件將漢語文本或字串轉換為漢語輸出語音目前有常用的兩種TTS合成技術基于規(guī)則合成和波形拼接合成本文重點介紹波形拼接技術PSOLA算法PSOLA算法可以在保持語音自然度的情況下通過改變基頻和時長從而改變給定信號的韻律和幅度生成語音語料TTS系統(tǒng)有三大模塊文本處理、韻律分析和語音合成文本處理和韻律分析主要是提取語音合成所利用的各種韻律控制參數如合成語音韻律短語的結構和音節(jié)之間的韻律信息等這些參數受韻律實現策略和語言學韻律規(guī)則的影響對語音合成自然度起關鍵作用目前由于缺乏比較好的韻律處理算法精確提取韻律參數比較困難合成效果較差所以目前的研究主要集中在提高合成語音的自然度利用人工神經網絡優(yōu)良性能進行韻律處理可提高語音的自然度由于漢語是不同于其它語言的有調語言在提取語音參數時有著自己的規(guī)律漢語韻律是受語境影響的層次結構而神經網絡的運行和學習速率也極大的受到語境信息的影響語境信息有著重要的作用神經網絡結構比傳統(tǒng)模型更好地反映了漢語的韻律在漢語TTS系統(tǒng)韻律模型中改善文本處理能力可提高漢語語音合成系統(tǒng)的語音輸出質量針對上述問題本文提出了競爭型神經網絡在漢語TTSTEXTTOSPEECH韻律建模中的應用通過輸入多個不同韻律特征的模板樣本的競爭最終選擇與自然語音最匹配的那個樣本模板聽辨的結果證明競爭型神經網絡模型合成語音的自然度得到進一步的提高目前自然語言識別理解技術和數據挖掘技術在漢語TTS系統(tǒng)中得到廣泛應用語音技術與多媒體技術相結合促成了由文本到可視語音的轉換TEXTTOVISUALSPEECHTTVS的實現
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數: 59
      22人已閱讀
      ( 4 星級)
    • 簡介:本文初步探討了漢語自然語言理解在產品設計中的應用,重點處理了產品設計中的非實詞概念副詞結構。通過對以自然語言形式表達的用戶需求中的短語和句子進行理解和分析,并將最終分析結果轉化成概念設計要求,為后續(xù)設計提供支持。本文確定了在機械產品設計領域自然語言理解采用基于知識的方法。在知識庫建立和概念模型的基礎上應用了本體中的關系分析方法,對副詞概念進行了深入的分析,并對副詞知識進行分類和分析。在以上工作的基礎上,給出了系統(tǒng)中副詞處理模型,從而實現對含有副詞概念的句子進行形式化的理解。最后將自然語言理解的局部篇章上下文分析應用于機械控制領域,對其中的副詞概念進行處理,通過系統(tǒng)測試,結果比較令人滿意。
      下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數: 61
      5人已閱讀
      ( 4 星級)
    • 簡介:語音轉換VOICECONVERSION是指通過語音處理手段改變一個說話人源說話人,SOURCESPEAKER的語音個性特征,使之具有另外一個說話人目標說話人,TARGETSPEAKER的語音個性特征,但轉換語音所包含的語意內容不變。語音轉換技術涉及信號處理、語言學、聲學、計算機科學等學科領域,它的深入研究勢必將會對語音學其它領域的研究發(fā)展產生促進作用,同時它在電影、電視節(jié)目的配音、醫(yī)療及保密等許多方面有著廣泛的應用前景。因此語音轉換技術的研究具有重要的理論價值和實用價值。本文從不同說話人發(fā)聲器官的差異入手,分析了說話人個性特征及其聲學特征參數表示,并采用基于STRAIGHT分析合成算法的混合高斯模型GMM轉換算法實現了一個特定人語音轉換系統(tǒng),并利用該系統(tǒng)對影響轉換性能的因素做了相關實驗和分析。論文完成的主要工作有1分析了說話人個性信息的聲學表征問題。本文主要研究了不同說話人在以聲門波形參數為代表的聲源特征,以及以共振峰為代表的聲道特征的差異性,選取基頻參數,基頻范圍和線譜對系數LSF作為轉換特征參數。2實現了基于STRAIGHT分析合成算法和GMM轉換算法的特定人語音轉換系統(tǒng)。為了評測GMM轉換算法,進行了客觀和主觀評測實驗,指出了GMM轉換算法的過平滑現象使得轉換語音音質下降的問題。3討論了男女語音在聲源特性和聲道特性的不同,搭建了一個簡單的男女語音轉換系統(tǒng)。針對男女語音在聲源特性和聲道特性的不同,用基頻線性調整和頻譜線性插值的方法實現了男女聲之間地轉換。非正式聽辨實驗證明該轉換系統(tǒng)實現的女聲到男聲的轉換效果要好于男聲到女聲的轉換效果。實現了一個變聲器應用軟件,該系統(tǒng)可以通過改變聲音的基頻參數,頻譜參數和時長參數,來改變音質。4分析和討論了訓練語料類型、訓練數據量、混合高斯混合度、說話人差異等影響語音轉換系統(tǒng)性能的因素,并分別進行實驗。實驗結論為①聯合概率密度的方法同時觀察源說話人和目標說話人的參數,比只觀察源說話人的參數訓練的GMM模型的分類效果要好,得到的轉換語音帶有更多的目標說話人特征。②當訓練階段使用單音節(jié)語料時,轉換單音節(jié)的準確度比轉換句子的準確度要高;當訓練階段使用句子語料時,轉換句子的準確度比轉換單音節(jié)的準確度要高。③只有當訓練數據集增大,混合度數也隨之增大時,轉換效果變好。④特定女性到特定男性的聲音轉換效果要好于特定男性到特定女性的聲音轉換效果;特定女性之間的聲音轉換效果要好于特定男性之間的聲音轉換效果。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數: 69
      18人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數: 81
      5人已閱讀
      ( 4 星級)
    • 簡介:隨著人類語音合成系統(tǒng)智能化的提高增強語音自然度的要求顯得十分明顯。自然語音的一個重要方面就是表達一定的情感這也正是目前語音合成中所缺少的。情感語音合成是一個跨學科、具有很高理論價值和應用價值的研究課題是語音合成的一個新的研究方向正受到越來越多的關注。本論文在廣泛汲取漢語情感韻律知識和現代語音信號處理技術的基礎上對漢語情感語音合成技術及其實現方法進行了深入的研究主要研究工作如下1研究了線性預測合成、共振峰合成和基音同步疊加合成PSOLA等傳統(tǒng)的語音合成技術經比較認為基音同步疊加技術能夠方便地對合成單元的韻律進行調整很適合用于情感語音合成中。時域基音同步疊加TDPSOLA技術在對語音合成單元進行拼接前根據基音同步標注對拼接單元的基音周期、時長和強度做出適當地調整在不改變原始語音單元音質細節(jié)的基礎上能靈活地改變體現語音情感的韻律特征變化從而可以獲得更高的可懂度和自然度。2情感的聲學關聯特征參數是情感語音合成的關鍵之一。本文在漢語情感語料庫的基礎上分析了韻律特征參數在不同情感狀態(tài)下的規(guī)律。論文中采用基頻參數、時長參數和能量參數作為基本韻律特征參數對漢語情感語料庫提取這些參數得到不同情感狀態(tài)下各韻律特征參數的特性。根據韻律特征參數的統(tǒng)計結果確定輸出語音的基頻、時長和能量特征參數的目標調整系數在確保可懂度和自然度的前提下使合成的語音具備情感表達的能力。3詳細分析了基于語音頻譜分解的聲源參數提取方法整個方法是在STRAIGHT語音分析合成算法基礎上實現。4研究了語音合成中的韻律預測方法包括規(guī)則驅動的方法、數據驅動的方法尤其是其中的神經網絡的方法、數據挖掘的方法還有漢語韻律模型如TARGET基頻模型FUJISAKI基頻模型。本文詳細討論了SFC韻律預測模型的原理及實現方法并給出了針對漢語情感語音的韻律建模方案在對情感語音進行SFC韻律建模的基礎上分析了模型的層次關系設計了從中立語音進行韻律轉換的方法。根據以上研究結論進行漢語情感語音合成的實驗。實驗結果說明TDPSOLA算法能夠合成出令人滿意的情感語音。最后對全文的工作進行總結并指出下一步研究工作的思路。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數: 79
      4人已閱讀
      ( 4 星級)
    關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

    機械圖紙源碼,實習報告等文檔下載

    備案號:浙ICP備20018660號