眾賞文庫
全部分類
  • 抗擊疫情 >
    抗擊疫情
    病毒認知 防護手冊 復工復產(chǎn) 應急預案 防控方案 英雄事跡 院務工作
  • 成品畢設 >
    成品畢設
    外文翻譯 畢業(yè)設計 畢業(yè)論文 開題報告 文獻綜述 任務書 課程設計 相關資料 大學生活 期刊論文 實習報告
  • 項目策劃 >
    項目策劃
    土地準備 規(guī)劃設計 開工開盤 項目綜合 竣工移交 售后移交 智慧方案 安全專項 環(huán)境影響評估報告 可行性研究報告 項目建議書 商業(yè)計劃書 危害評估防治 招投標文件
  • 專業(yè)資料 >
    專業(yè)資料
    人文法律 環(huán)境安全 食品科學 基礎建設 能源化工 農(nóng)林牧畜 綜合待分類 教育經(jīng)驗 行政人力 企業(yè)管理 醫(yī)學衛(wèi)生 IT技術 土木建筑 考研專題 財會稅務 公路隧道 紡織服裝
  • 共享辦公 >
    共享辦公
    總結匯報 調研報告 工作計劃 述職報告 講話發(fā)言 心得體會 思想?yún)R報 事務文書 合同協(xié)議 活動策劃 代理加盟 技術服務 求職簡歷 辦公軟件 ppt模板 表格模板 融資協(xié)議 發(fā)言演講 黨團工作 民主生活
  • 學術文檔 >
    學術文檔
    自然科學 生物科學 天文科學 醫(yī)學衛(wèi)生 工業(yè)技術 航空、航天 環(huán)境科學、安全科學 軍事 政學 文化、科學、教育、 交通運輸 經(jīng)濟 語言、文字 文學 農(nóng)業(yè)科學 社會科學總論 藝術 歷史、地理 哲學 數(shù)理科學和化學 綜合性圖書 哲學宗教
  • 經(jīng)營營銷 >
    經(jīng)營營銷
    綜合文檔 經(jīng)濟財稅 人力資源 運營管理 企業(yè)管理 內控風控 地產(chǎn)策劃
  • 教學課件 >
    教學課件
    幼兒教育 小學教育 初中教育 高中教育 職業(yè)教育 成人教育 高等教育 考研資源 試題真題 作業(yè)習題 課后答案 綜合教學
  • 土木建筑 >
    土木建筑
    專項施工 應急預案 建筑規(guī)范 工藝方案 技術交底 施工表格 圖片圖集
  • 課程導學 >
    課程導學
    醫(yī)學綜合 中醫(yī)養(yǎng)生 醫(yī)學研究 身心發(fā)展 醫(yī)學試題 影像醫(yī)學 醫(yī)院辦公 外科醫(yī)學 老年醫(yī)學 內科醫(yī)學 婦產(chǎn)科 神經(jīng)科 醫(yī)學課件 眼鼻喉科 皮膚病科 腫瘤科 兒科醫(yī)學 康復醫(yī)學 全科醫(yī)學 護理學科 針灸學科 重癥學科 病毒學科 獸醫(yī) 藥學
    • 簡介:大連理工大學碩士學位論文MASTERALDISSERTATL0N⑧基于最大熵的漢語介詞短語自動識別學科、專業(yè)指導教師論文答辯日期于浚濤鹽蔓盟堡豈堇壟黃德根教授2006年12月大連理工大學碩士學位論文AUTOMATICIDENTIFICATIONOFCHINESEPREPOSITIONALPHRASEBASEDONMAXIMUMENTROPYABSTRACTPREPOSITIONALPHRASEISONEOFTHEMOSTIMPORTANTCHINESEPHRASESTHEMEANINGOFPREPOSITIONALPHRASEIDENTIFICATIONLIESINTHREEASPECTSFIRSTLY,ITREDUCESTHECANDIDMENUMBERSOFMAINVERBIDENTIFICATIONSECONDLY,ITSIMPLIFIESTHESTRUCTUREOFSENTENCEANDMAKESTHEPARSINGEASIERINTHENEXTSTEPFINALLY,ITBENEFITSTHETEMPLATEMATCHINGINEXAMPLEBASEDMACHINETRANSLATIONASAKEYPROBLEMOFNATURALLANGUAGELJROCESSING,THEPROBLEMSOFCOMPLETESYNTACTICPARSINGARE21’TSOLVEDYETTHETHESISAIMSTODISCUSSTHEMETHODSANDTECHNIQUESOFCHINESEPREPOSITIONALPHRASEIDENTIFICATIONTHENTHEFIRSTNOVELASPECTOFOU%WORKISDISCUSSINGTHESEMANTIC,SYNTAXANDUSAGEOFCHINESEPREPOSITIONALPHRASE,ANDMAKINGASPECIFICATIONFORANNOTATINGTHECHINESEPREPOSITIONALPHRASEFROMCOMPUTATIONALPOINTOFVIEWISCAREFULLYDESIGNEDBASEDONTHERELATEDWORKOFCHINESELINGUISTSDURINGTHERESEARCH,BASEDONCHURCH’SIDEATHATBASENPIDENTIFICATIONCANBETREATEDASPARTOFSPEECHTAGGING,ANEFFECTIVEAIGOFITHMISPROMOTEDINTHISPAPERTOIDENTIFYPREPOSITIONALPHRASESINSHALLOWPARSINGLEVELUSINGTHESEFEATURESTHESYSTEMOFCHINESEPREPOSITIONALPHRASEIDENTIFICATIONINTHISTHESISADOPTSASTATISTICALMODELBASEDMAXIMUMENTROPY匝INPRACTICE,USINGMEMODELWECANREACHHIGHACCURACYWITHKNOWLEDGEPOORFEATURESANOTHERADVANTAGEOFMEMODELISITSREUSABILITYANDTHETHEORYOFMEFRAMEWORKISINDEPENDENTOFANYPARTICULARNATURALLANGUAGETASKNLESELECTIONOFFEATURESISAKEYPROBLEMOFMEMODELWHICHDETERMINESTHEPERFORMANCEOFTHEIDENFIFIEATIONAIMINGATTHETASKOFCHINESEPREPOSITIONALPHRASEIDENTIFICATION,WEPROPOSEDTHATWORDANDPARTOFSPEECHARETHEMAINFACTORSWHICHCONSTRUCTAFEATUREGPACEOFMEMODELANDANALGORITHMISPRESENTEDTOAUTOMATICALLYACQUIREAFEATURESETNLERESULTSSHOWTHATTHEMETHODOFOURSYSTEMISEFFICIENTFORCHINESEPREPOSITIONALPHRASEIDENTIFICATIONINOPENTEST,THEPRECISIONREACH891%FURTHERMORE,THISMODELHASAGOODEXPANDABILITYWHICHCANBEUSEDTECOGNIZEOTHERPHRASESSUCHASBASENPANDTHELONGESTNPKEYWORDSNATURALLANGUAGEPROCESSING;SHALLOWPARSING;PREPOSITIONALPHRASEIDENTIFICATION;MAXIMUMENTROPY
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 54
      9人已閱讀
      ( 4 星級)
    • 簡介:語音識別是利用計算機對人類的語音進行處理,將語音信號轉化為文字符號的一種技術。國內外對漢語語音識別的研究已經(jīng)有了近60年的歷史,取得了很大的進展,但仍存在很多問題?,F(xiàn)有的語音識別技術還達不到人與機器通過自然語言交互的目標,大詞匯量、非特定人的連續(xù)語音識別仍是語音識別研究的難點與重點。本文主要研究漢語連續(xù)語音識別的關鍵技術。首先介紹了語音識別的原理、語音識別系統(tǒng)的組成以及漢語語音的基本知識。然后分別介紹了語音識別的預處理、特征參數(shù)提取、模式匹配和后處理階段的功能及其關鍵技術,并針對傳統(tǒng)方法中存在的問題提出了改進方案。本文的主要工作有1在個人電腦平臺下,用MICROSOFTVISUALC,MATLAB,MICROSOFTSQLSERVER等工具實現(xiàn)了一個中等詞匯量、非特定人的漢語連續(xù)語音識別系統(tǒng),并對系統(tǒng)進行了實驗。系統(tǒng)選擇聲韻母作為識別基元,特征參數(shù)采用MEL頻標倒譜系數(shù),識別模型選用動態(tài)時間規(guī)整模型。2識別基元分割的準確度對系統(tǒng)的識別性能影響很大,現(xiàn)有的聲韻母分割方法在非連續(xù)語音中分割準確度較高,但在連續(xù)語音中分割準確度大幅度降低。針對這一問題,本文結合漢語連續(xù)語音的特性,利用熵與漢語元音的共振峰能量設計了一種新的聲韻母分割方法,有效提高了聲韻母分割的準確度。3采用傳統(tǒng)動態(tài)時間規(guī)整技術的語音識別系統(tǒng)在識別時計算量較大,系統(tǒng)響應時間長。針對這一問題,本文提出了基于模板閾值的DTW改進算法和基于待測語音特征矢量閾值的DTW改進算法,有效減少了計算量,提高了系統(tǒng)的實時性。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 58
      6人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 135
      15人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時間:2024-03-11
      頁數(shù): 54
      4人已閱讀
      ( 4 星級)
    • 簡介:漢語休閑娛樂短信主要是指短信寫手創(chuàng)作的或者個人群發(fā)給他人他人覺得有轉發(fā)價值而大量傳遞的文字短信。它們以問候、溝通情感或消遣娛樂為目的復制頻率高、流行速度快、傳播面積廣、影響力度大。它不同于一般日常交際語言和傳媒語言對語言進行了信息化處理具有簡潔性通俗性幽默性。休閑娛樂短信已經(jīng)引起了學者的廣泛關注。但以往的研究基本上注重描述其修辭學、美學特點和表達技巧闡述其興起的社會文化根源突出的幽默效果和語言功能。很少從認知語言學角度研究此類短信產(chǎn)生的認知理據(jù)和理解過程中的認知機制問題即語篇的深層連貫問題。本文從認知語言學的角度出發(fā)用LAKOFF的理想認知模型IDEALIZEDCOGNITIVEMODELS為理論支撐與出發(fā)點通過理論與實際語料相結合的方法對漢語休閑娛樂短信的語篇連貫進行解釋。通過研究為CETMS提供新的視角證明理想認知模型的解釋力也為理解CETMS的語篇連貫提供了認知機制進而幫助短信創(chuàng)作者創(chuàng)作和讀者更好的理解。ICMS以經(jīng)驗主義哲學為基礎是知識得以組織的結構強調用百科知識來分析動態(tài)的語篇運作機制。休閑娛樂短信不同于一般交際語言有著其獨特的語篇特征。它由多個語句組成的每個語句或部分有其自身的ICM組織構成語句或部分之問不同的ICMS不斷出現(xiàn)、更新、完善幫助讀者在心智中整合出一個連貫的語篇。在語義連貫上休閑娛樂短信具有三種特點正常連貫、聯(lián)想連貫和偏離連貫。研究發(fā)現(xiàn)理想認知模型的四個基本模式是宏觀上構建正常連貫和聯(lián)想連貫休閑娛樂短信語篇連貫的保證短信收發(fā)者ICM的差異是我們微觀上理解和鑒賞偏離連貫的關鍵。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 84
      4人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時間:2024-03-11
      頁數(shù): 61
      19人已閱讀
      ( 4 星級)
    • 簡介:在當今全球信息一體化的時代,網(wǎng)絡資源的不斷增長提供給人們的電子文本信息越來越多。人們能從這些文本信息中獲取大量的知識或技能,但又面臨著信息太多而時間不夠的問題。雖然目前有很多搜索網(wǎng)站,人們可以通過搜索關鍵詞的方式來查找相關信息,但搜索出來的信息量依然太多,往往只有人們閱讀完文本后才發(fā)現(xiàn)不是所需要的信息。因此,如何能有效地對文本進行主題分析成為迫切需要解決的問題。本文針對文本主題分析技術中的主題分割和主題識別展開了研究,主要包括以下幾部分工作首先,分析了當前文本主題分析技術的研究現(xiàn)狀、相關的概念與現(xiàn)有的技術,并分析了自然語言處理中常用的評價方法如何在文本主題分析中得到使用。其次,本文提出了基于SVO的段落相似度計算方法,并將該方法應用到文本主題分割中。接著,提出了基于關鍵句的文本主題識別方法。該方法是基于文本主題分割后的結果,對每個相對獨立的主題文本塊進行主題識別,找出適合做文本塊主題的關鍵句,并將其進行處理使得關鍵句語義完整。將這種主題分割和主題識別的方法統(tǒng)稱為基于統(tǒng)計的文本主題分析技術。實驗結果表明該技術在文本主題分割中比傳統(tǒng)的建立段落向量空間模型計算連續(xù)段落相似度的方法更有效,在主題識別上找出的關鍵句在一定程度上優(yōu)于MICROSOFTWD尋找的關鍵句。另外,針對上面先進行主題分割后進行主題識別的方法導致主題漏識的情況,提出了統(tǒng)計與知識相結合的文本主題分析技術。該技術中使用了同義知識和主題知識,先進行主題識別再進行主題分割,將主題分割后的文本塊進一步進行主題識別,將兩次主題識別結果的并集作為整個文本的主題。該技術一定程度上提高了主題分割和主題識別的準確率。然后,使用VC和MATLAB混合編程實現(xiàn)了文本主題分析系統(tǒng),將其用于文本主題分析。最后,本文對研究工作進行了總結,提出了今后進一步的研究方向。
      下載積分: 5 賞幣
      上傳時間:2024-03-11
      頁數(shù): 114
      5人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 72
      4人已閱讀
      ( 4 星級)
    • 簡介:詞性是詞匯的最基礎的屬性它不僅為句法、語法分析提供了相應的知識基礎同時也為諸如詞性標注等自然語言任務提供了有利的判定信息。詞性標注的主要任務是對連續(xù)的詞匯串中的詞匯的詞性進行標注由于其在自然語言處理領域具有非常重要的地位所以具有比較廣泛的研究背景。詞性標注的標注結果對于自然語言任務的眾多語言任務的精確度起到了決定性作用目前主要利用統(tǒng)計學模型和建立語言規(guī)則庫的方法對詞性標注的結果進行改進。其中利用隱馬爾科夫模型HIDDENMARKOVMODELHMM方法進行詞性標注的方法是基于統(tǒng)計學模型的詞性標注方法中比較常用的。由于漢語語言學的存在著一些獨特的語法特性在使用HMM在詞性標注的標注過程中經(jīng)常出現(xiàn)了包括模型的數(shù)據(jù)稀疏、兼類詞歧義以及未登錄詞等諸多問題。在不斷地對HMM的研究過程中眾多學者相繼提出了利用神經(jīng)網(wǎng)絡、規(guī)則庫以及有限狀態(tài)機等方法與傳統(tǒng)HMM相結合而演化成的新的詞性標注方法這些方法都在一定程度上優(yōu)化了詞性標注系統(tǒng)的標注結果。本論文首先在研究了傳統(tǒng)的統(tǒng)計模型與神經(jīng)網(wǎng)絡對漢語的詞性標注過程后分析了BP網(wǎng)絡與傳統(tǒng)隱馬爾科夫模型在詞性標注領域的特點提出了一種新的模型負反饋隱馬爾科夫模型BACKPROPAGATIONHIDDENMARKOVMODELBPHMM。BPHMM模型可以充分地利用上下文信息輔助詞性標注系統(tǒng)進行詞性標注任務。其次由于目前傳統(tǒng)平滑算法不能滿足新模型的數(shù)據(jù)平滑需要因此針對模型的特點和特性選取刪除插值法進行優(yōu)化對模型的狀態(tài)轉移矩陣進行平滑處理并調整模型的觀察概率矩陣。同時將經(jīng)過BP網(wǎng)絡建立的語法規(guī)則庫加入未登錄詞處理辦法中利用規(guī)則庫有效的處理未登錄詞的標注問題。本文從北大的1998年人民日報標注語料庫中抽取訓練語料在復旦大學開源自然語言處理系統(tǒng)FUDANNLP的基礎上利用JAVA在ECLIPSE平臺上實現(xiàn)對負反饋隱馬爾科夫模型的訓練學習經(jīng)過語料庫預處理、平滑處理以及未登錄詞處理等操作最后對VITERBI算法進行改進優(yōu)化對待標注的語料進行標注并測試結果。實驗表明通過使用負反饋隱馬爾科夫模型在加入平滑算法以及生詞處理算法之后進行詞性標注可以獲得更加理想的詞性標注效果。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 54
      7人已閱讀
      ( 4 星級)
    • 簡介:本文開發(fā)基于詞匯功能文法的面向數(shù)據(jù)的漢語句法分析方法,其研究目標即為基于詞匯功能文法的形式化描述體系,研究面向數(shù)據(jù)的分析理論在漢語句法分析處理中的具體應用。給出了一個LFGDOP的漢語句法分析模型,并對這個模型的技術框架語料庫的標注、表達、片段、分解操作、組合操作進行構建,通過對漢語句子的分析實例闡明了這個模型框架。再給出了對漢語句子的概率計算和可能性模式,根據(jù)所有片段單元的共現(xiàn)頻率來評估最有可能性的分析結果。最后比較了兩種片段的評估方法選擇最有可能的分析、經(jīng)驗主義的評估法,來驗證了這個模型的可行性。以DOP技術作為基本框架,同時利用基于相似的概率評估技術,實現(xiàn)漢語句法分析的方法。隨著日益增長的大量信息成為可利用,尤其是已成為全球最大數(shù)字式信息空間的INTEMET,其指數(shù)膨脹帶來了緊迫的資源發(fā)現(xiàn)問題,即怎樣在巨大的、不斷增長的各類資源中準確地查詢用戶所需要的信息。本課題為更加有效地利用詞匯功能文法與面向數(shù)據(jù)的分析技術來提高語言分析的性能,提出了一條嶄新的途徑,必將具有廣泛應用和推廣價值,將會對人類更好地解決自然語言分析難題起到積極的推動作用。為深入探討針對漢語這種作為世界上使用人數(shù)最多的這種自然語言與其它西方語言的信息處理方法,進行基于詞匯功能文法的面向數(shù)據(jù)的漢語句法分析的課題研究,是非常有意義的一項課題。
      下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 64
      13人已閱讀
      ( 4 星級)
    • 簡介:數(shù)據(jù)庫自然語言界面NLIDB是自然語言處理NLP最早和最廣泛的研究領域之一它主要涉及到自然語言處理和數(shù)據(jù)庫系統(tǒng)的研究是一個具有重大理論價值和巨大實用價值的研究領域在數(shù)據(jù)庫自然語言查詢界面的研究中對用戶輸入的查詢語句的理解是其關鍵部分而其中的查詢條件與查詢目標的理解又是其主要內容該文的研究工作即是對查詢語句中查詢目標與查詢條件的識別的研究主要工作有1系統(tǒng)地研究了數(shù)據(jù)庫隱含知識并給出了相應的知識表示數(shù)據(jù)庫隱含知識是指那些由于數(shù)據(jù)之間的相關性引起的并可通過自然語言表現(xiàn)出來而在數(shù)據(jù)庫中雖然存在這一部分數(shù)據(jù)但必須通過某幾種操作或邏輯運算才能得到的知識數(shù)據(jù)庫隱含知識反映了用戶對現(xiàn)實世界的理解從而用戶在進行查詢時會使用大量的數(shù)據(jù)庫隱含知識一個系統(tǒng)處理數(shù)據(jù)庫隱含知識的能力反映了它的易用性問題該文增強了對查詢語句中的數(shù)據(jù)庫隱含知識的處理能力2在查詢目標的識別中增強了對數(shù)據(jù)庫隱含知識的處理能力對查詢目標進行了不同的分類并給出了相關的變換算法給出了基于數(shù)據(jù)庫語義的查詢語句中的查詢目標識別的模板這種模板可識別出不同句型中不同的查詢目標3在查詢條件的識別中提出了基于數(shù)據(jù)庫語義的以域值為中心的查詢條件識別方法增強了對含數(shù)據(jù)庫隱含知識的查詢條件的處理并對含領域動詞的查詢條件項的識別和含否定詞的查詢條件項的識別等查詢條件識別的難點進行了詳細的研究給出了解決方法與算法最后給出了查詢條件識別的一般算法
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 92
      10人已閱讀
      ( 4 星級)
    • 簡介:語音識別技術是利用計算機處理語音信號,并將語音信號轉換成有意義符號序列的一項技術。以命令詞識別、關鍵詞識別和連續(xù)數(shù)字串識別為代表的中小訶匯量語音識別技術,是語音識別實甩化研究中相當重要的方向。本文開展的工作主要集中于仿生模式識別理論在漢語關鍵詞識別領域的應用。仿生模式識別強調“認識”事物,而不是對事物進行“分類”。已有的大部分實現(xiàn)均采用了神經(jīng)網(wǎng)絡的硬件方式,本文則依靠軟件方式,并提出了自己的超多面體覆蓋檢測算法。與傳統(tǒng)的連續(xù)隱馬爾可夫模型的比較實驗表明,仿生模式識別的方法在少量樣本的情況下識別率遠遠優(yōu)于隱馬爾可夫模型。而將該理論應用到端點檢測方面也取得了很好的效果。關鍵訶識別系統(tǒng)在識別之后需要經(jīng)過說話驗證階段。本文采用后分類器作為驗證器實現(xiàn)說話驗證。在研究了統(tǒng)計學習理論中的嚴格支持向量機算法后,提出了參數(shù)優(yōu)化迭代的訓練算法。實驗表明應用該算法實現(xiàn)的后分類器在關鍵詞識別系統(tǒng)的說話驗證階段提高了系統(tǒng)的檢出率。綜合上述的研究成果,本文實現(xiàn)了一個有關旅游信息的關鍵詞識別系統(tǒng)。自行建立了有關旅游信息的語音庫,從特征提取、端點檢測到關鍵詞識別均采用本文所述的算法。
      下載積分: 5 賞幣
      上傳時間:2024-03-11
      頁數(shù): 76
      13人已閱讀
      ( 4 星級)
    • 簡介:近年來漢語數(shù)字語音識別系統(tǒng)越來越廣泛的應用于各個領域。在實際生活中,由于噪聲等因素的影響,常常造成漢語數(shù)字較低的識別率。本文對漢語數(shù)字語音識別系統(tǒng)的訓練數(shù)據(jù)、評測數(shù)據(jù)及聲學模型進行了研究。完成了對兩個新語音庫中評測講話者的選擇。并對系統(tǒng)識別精確度進行分析,通過對單音子模型及雙音子模型的狀態(tài)數(shù)的調整,提高了語音識別系統(tǒng)的識別精確度。本文主要研究了以下三方面的內容1研究了漢語語音識別系統(tǒng)中聲學模型的構造。并了解語音識別系統(tǒng)中相關聲學模型參數(shù)估計、識別過程的算法及步驟。這個過程有利于對語音庫中訓練數(shù)據(jù)和評測數(shù)據(jù)的區(qū)分,并為提高系統(tǒng)識別精確度提供了依據(jù)。2提出了一種為語音庫選擇評測講話者的方法。對于目前已擁有的幾組不同的評測講話者,通過分別比較各組評測講話者識別精確度曲線與語音庫所有講話者識別精確度曲線之間的最小均方差值,選擇出該值最小的一組評測講話者,作為此語音庫的評測講話者,用于客觀衡量語音識別系統(tǒng)中模型的訓練好壞。3在提高識別系統(tǒng)精確度的研究中,對數(shù)字1和數(shù)字5的識別錯誤率進行了分析并找出相應的問題,通過逐步調整單音子模型及雙音子模型的狀態(tài)數(shù),進而對模型進行改進。最后,在實驗中逐步修改數(shù)字1、數(shù)字5的單音子模型及雙音子模型的狀態(tài)數(shù),對修改后的模型進行訓練、參數(shù)重估,并對系統(tǒng)進行評測,得到新的識別精確度。結果表明,通過對模型狀態(tài)數(shù)的修改,系統(tǒng)的識別精確度得到提高。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 61
      5人已閱讀
      ( 4 星級)
    • 簡介:漢語作為世界上使用人口數(shù)量最多的語言,是各國公眾了解中國的重要工具,也日益受到了許多國家的政府及教育機構的重視。全球范圍內學習漢語的人數(shù)越來越多,但由于某些原因,傳統(tǒng)課程的漢語學習已經(jīng)不能滿足某些學習者學習漢語的需求,另外傳統(tǒng)教學模式的單調統(tǒng)一有時并不能引起學習者的興趣,對于漢語初學者來說還有可能打擊其學習的積極性,這些都在某種程度上限制了漢語學習以及漢語在全球的普及發(fā)展。另外由于計算機及網(wǎng)絡技術尤其是INTER的飛速發(fā)展,將從根本上消除人們進行信息交流時的時空限制,從而也將對傳統(tǒng)的以課堂教學為核心的傳統(tǒng)教學模式帶來一場“革命”。本文針對漢語學習對“聚焦?jié)h語”在線漢語學習網(wǎng)站進行設計、開發(fā)、實現(xiàn)與測試,在系統(tǒng)的設計開發(fā)過程中,注重了科學的軟件設計思路。首先在總體設計上,采用了模塊化和分層的設計理念,使整個系統(tǒng)流程清晰、邏輯合理,為系統(tǒng)的實現(xiàn)創(chuàng)造了良好的條件;其次,在各功能模塊的實現(xiàn)上,采用了在技術上非常流行的BS架構;然后,在網(wǎng)站的實現(xiàn)過程中,采用了PHP技術編寫WEB應用程序,并使用PHP模板設計網(wǎng)站整體風格;最后,數(shù)據(jù)的存儲和管理均使用MYSQL。本文就以網(wǎng)站內容和實現(xiàn)途徑為主,試圖讓大家可以全方位地了解這個網(wǎng)站。在網(wǎng)站內容方面,主要實現(xiàn)了教師與學生之間的相互交流和學習互動,老師可以通過該系統(tǒng)發(fā)布教學資源和解答學生提問,學生可以通過該系統(tǒng)瀏覽、下載學習資料以及向老師提問等,其中漢語發(fā)音困難聲母的發(fā)音三維動畫短片是本網(wǎng)站的一大特色。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 66
      4人已閱讀
      ( 4 星級)
    • 簡介:語音識別技術經(jīng)過30多年的發(fā)展,目前的研究已經(jīng)進入非特定人、大詞匯量、連續(xù)語音識別的高級階段。在這個過程中,隱馬爾可夫模型HMM扮演了重要的角色,當前幾乎所有優(yōu)秀的語音識別系統(tǒng)都是基于HMM的。但是,傳統(tǒng)的連續(xù)密度隱馬爾可夫模型CDHMM有狀態(tài)輸出獨立的假設,并假定其狀態(tài)輸出概率密度函數(shù)為混合高斯分布函數(shù)線性加權和。針對這些問題,本文提出了一種新結構的識別模型CDHMMMLP混合網(wǎng)絡模型,即將傳統(tǒng)的HMM和多層感知器MLP網(wǎng)相結合,以HMM為基本框架,每個HMM狀態(tài)對應于一個MLP網(wǎng),用相繼的若干幀特征矢量作為MLP網(wǎng)的輸入,利用改進的BP算法,對系統(tǒng)的輸出進行預測,從而實現(xiàn)對每個狀態(tài)的輸出概率密度函數(shù)的估計,這樣識別系統(tǒng)的狀態(tài)輸出概率取決于MLP網(wǎng)對實際語音信號的逼近程度。該方法不僅能有效地在語音識別中引入幀間相關性,而且能克服狀態(tài)輸出概率密度函數(shù)為混合高斯分布的束縛,很好地描述了語音信號中存在的非線性特性。本論文為基于基本的HMM和基于混合網(wǎng)絡模型這兩種不同算法分別建立了非特定人漢語連續(xù)數(shù)碼串語音識別系統(tǒng),通過對比分析這兩個系統(tǒng)的實驗結果發(fā)現(xiàn)后者的識別效果明顯優(yōu)于前者,充分證實了該方法的有效性。本論文首先介紹了語音識別的發(fā)展、現(xiàn)狀、方向和應用前景,接著重點介紹了目前應用最廣泛的MFCC特征參數(shù)的提取過程。其次,從評估問題、訓練問題、解碼問題三個方面對HMM進行了詳細的介紹。再次,對神經(jīng)網(wǎng)絡及其在語音識別中的應用做了介紹,并對本文中選用的MLP網(wǎng)進行了詳細的探討。最后應用這兩種不同的模型借助MATLAB平臺分別建立了漢語非特定人連續(xù)數(shù)碼串語音識別系統(tǒng),并對這兩個識別系統(tǒng)的實驗結果進行了對比、分析,證實了基于混合網(wǎng)絡模型的系統(tǒng)識別效果要優(yōu)于基本模型的,同時對本論文的工作做了總結,對今后進一步的研究做了展望。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 75
      7人已閱讀
      ( 4 星級)
    關于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服客服 - 聯(lián)系我們

    機械圖紙源碼,實習報告等文檔下載

    備案號:浙ICP備20018660號