眾賞文庫
全部分類
  • 抗擊疫情 >
    抗擊疫情
    病毒認(rèn)知 防護(hù)手冊(cè) 復(fù)工復(fù)產(chǎn) 應(yīng)急預(yù)案 防控方案 英雄事跡 院務(wù)工作
  • 成品畢設(shè) >
    成品畢設(shè)
    外文翻譯 畢業(yè)設(shè)計(jì) 畢業(yè)論文 開題報(bào)告 文獻(xiàn)綜述 任務(wù)書 課程設(shè)計(jì) 相關(guān)資料 大學(xué)生活 期刊論文 實(shí)習(xí)報(bào)告
  • 項(xiàng)目策劃 >
    項(xiàng)目策劃
    土地準(zhǔn)備 規(guī)劃設(shè)計(jì) 開工開盤 項(xiàng)目綜合 竣工移交 售后移交 智慧方案 安全專項(xiàng) 環(huán)境影響評(píng)估報(bào)告 可行性研究報(bào)告 項(xiàng)目建議書 商業(yè)計(jì)劃書 危害評(píng)估防治 招投標(biāo)文件
  • 專業(yè)資料 >
    專業(yè)資料
    人文法律 環(huán)境安全 食品科學(xué) 基礎(chǔ)建設(shè) 能源化工 農(nóng)林牧畜 綜合待分類 教育經(jīng)驗(yàn) 行政人力 企業(yè)管理 醫(yī)學(xué)衛(wèi)生 IT技術(shù) 土木建筑 考研專題 財(cái)會(huì)稅務(wù) 公路隧道 紡織服裝
  • 共享辦公 >
    共享辦公
    總結(jié)匯報(bào) 調(diào)研報(bào)告 工作計(jì)劃 述職報(bào)告 講話發(fā)言 心得體會(huì) 思想?yún)R報(bào) 事務(wù)文書 合同協(xié)議 活動(dòng)策劃 代理加盟 技術(shù)服務(wù) 求職簡歷 辦公軟件 ppt模板 表格模板 融資協(xié)議 發(fā)言演講 黨團(tuán)工作 民主生活
  • 學(xué)術(shù)文檔 >
    學(xué)術(shù)文檔
    自然科學(xué) 生物科學(xué) 天文科學(xué) 醫(yī)學(xué)衛(wèi)生 工業(yè)技術(shù) 航空、航天 環(huán)境科學(xué)、安全科學(xué) 軍事 政學(xué) 文化、科學(xué)、教育、 交通運(yùn)輸 經(jīng)濟(jì) 語言、文字 文學(xué) 農(nóng)業(yè)科學(xué) 社會(huì)科學(xué)總論 藝術(shù) 歷史、地理 哲學(xué) 數(shù)理科學(xué)和化學(xué) 綜合性圖書 哲學(xué)宗教
  • 經(jīng)營營銷 >
    經(jīng)營營銷
    綜合文檔 經(jīng)濟(jì)財(cái)稅 人力資源 運(yùn)營管理 企業(yè)管理 內(nèi)控風(fēng)控 地產(chǎn)策劃
  • 教學(xué)課件 >
    教學(xué)課件
    幼兒教育 小學(xué)教育 初中教育 高中教育 職業(yè)教育 成人教育 高等教育 考研資源 試題真題 作業(yè)習(xí)題 課后答案 綜合教學(xué)
  • 土木建筑 >
    土木建筑
    專項(xiàng)施工 應(yīng)急預(yù)案 建筑規(guī)范 工藝方案 技術(shù)交底 施工表格 圖片圖集
  • 課程導(dǎo)學(xué) >
    課程導(dǎo)學(xué)
    醫(yī)學(xué)綜合 中醫(yī)養(yǎng)生 醫(yī)學(xué)研究 身心發(fā)展 醫(yī)學(xué)試題 影像醫(yī)學(xué) 醫(yī)院辦公 外科醫(yī)學(xué) 老年醫(yī)學(xué) 內(nèi)科醫(yī)學(xué) 婦產(chǎn)科 神經(jīng)科 醫(yī)學(xué)課件 眼鼻喉科 皮膚病科 腫瘤科 兒科醫(yī)學(xué) 康復(fù)醫(yī)學(xué) 全科醫(yī)學(xué) 護(hù)理學(xué)科 針灸學(xué)科 重癥學(xué)科 病毒學(xué)科 獸醫(yī) 藥學(xué)
  • 漢語 (共10000 份)
  • 用時(shí):9ms
    資源分類:
    全部 抗擊疫情 成品畢設(shè) 項(xiàng)目策劃 專業(yè)資料 共享辦公 學(xué)術(shù)文檔 經(jīng)營營銷 教學(xué)課件 土木建筑 課程導(dǎo)學(xué)
    二級(jí)分類:
    全部 自然科學(xué) 生物科學(xué) 天文科學(xué) 醫(yī)學(xué)衛(wèi)生 工業(yè)技術(shù) 航空、航天 環(huán)境科學(xué)、安全科學(xué) 軍事 政學(xué) 文化、科學(xué)、教育、體育 交通運(yùn)輸 經(jīng)濟(jì) 語言、文字 文學(xué) 農(nóng)業(yè)科學(xué) 社會(huì)科學(xué)總論 藝術(shù) 歷史、地理 哲學(xué) 數(shù)理科學(xué)和化學(xué) 綜合性圖書 哲學(xué)宗教
    三級(jí)分類:
    全部 生物科學(xué) 文學(xué) 自然科學(xué)總論 歷史、地理 軍事 文化、科學(xué)、教育、體育 農(nóng)業(yè)科學(xué) 工業(yè)技術(shù) 交通運(yùn)輸 數(shù)理科學(xué)和化學(xué) 政學(xué) 醫(yī)學(xué)、衛(wèi)生 天文學(xué)、地球科學(xué) 航空、航天 經(jīng)濟(jì) 環(huán)境科學(xué)、安全科學(xué) 社會(huì)科學(xué)總論 藝術(shù) 哲學(xué)、宗教 語言、文字
    四級(jí)分類:
    全部 漢語 常用外國語 語言學(xué)
    上傳類型:
    全部 互聯(lián)網(wǎng)共享 作者原創(chuàng) 獨(dú)家資料
    資源格式:
    不限 doc ppt pdf 圖片 flash 視頻 音頻 壓縮包
    上架時(shí)間:
    不限 三天內(nèi) 一周內(nèi) 一個(gè)月內(nèi) 一年內(nèi)
    特色搜索:
    不限 文件包巨大 瀏覽量超巨 購買量排行 子文件超多好評(píng)如潮
    • 簡介:語義知識(shí)資源的建設(shè)一直是中文信息處理的重要問題,其發(fā)展對(duì)中文信息處理領(lǐng)域有著舉足輕重的作用。人們對(duì)語義知識(shí)資源的建設(shè)也進(jìn)行了積極而有益的探索,例如國外著名的WD、FRAME等語義資源,國內(nèi)的知網(wǎng)、現(xiàn)代漢語語法信息詞典、中文概念詞典CCD等。這些資源由于大多是人工構(gòu)建,耗時(shí)較長,且不便于快捷的自動(dòng)更新,因而滿足不了漢語語言文化的不斷發(fā)展的需求。為此,本文嘗試結(jié)合面向?qū)ο蠛驼Z義網(wǎng)絡(luò)兩者的優(yōu)點(diǎn),構(gòu)建了面向?qū)ο蟮臐h語語義網(wǎng)絡(luò)模型,并對(duì)其相應(yīng)的漢語語義知識(shí)庫進(jìn)行設(shè)計(jì)和自動(dòng)構(gòu)建。根據(jù)面向?qū)ο蠛驼Z義網(wǎng)絡(luò)的理論,探索了面向?qū)ο蟮臐h語語義網(wǎng)絡(luò)表示法,給出了基于面向?qū)ο蟮臐h語語義網(wǎng)絡(luò)模型。對(duì)模型中所涉及的繼承、聚合、相似和對(duì)立四種語義關(guān)系進(jìn)行了研究,并通過度量結(jié)點(diǎn)間的相似度和對(duì)立度來確定模型中結(jié)點(diǎn)間的遠(yuǎn)近,給出了基于本模型的計(jì)算相似度和對(duì)立度的方法。對(duì)面向?qū)ο蟮臐h語語義網(wǎng)絡(luò)模型所對(duì)應(yīng)的漢語語義知識(shí)庫進(jìn)行研究和分析,重點(diǎn)探索了具有面向?qū)ο笏枷氲慕Y(jié)點(diǎn)的有效存儲(chǔ)方式。并初選取普通話三千常用詞表中的三千詞作為研究的主要對(duì)象,人工對(duì)其進(jìn)行結(jié)點(diǎn)和結(jié)點(diǎn)間關(guān)系的選取及有效存儲(chǔ),得到了基礎(chǔ)的漢語語義知識(shí)庫。在此基礎(chǔ)上設(shè)計(jì)了漢語語義知識(shí)庫的自動(dòng)構(gòu)建的框架,利用CCD語義知識(shí)源來發(fā)現(xiàn)結(jié)點(diǎn),并采用統(tǒng)計(jì)和模版匹配相結(jié)合的方法對(duì)結(jié)點(diǎn)關(guān)系進(jìn)行有效的識(shí)別,從而使其按照一定的規(guī)則添加至漢語語義知識(shí)庫中。這種自動(dòng)構(gòu)建方式豐富了漢語語義知識(shí)庫,使其能夠及時(shí)更新資源。實(shí)驗(yàn)表明,這種增長是有效果的。漢語語義知識(shí)庫的構(gòu)建工程量大,難度很高,目前還只能在有限目標(biāo)下開展工作。但是我們已經(jīng)找到了一條可行的技術(shù)路徑來實(shí)現(xiàn)漢語語義知識(shí)庫的及時(shí)擴(kuò)充與更新。該語義知識(shí)庫還可以為其它中文信息處理的應(yīng)用提供基礎(chǔ)資源,應(yīng)用前景十分廣闊。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 57
      4人已閱讀
      ( 4 星級(jí))
    • 簡介:四川大學(xué)碩士學(xué)位論文論漢語謙敬稱的英譯姓名朱靈慧申請(qǐng)學(xué)位級(jí)別碩士專業(yè)外國語言學(xué)及應(yīng)用語言學(xué)指導(dǎo)教師敖凡20050101逐字翻譯,更是一個(gè)在諸多可能中選擇的過程。在這個(gè)選擇過程中,不是要在譯文中尋找謙敬稱的對(duì)等形式,而是在眾多因素的共同影響下選擇能滿足原文作者或譯者意圖的表達(dá)。本文試圖從功能翻譯理論入手,通過分析影響翻譯選擇的相關(guān)因素如原文及其作者、譯者、預(yù)設(shè)讀者和具體語用場景來論述漢語謙敬稱的英譯是在譯者意圖影響下的一個(gè)選擇過程。在整篇文章的論述中,楊憲益和霍克斯對(duì)紅樓夢中謙敬稱的處理將會(huì)用作例證加以對(duì)比。本文除引言和結(jié)語外,共分五章。引言簡要介紹了本文的主題和結(jié)構(gòu)。第一章從稱謂的定義和分類入手,對(duì)漢語謙敬稱的歷史淵源和豐富內(nèi)涵作了具體介紹。第二章梳理了傳統(tǒng)翻譯理論與謙敬稱相關(guān)的主要論述,并指出翻譯實(shí)踐中的具體困難,從理論和實(shí)踐兩個(gè)角度分析形式對(duì)等的不可行。第三章通過論證翻譯是個(gè)不斷選擇的過程,結(jié)合分析相關(guān)影響因素以及功能翻譯理論,進(jìn)而指出這一選擇過程在很大程度上受到譯者翻澤目的和意圖的左右。第四章以楊憲益和霍克斯的兩個(gè)紅樓夢譯本中的謙敬稱翻譯作對(duì)比,以實(shí)例為主線,從原文及其作者、譯者、預(yù)設(shè)讀者和語用場景等方面逐一展開分析。第五章以前面論述為出發(fā)點(diǎn),采用個(gè)案分析的方式闡述在評(píng)判兩個(gè)譯本的處理方式孰優(yōu)孰劣時(shí)不能僅停留在語言層面,而應(yīng)以是否符合各自的翻譯意圖為出發(fā)點(diǎn)。結(jié)語部分對(duì)全文進(jìn)行了歸納。強(qiáng)調(diào)漢語謙敬稱的翻譯無法簡單地用可譯或者不可譯去一語概括,而需把它置于廣闊的歷史文化背景中,從各個(gè)角度綜合分析。同時(shí)還指出,本文只是探討了一個(gè)細(xì)微文化現(xiàn)象的翻譯,但功能翻譯理論同樣對(duì)評(píng)析同一著作的不同譯本具有指導(dǎo)作用。關(guān)鍵詞漢語謙敬稱,選擇過程,功能目的論
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁數(shù): 94
      10人已閱讀
      ( 4 星級(jí))
    • 簡介:聲調(diào)在漢語中有著構(gòu)詞辨義的作用,聲調(diào)的準(zhǔn)確程度足判定普通話好壞的重要因素之一。因此,聲調(diào)評(píng)測子系統(tǒng)也是計(jì)算機(jī)輔助語言學(xué)習(xí)CALL系統(tǒng)以及普通話水平測試PSC系統(tǒng)的重要組成部分。在連續(xù)語流中,因?yàn)楫?dāng)前音節(jié)受上下文內(nèi)容的影響,所以聲調(diào)中存在著不可忽視的變調(diào)和連續(xù)現(xiàn)象,對(duì)這種現(xiàn)象是否處理以及如何處理將對(duì)聲調(diào)評(píng)測系統(tǒng)的性能產(chǎn)生很人的影響。本文考慮連續(xù)語音基頻曲線中存在的各種超音段信息,對(duì)傳統(tǒng)三音節(jié)聲調(diào)輪廓特征的GMM模型進(jìn)行特征的改進(jìn),以提高評(píng)測算法打分的準(zhǔn)確度。本文主要研究成果如下。1基頻曲線的求取傳統(tǒng)基頻曲線FO的求取,只得到了單個(gè)音節(jié)的基音頻率,卻忽略連續(xù)語流中兩個(gè)音節(jié)之間聲調(diào)的轉(zhuǎn)換信息。本文考慮音節(jié)中輔音的基音頻率可以代表前一音節(jié)與當(dāng)前音節(jié)的聲調(diào)轉(zhuǎn)移特征,對(duì)三音節(jié)中的清輔音部分用SPLINE插值法來擬合轉(zhuǎn)移的聲調(diào)曲線。實(shí)驗(yàn)表明,基于曲線插值擬合的GMM模型評(píng)測方法可以使測試集的機(jī)器打分和人工打分相關(guān)性可以達(dá)到07309。2聲調(diào)特征的選擇FUJISAKI模型將基頻曲線拆解成三個(gè)不同的元件函數(shù),它們分別為短語元件代表語句的語調(diào)信息強(qiáng)調(diào)元件反映每個(gè)音節(jié)的音調(diào)走勢,即為聲調(diào)信息基底頻率代表了說話人的個(gè)性信息。根據(jù)上述理論,本文在FUJISAKI模型的基礎(chǔ)上去除語句的語調(diào)和說話人個(gè)性特征,只對(duì)基頻曲線中的聲調(diào)特征建模,結(jié)果顯示,改進(jìn)特征相比于傳統(tǒng)特征,打分相似度在測試集中提高了1409%。3聲調(diào)模型的改進(jìn)在驗(yàn)證聲調(diào)轉(zhuǎn)移特征對(duì)評(píng)測相關(guān)度的促進(jìn)作用中,本文在FUJISAKI模型的基礎(chǔ)上分別對(duì)聲調(diào)的核心段和特征轉(zhuǎn)移段進(jìn)行建模,實(shí)驗(yàn)結(jié)果表明基于頻率轉(zhuǎn)移特征的打分相關(guān)度比純粹核心段特征的打分相關(guān)度要高。并且相較于2中FUJISAKI模型在打分測試集中的相關(guān)度07361,基于聲調(diào)核心段的評(píng)測相關(guān)度只有06137。這也說明了音節(jié)之FHJ頻率轉(zhuǎn)移信息的描述提高了聲調(diào)評(píng)測的準(zhǔn)確度。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁數(shù): 62
      11人已閱讀
      ( 4 星級(jí))
    • 下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁數(shù): 68
      4人已閱讀
      ( 4 星級(jí))
    • 簡介:該文針對(duì)漢語廣播電視新聞?wù)Z音識(shí)別的技術(shù)難點(diǎn)主要進(jìn)行了以下幾個(gè)方面廣泛而深入的研究首先在廣播電視新聞?wù)Z音的連續(xù)語音分割方面該文提出基于檢測熵變換趨勢的音頻特征跳變點(diǎn)檢測方法用來檢測連續(xù)音頻信號(hào)中的聲學(xué)特征發(fā)生改變的地方其次在廣播電視新聞?wù)Z音識(shí)別的自適應(yīng)方面該文詳細(xì)分析了國際上通用的各種廣播電視新聞識(shí)別系統(tǒng)的自適應(yīng)算法的優(yōu)點(diǎn)和缺點(diǎn)最后在廣播電視新聞的連續(xù)語音識(shí)別方面該文基于現(xiàn)有的廣播電視新聞的連續(xù)語音識(shí)別系統(tǒng)在處理相關(guān)性特征建模這個(gè)問題上的缺點(diǎn)和不足結(jié)合特征層的線性旋轉(zhuǎn)變換和模型層的方差建模技術(shù)提出一種用方差建模技術(shù)來實(shí)現(xiàn)的共享狀態(tài)空間旋轉(zhuǎn)變換矩陣的相關(guān)特征建模方法
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁數(shù): 125
      5人已閱讀
      ( 4 星級(jí))
    • 簡介:THECETRANSLATIONOFLONGSENTENCESINLEGALDOCUMENTSACASESTUDYOFTRANSLATIONOFTHEARTICLESOFASSOCIATIONINFBYZHANGYUUNDERTHESUPERVISIONOFPROFESORCHENQINGXUNSUBMITTEDTO0CT2015MENTSATIONTHISREPORTISBASEDONTHECETRANSLATIONOFASERIESOFLEGALDOCUMENTSARTICLESOFASSOCIATIONONONEHAND,THELEGALDOCUMENTSAREHIGHLYSPECIALIZEDWHICHINVOLVEPROFESSIONALKNOWLEDGEONTHE’OTHERHAND,THELEGALLANGUAGEISALANGUAGEFORSPECIALPURPOSESWHICHISPRECISE,F(xiàn)ORMALANDSTANDARDTHESEFEATURESCANBEFOUNDBOTHINCHINESEANDENGLISHLEGALTEXTSHOWEVERCHINESEANDENGLISHBELONGTODIFFERENTLANGUAGESYSTEMSWENEEDTODEALWITHALLTHEDIFFERENCESWHENWETRANSLATETHELEGALTEXTSFROMCHINESETOENGLISHINTHISREPORT,THEAUTHORMAINLYTAKESTHEENGLISHTRANSLATIONOFLONGSENTENCESINTHECHINESELEGALTEXTSASTHEOBJECTOFSTUDYANDDISCUSSESSOMETRANSLATIONTECHNIQUESFORCHINESELONGSENTENCESUNDERTHEGUIDANCEOFASERIESOFTHEPRINCIPLESOFLEGALTRANSLATIONTHEDISCUSSIONMAINLYCANBEDIVIDEDINTOTWOPARTSTHECONNECTIONSWITHINSENTENCESFEATURESANDSYNTACTICFEATURESONTHECONNECTIONSWITHINSENTENCELEVEL,THEAUTHORDISCUSSESTHETRANSLATIONOFTHECHINESELONGSENTENCESTHATWITHOUTTHECONJUNCTIONSTHECONJUNCTIONSAREOFTENADDEDWHENTRANSLATESUCHSENTENCESFROMCHINESETOENGLISHINTHISPART,THETRANSLATIONOFTHECHINESESENTENCESWITHSEVERALVERBSISALSODISCUSSEDTHEAUTHORADOPTSMANYSKILLSSUCHASTHECONVERSIONOFPAASOFSPEECH,THEAPPLICATIONOFNONFINITEVERBSANDTHEOMISSIONOFSOMEVERBSTODEALWITHTHEREDUNDANTVERBSINCHINESESENTENCESONTHESYNTACTICLEVELTHETRANSLATIONOFAUNIQUEPARERNSENTENCEINCHINESELANGUAGETHATWITHOUTASUBJECTISDISCUSSEDINENGLISH,ASENTENCEMUSTHAVEACLEARSUBJECTEXCEPTFORTHEIMPERATIVESENTENCEASARESULT,THETRANSLATOROFTENNEEDSTOFIILOUTTHESUBJECTORMAKETHECONVERSIONOFSENTENCESTRUCTURESINTHECETRANSLATIONINADDITION,CHINESEMAINLYRELIESONPARATAXISANDENGLISHGREATLYONHYPOTAXISDURINGTHECETRANSLATION,THETRANSLATORNEEDSTOADOPTTRANSLATIONSKILLSSUCHASFOLLOWINGTHEORIGINALSYNTACTICORDERANDADJUSTINGTHEORIGINALSYNTACTICORDERTHEREFORETHEPARATACTICCHINESESENTENCECANBECHANGEDINTOTHEHYPOTACTICENGLISHONEALLOFTHESETRANSLATIONSKILLSAREADOPTEDTOMAKETHETRANSLATIONACCEPTBYTHEREADERSOFENGLISHKEYWORDSCHINESELEGALDOCUMENTSTRANSLATION;LANGUAGEDIFFERENCE;TRANSLATIONTECHNIQUESII
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁數(shù): 88
      8人已閱讀
      ( 4 星級(jí))
    • 簡介:隨著全球數(shù)字化、網(wǎng)絡(luò)化的發(fā)展,蒙古文網(wǎng)絡(luò)資源也越來越豐富。然而,蒙古文網(wǎng)絡(luò)資源中存在編碼不統(tǒng)一,無法實(shí)現(xiàn)共享等問題,不僅嚴(yán)重阻礙了蒙古文互聯(lián)網(wǎng)的發(fā)展,更是對(duì)蒙古文搜索引擎技術(shù)帶來了挑戰(zhàn)。現(xiàn)有的蒙古文互聯(lián)網(wǎng)搜索引擎還有許多缺陷,同時(shí)由于蒙古文網(wǎng)站數(shù)量不多,內(nèi)容單一、更新速度緩慢,致使檢索到的有用信息有限。因而蒙古族網(wǎng)絡(luò)用戶查找資源時(shí)往往選擇其他搜索引擎來查找中文或英文的網(wǎng)站來獲取信息。但在蒙古族網(wǎng)絡(luò)用戶構(gòu)造檢索提問式時(shí),受到語言之間差異的影響,很難準(zhǔn)確用外語表達(dá)自己的需求,從而增加了信息獲取的難度。為適應(yīng)蒙古文互聯(lián)網(wǎng)發(fā)展現(xiàn)狀,迫切需要建立一個(gè)蒙漢跨語言信息檢索系統(tǒng)。蒙漢跨語言信息檢索系統(tǒng)能夠擴(kuò)大信息搜索范圍,快速獲取網(wǎng)上信息,同時(shí)也能夠很好地緩解民族地區(qū)群眾上網(wǎng)語言障礙,對(duì)促進(jìn)地區(qū)科教文化事業(yè)的發(fā)展將起到積極作用。在實(shí)現(xiàn)蒙漢跨語言信息檢索時(shí),可以采用基于機(jī)器翻譯系統(tǒng)的方法、基于語料庫的方法及基于字典的方法,而它們存在著共同缺陷,即在查詢轉(zhuǎn)換過程中,只是淺層地進(jìn)行字符集的轉(zhuǎn)換和匹配,未能達(dá)到語義層面上的翻譯。為將蒙漢跨語言信息檢索提升到語義層面上的翻譯檢索,亟待需要一個(gè)支持蒙漢跨語言信息檢索的語義資源。本文的重點(diǎn)是構(gòu)建面向跨語言信息檢索的蒙漢語義詞典框架,主要通過以下幾個(gè)方面的工作來完成。1首先以跨語言信息檢索為切入點(diǎn),研究分析了跨語言信息檢索的相關(guān)理論方法。2研究本體技術(shù)及其在跨語言信息檢索中的應(yīng)用,為構(gòu)建面向跨語言信息檢索的蒙漢語義詞典提供理論基礎(chǔ)。3采用多語言本體技術(shù)構(gòu)建面向跨語言信息檢索的蒙漢語義詞典。該方案中充分考慮了語義詞典的概念及概念之間關(guān)系的表達(dá),并進(jìn)一步對(duì)同義術(shù)語語義關(guān)系的表達(dá),概念語義相似度的計(jì)算及其在跨語言信息檢索中的應(yīng)用進(jìn)行了深入的剖析和研究。最后以計(jì)算機(jī)應(yīng)用技術(shù)分支的概念作為領(lǐng)域?qū)ο笕胧?,?gòu)建了一個(gè)實(shí)驗(yàn)性的計(jì)算機(jī)術(shù)語蒙漢語義詞典。4設(shè)計(jì)并給出了一種基于概念的蒙漢語義詞典的查詢方法,將查詢提升到概念層面,進(jìn)行語義查詢,返回與查詢結(jié)果具有語義關(guān)聯(lián)(同義、上位、下位等)的相關(guān)概念及對(duì)應(yīng)蒙漢術(shù)語。本文的工作,不僅豐富了語義詞典的構(gòu)建方法,同時(shí)為蒙漢跨語言信息檢索提供了基礎(chǔ)資源,對(duì)蒙古文語言資源建設(shè)有促進(jìn)作用。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁數(shù): 72
      4人已閱讀
      ( 4 星級(jí))
    • 簡介:對(duì)數(shù)據(jù)庫進(jìn)行查詢是用戶獲取信息的主要途徑之一但直接的查詢操作要求具備一定的專業(yè)技能普通用戶很難靈活地從數(shù)據(jù)庫中獲取需要的信息?;趯?shí)體的通用可交互數(shù)據(jù)庫漢語問句查詢接口實(shí)現(xiàn)自然的漢語問句到標(biāo)準(zhǔn)數(shù)據(jù)庫查詢語句之間的轉(zhuǎn)化使得用戶可以采用靈活的漢語問句進(jìn)行數(shù)據(jù)庫查詢操作由此可大為簡化用戶的查詢過程降低用戶從數(shù)據(jù)庫查找信息的難度。鑒于此對(duì)基于實(shí)體的通用可交互數(shù)據(jù)庫漢語問句查詢接口的研究具有重要的價(jià)值。作為中文問答系統(tǒng)的一個(gè)部分基于實(shí)體的通用可交互數(shù)據(jù)庫漢語問句查詢接口涉及分詞、詞法分析、句法分析、語義理解等自然語言處理技術(shù)。而自然語言是人類智能最復(fù)雜的表現(xiàn)之一很難實(shí)現(xiàn)高準(zhǔn)確率的機(jī)器理解。受限于自然語言理解技術(shù)的發(fā)展水平基于實(shí)體的通用可交互數(shù)據(jù)庫漢語問句查詢接口的實(shí)現(xiàn)是一個(gè)困難的任務(wù)。本文設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于實(shí)體的通用可交互數(shù)據(jù)庫漢語問句查詢接口希望通過基于實(shí)體的設(shè)計(jì)來減少對(duì)自然語言理解技術(shù)的依賴通過加入與用戶的交互來提高漢語問句查詢的準(zhǔn)確率通過實(shí)體信息庫的設(shè)計(jì)來簡化接口的復(fù)雜度從而具有較好的可移植性。本文介紹了基于實(shí)體的通用可交互數(shù)據(jù)庫漢語問句查詢接口的概念給出了本課題的研究背景和研究現(xiàn)狀。在對(duì)已有技術(shù)的研究和總結(jié)的基礎(chǔ)上設(shè)計(jì)了一個(gè)基于實(shí)體的通用可交互數(shù)據(jù)庫漢語問句查詢接口。在設(shè)計(jì)上遵守高內(nèi)聚和低耦合的接口設(shè)計(jì)原則較好地保證了接口設(shè)計(jì)的可移植性。該接口主要包括實(shí)體信息庫設(shè)計(jì)和漢語查詢語句到標(biāo)準(zhǔn)數(shù)據(jù)庫查詢語句的轉(zhuǎn)化以及用戶引導(dǎo)功能。在實(shí)體信息庫的構(gòu)造上通過簡化信息庫的組成部分在保存了領(lǐng)域相關(guān)的實(shí)體信息的前提下也保證了系統(tǒng)的領(lǐng)域移植的可能性并降低了系統(tǒng)領(lǐng)域移植的難度。實(shí)現(xiàn)了實(shí)體信息庫的圖形界面操作工具可以利用該工具實(shí)現(xiàn)領(lǐng)域的移植和信息庫的信息更改。漢語查詢語句到標(biāo)準(zhǔn)數(shù)據(jù)庫查詢語句的轉(zhuǎn)化作為整個(gè)接口的核心通過基于實(shí)體的設(shè)計(jì)減少了轉(zhuǎn)化過程中對(duì)自然語言理解技術(shù)的依賴同時(shí)保證了轉(zhuǎn)化過程的準(zhǔn)確性。而用戶引導(dǎo)功能的實(shí)現(xiàn)使用戶可以動(dòng)態(tài)地更改漢語查詢語句的轉(zhuǎn)化過程。接口是的可交互的且可以經(jīng)引導(dǎo)得到更準(zhǔn)確的查詢結(jié)果。漢語查詢語句到標(biāo)準(zhǔn)數(shù)據(jù)庫查詢語句的轉(zhuǎn)化過程分為詞法分析、實(shí)體語義標(biāo)注、信息領(lǐng)域圖生成、信息領(lǐng)域圖轉(zhuǎn)化成標(biāo)準(zhǔn)數(shù)據(jù)庫查詢語句等幾個(gè)相對(duì)獨(dú)立的部分。1詞法分析部分使用了基于統(tǒng)計(jì)的分詞方法?;诮y(tǒng)計(jì)的分詞方法是當(dāng)前比較成熟準(zhǔn)確率比較高的分詞方法。2對(duì)分詞和詞性標(biāo)注后的句子通過查找實(shí)體信息庫賦予該句子中的詞對(duì)應(yīng)的實(shí)體語義。對(duì)具有多個(gè)實(shí)體語義的詞通過不相關(guān)領(lǐng)域消除法用戶交互選擇法等進(jìn)行消歧。3通過句子對(duì)應(yīng)的查詢領(lǐng)域生成對(duì)應(yīng)的信息領(lǐng)域圖并將句子中的各個(gè)語義節(jié)點(diǎn)定位到信息領(lǐng)域圖中最終實(shí)現(xiàn)從句子到信息領(lǐng)域圖的轉(zhuǎn)化。4按照設(shè)計(jì)的規(guī)則和算法實(shí)現(xiàn)從信息領(lǐng)域圖到標(biāo)準(zhǔn)數(shù)據(jù)庫查詢語句的轉(zhuǎn)換。最后基于上述接口構(gòu)建了一個(gè)實(shí)驗(yàn)性的查詢系統(tǒng)。該系統(tǒng)覆蓋了兩個(gè)不同的領(lǐng)域用于驗(yàn)證本文實(shí)現(xiàn)的基于實(shí)體的通用可交互數(shù)據(jù)庫漢語問句查詢接口的可行性。實(shí)驗(yàn)表明該系統(tǒng)能夠基本有效地處理各種常見形式的查詢語句具有良好的可用性和可移植性。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁數(shù): 92
      4人已閱讀
      ( 4 星級(jí))
    • 簡介:近些年來,隨著中國經(jīng)濟(jì)的快速發(fā)展和中國國際地位的不斷提高,中國與世界的交往和聯(lián)系日趨廣泛和深入。漢語是中華文化的主要載體,也是世界各國了解中國的重要工具,不少國家出現(xiàn)了學(xué)習(xí)漢語的熱潮。但是在全球漢語學(xué)習(xí)迅速升溫的同時(shí)也帶來了一些問題,如漢語教學(xué)資源不足和傳統(tǒng)教學(xué)方式不能有效地激發(fā)學(xué)生學(xué)習(xí)漢語的興趣等。而寓教于樂的學(xué)習(xí)形式能夠很好地解決這些問題。自2004年在美國首先提出了這個(gè)概念后,它已經(jīng)在眾多領(lǐng)域取得了豐碩的成果,但目前只有少數(shù)的研究者致力于外國漢語學(xué)習(xí)者的寓教于樂教學(xué)研究。針對(duì)現(xiàn)在對(duì)外漢語教學(xué)中出現(xiàn)的問題,我們提出了一種基于語音接口的漢語學(xué)習(xí)寓教于樂系統(tǒng),以方便學(xué)生自我學(xué)習(xí)并提高漢語學(xué)習(xí)的興趣。本論文的主要工作如下(1)利用HTK平臺(tái)建立了一個(gè)非特定人孤立詞語音識(shí)別系統(tǒng),并從混合高斯模型、語言模型和基頻參數(shù)等方面對(duì)該系統(tǒng)進(jìn)行改進(jìn),最終把系統(tǒng)的識(shí)別率提高到98%以上,基本滿足了實(shí)際的使用要求。(2)改進(jìn)了HTK的識(shí)別器HVITE,使它能夠輸出字詞和聲韻母兩個(gè)層次的識(shí)別結(jié)果信息和發(fā)音評(píng)測結(jié)果,為寓教于樂系統(tǒng)的語音接口做好后臺(tái)處理準(zhǔn)備。(3)提出了一種新的基于HMM的對(duì)數(shù)似然值與聲韻母層時(shí)長信息相結(jié)合的發(fā)音評(píng)測方法。本評(píng)分方法對(duì)專家評(píng)分的相關(guān)度高于基于HMM的后驗(yàn)概率的方法。通過求解非線性回歸模型和模型參數(shù)優(yōu)化,建立兩個(gè)統(tǒng)一的聲韻母對(duì)數(shù)似然值的映射模型;并將最終的評(píng)分及映射模型嵌入HTK的識(shí)別器HVITE中。(4)利用VIRTOOLS軟件平臺(tái),設(shè)計(jì)并實(shí)現(xiàn)漢語發(fā)音練習(xí)的寓教于樂系統(tǒng)。本系統(tǒng)主要包括建立虛擬現(xiàn)實(shí)場景和各個(gè)角色模型及其相關(guān)的動(dòng)作,并且將實(shí)驗(yàn)室三維重建的成果成功的應(yīng)用到系統(tǒng)中;利用VIRTOOLS中的SDK開發(fā)包,在VCH60平臺(tái)上開發(fā)適用于本系統(tǒng)的語音識(shí)別與評(píng)測接口,使本系統(tǒng)實(shí)現(xiàn)糾正學(xué)生聲韻母層漢語發(fā)音的功能。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁數(shù): 100
      7人已閱讀
      ( 4 星級(jí))
    • 簡介:山東農(nóng)業(yè)大學(xué)碩士學(xué)位論文英漢語義表達(dá)之語言意象手段的對(duì)比研究從認(rèn)知語言學(xué)的角度姓名張現(xiàn)榮申請(qǐng)學(xué)位級(jí)別碩士專業(yè)外國語言學(xué)及應(yīng)用語言學(xué)指導(dǎo)教師李志嶺20080510山東農(nóng)業(yè)人學(xué)碩J學(xué)位論義總之,本文受索緒爾符號(hào)理論中“音響意象”概念的啟發(fā),提出了“語言意象’’這一新術(shù)語。還創(chuàng)造性地嘗試從認(rèn)知的角度對(duì)漢英語的語義表達(dá)的語言意象標(biāo)示手段進(jìn)行了共時(shí)與歷時(shí)的對(duì)比研究。結(jié)果表明語言意象在漢英語語義表達(dá)過程中起著至關(guān)重要的作用;基于語言本身特征的差異,語言意象在英語中的使用比漢語更廣泛;并且,漢語為了滿足發(fā)展的需要也傾向于發(fā)展自身的語言意象系統(tǒng)。了解漢英語在表達(dá)方式上所表現(xiàn)出來的差異,以及漢英語自身語言文字的獨(dú)特特征,對(duì)英語教學(xué)及學(xué)習(xí)具有指導(dǎo)意義;也會(huì)培養(yǎng)學(xué)生學(xué)習(xí)英語的熱情。關(guān)鍵詞文學(xué)意象;語言意象;意象;符號(hào);概念;相似性;差異性
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁數(shù): 92
      11人已閱讀
      ( 4 星級(jí))
    • 簡介:隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,語音合成技術(shù)也得到快速的發(fā)展并逐步滲透到社會(huì)生活的各個(gè)領(lǐng)域。但現(xiàn)階段漢語語音合成中還存在一些問題,主要體現(xiàn)在輸出語音的可懂度和自然度上。本文在對(duì)漢語韻律結(jié)構(gòu)層級(jí)、聲學(xué)特性以及目前最常用的幾種漢語韻律短語預(yù)測機(jī)器學(xué)習(xí)方法調(diào)研的基礎(chǔ)上,提出了一種基于支持向量機(jī)和隱馬爾科夫混合模型(SUPPTVECTMACHINEHIDDENMARKOVMODEL,SVMHMM)的韻律短語邊界預(yù)測方法;與此同時(shí),為了進(jìn)一步提高漢語韻律短語邊界的準(zhǔn)確度,本文還引入了一種基于糾錯(cuò)反饋驅(qū)動(dòng)的學(xué)習(xí)方法來作為SVMHMM模型的后處理方法,并實(shí)現(xiàn)了一個(gè)全自動(dòng)的漢語韻律短語邊界預(yù)測及標(biāo)注系統(tǒng)?,F(xiàn)階段,在漢語韻律短語邊界預(yù)測任務(wù)中廣泛應(yīng)用的統(tǒng)計(jì)模型為隱馬爾科夫模型、最大熵馬爾科夫模型以及條件隨機(jī)場模型。其中最為成功的統(tǒng)計(jì)模型為條件隨機(jī)場模型。本文所采用的SVMHMM模型結(jié)合了支持向量機(jī)模型和隱馬爾科夫模型各自的優(yōu)點(diǎn),同時(shí)克服了隱馬爾科夫模型中的嚴(yán)格獨(dú)立假設(shè)和難以引入任意特征等問題。和傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比,該模型僅用有限的訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練就能夠取得較好的預(yù)測效果。當(dāng)前,SVMHMM模型已經(jīng)被應(yīng)用在一些自然語言處理問題中,如詞性標(biāo)注,漢語切分等。本文首次將支持向量機(jī)和隱馬爾科夫的混合模型應(yīng)用在漢語韻律短語邊界預(yù)測任務(wù)中,并通過實(shí)驗(yàn)表明,在使用相同特征模板的情況下,SVMHMM模型稍優(yōu)于條件隨機(jī)場,和最大熵馬爾科夫相比更適合于漢語韻律短語的預(yù)測。通過對(duì)SVMHMM模型在漢語韻律短語預(yù)測實(shí)驗(yàn)結(jié)果的分析可知,單純利用SVMHMM模型的方法來預(yù)測韻律短語邊界信息會(huì)帶來一些很明顯的錯(cuò)誤。而這種錯(cuò)誤的結(jié)果是由于系統(tǒng)在訓(xùn)練學(xué)習(xí)時(shí)的一些固定模式所導(dǎo)致的結(jié)果,因此為了進(jìn)一步提高韻律短語邊界預(yù)測的準(zhǔn)確度,本文提出了一種基于糾錯(cuò)反饋驅(qū)動(dòng)的學(xué)習(xí)方法TRANSFMATIONBASEEDERRDRIVENLEARNINGMETHOD,TBL來對(duì)SVMHMM標(biāo)注模塊所標(biāo)注結(jié)果的錯(cuò)誤部分進(jìn)行了后處理,取得了很好的效果。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁數(shù): 64
      6人已閱讀
      ( 4 星級(jí))
    • 簡介:隨著信息技術(shù)的飛速發(fā)展,人類社會(huì)的信息量曾爆炸式增長,如何進(jìn)行漢語信息的有效交互,并且在層出不窮的信息資源里準(zhǔn)確、快捷地獲取所需信息成為信息檢索平臺(tái)的重點(diǎn)問題。在信息檢索方面,國內(nèi)外研究機(jī)構(gòu)和企業(yè)展開了大量的研究工作,有效地促進(jìn)了信息檢索技術(shù)的發(fā)展。從漢語信息交互與檢索的角度來看,信息檢索技術(shù)仍然存在的不足包括沒有充分考慮漢語邏輯交互的特點(diǎn);不支持復(fù)雜邏輯和邏輯組合,且還沒有擴(kuò)展到搜索引擎上;沒有提供一個(gè)開放的信息檢索統(tǒng)一訪問接口等。在漢語信息的表達(dá)方式上,提出了支持基于聲母的漢語信息檢索,用戶在檢索漢語信息時(shí),不用輸入完整的漢語詞語,可以用漢語詞語的聲母來替換對(duì)應(yīng)漢語的輸入,簡化了用戶檢索漢語信息的表達(dá),如全拼輸入“中國”一詞需要鍵入“ZHONGGUO”,以聲母輸入只需要鍵入“ZG”,就鍵盤輸入效率而言,基于聲母的漢語信息輸入平均效率可以提高三倍左右。在信息識(shí)別的靈活性和智能化方面,提出了漢語聲母復(fù)雜邏輯組合的查詢方式,支持否定邏輯、通配符等。系統(tǒng)同時(shí)支持多音字查詢方式和方言特征查詢。通過定義信息源訪問統(tǒng)一接口,使信息識(shí)別過程與數(shù)據(jù)源相分離,從而可以實(shí)現(xiàn)與不同系統(tǒng)的信息檢索過程集成,研究成果可廣泛應(yīng)用于中文信息檢索系統(tǒng)或搜索引擎中,如信息系統(tǒng)漢語信息查詢、電信服務(wù)查詢、圖書館信息檢索、醫(yī)療信息檢索等?;谏鲜鲅芯抗ぷ?,實(shí)現(xiàn)了一個(gè)漢語信息檢索的原型系統(tǒng),在音樂系統(tǒng)的歌手和歌曲查詢上,它能夠通過漢語聲母、聲母邏輯組合、多音和方言音等模式來查詢歌手和歌曲,通過系統(tǒng)測試,能夠快速地按照使用者的意圖來搜索漢語信息,與現(xiàn)有的音樂網(wǎng)站的信息檢索過程相比,具有交互簡單、整體查詢效率高的特點(diǎn)。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 45
      5人已閱讀
      ( 4 星級(jí))
    • 簡介:北京交通大學(xué)邛68S碩士學(xué)位論文學(xué)習(xí)者漢語閱讀策略對(duì)英語閱讀策略的影響研究ASTUDYONTHEINFLUENCEOFCHINESEREADINGSTRATEGIESONENGLISHREADINGSTRATEGIES一一作者導(dǎo)師徐奕劉偉北京交通大學(xué)2010年6月中圖分類號(hào)學(xué)校代碼UDC密級(jí)北京交通大學(xué)碩士學(xué)位論文學(xué)習(xí)者漢語閱讀策略對(duì)英語閱讀策略的影響研究ASTUDYONTHEINFLUENCEOFCHINESEREADINGSTRATEGIESONENGLISHREADINGSTRATEGIES作者姓名導(dǎo)師姓名學(xué)位類別學(xué)科專業(yè)徐奕劉偉文學(xué)外國語言學(xué)及應(yīng)用語言學(xué)北京交通大學(xué)2010年6月學(xué)號(hào)08122349職稱教授學(xué)位級(jí)別碩士研究方向外語教學(xué)
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁數(shù): 66
      4人已閱讀
      ( 4 星級(jí))
    • 簡介:近年來隨著網(wǎng)絡(luò)的發(fā)展現(xiàn)代人對(duì)信息溝通和處理的需求越來越迫切這使得自然語言處理以及相關(guān)的應(yīng)用領(lǐng)域得到了迅速的發(fā)展。而由于句法分析在自然語言處理研究中的關(guān)鍵地位及其在各種應(yīng)用上的光明前景本文對(duì)漢語的句法分析進(jìn)行了深入的探討和研究并且由于重排序方法在提高句法分析性能上的有效性因此本文把對(duì)重排序方法的研究作為本文的主要研究內(nèi)容。具體的工作如下首先本文對(duì)當(dāng)前主流的句法分析模型進(jìn)行了介紹并且在賓州中文樹庫CTB50上進(jìn)行了實(shí)驗(yàn)測試比較了不同句法分析模型的性能。根據(jù)對(duì)實(shí)驗(yàn)結(jié)果的分析本文探討了不同構(gòu)建模型的方法以及不同模型對(duì)句法分析的影響而這些影響主要體現(xiàn)在對(duì)信息的融合對(duì)訓(xùn)練語料的要求以及對(duì)最終句法分析的性能和效率上。其次本文應(yīng)用了不同的句法分析模型作為初始模型來進(jìn)行句法分析的重排序?qū)嶒?yàn)其中初始模型分別采用了概率上下文無關(guān)文法PCFG模型STANFD1模型以及BERKELEY模型而對(duì)于影響重排序性能的兩個(gè)重要因素特征表示和參數(shù)訓(xùn)練本文進(jìn)行了如下的設(shè)置特征表示方面本文主要參考了COLLINS在他的文章中給出的特征集并進(jìn)行了稍微的改動(dòng)而參數(shù)訓(xùn)練方面則采用了最大熵方法作為訓(xùn)練方法。另外本文進(jìn)一步探討了不同類型特征對(duì)實(shí)驗(yàn)結(jié)果的影響分析結(jié)果表明重排序模型中的特征選擇應(yīng)考慮初始模型的影響。最后在對(duì)傳統(tǒng)重排序方法研究的基礎(chǔ)上本文發(fā)現(xiàn)現(xiàn)有的重排序方法對(duì)于NBEST候選樹中所蘊(yùn)含的信息并沒有充分利用因此針對(duì)性地進(jìn)行了改進(jìn)并通過相應(yīng)實(shí)驗(yàn)進(jìn)行了驗(yàn)證。具體的說在傳統(tǒng)的重排序方法中常常將重排序映射為一個(gè)分類問題而指導(dǎo)訓(xùn)練分類參數(shù)的代價(jià)函數(shù)常常設(shè)置為使NBEST候選句法分析樹中的排名第一的句法分析樹和其他句法分析樹之間的邊界距離MARGIN最大。但是本文發(fā)現(xiàn)在實(shí)際情況中句法分析樹之間的順序是根據(jù)該句法樹與標(biāo)準(zhǔn)樹的相似度值來排序的也就是說不同的句法分析樹之間沒有“質(zhì)”的差異只有“量”的差異而在傳統(tǒng)的方法中卻常常忽視這一信息。針對(duì)此問題本文提出了兩種改進(jìn)模型基于相對(duì)距離的分割模型和基于多類融合的模型。并且利用這兩種模型在PCFG模型作為初始模型的基礎(chǔ)上進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明改進(jìn)模型使得句法分析的性能有了進(jìn)一步的提高在用PCFG作為初始模型的基礎(chǔ)上改進(jìn)模型比傳統(tǒng)的重排序技術(shù)又提高了09個(gè)百分點(diǎn)左右。另外本文實(shí)現(xiàn)了一個(gè)多種顯示模式的句法分析樹可視化系統(tǒng)該系統(tǒng)提供了三種主要的顯示模式來對(duì)句法分析樹進(jìn)行展示分別是“短語模式”“依存模式”“骨架模式”。除了對(duì)句法分析樹給出不同結(jié)構(gòu)的顯示外該系統(tǒng)還可以為重排序中的特征選擇提供相應(yīng)的幫助。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁數(shù): 71
      10人已閱讀
      ( 4 星級(jí))
    • 簡介:中文信息處理的研究一般分為三個(gè)階段字的處理,詞的處理以及句和篇章的處理?,F(xiàn)今我國已經(jīng)在字的處理,以及詞的處理方面取得了很多的研究成果,并得到了很好的實(shí)用。例如漢語分詞的研究已經(jīng)獲得了廣泛的應(yīng)用。漢語復(fù)句的研究卻一直進(jìn)展艱難,而復(fù)句中的關(guān)系詞對(duì)漢語復(fù)句的研究起著關(guān)鍵的作用。在基于規(guī)則的復(fù)句關(guān)系詞自動(dòng)標(biāo)識(shí)的研究中,規(guī)則是研究的核心,決定著自動(dòng)識(shí)別系統(tǒng)的實(shí)用性、準(zhǔn)確性。本文在復(fù)句關(guān)系詞特征研究的基礎(chǔ)上,研究了規(guī)則的表示方法、以及規(guī)則自動(dòng)生成器,根據(jù)人工挖掘的規(guī)則探討了規(guī)則自動(dòng)挖掘的方法。由于中文復(fù)句信息的特殊性和復(fù)雜性,本文首先對(duì)大量的復(fù)句語料進(jìn)行了研究和分析,總結(jié)出了復(fù)句中的信息特征,然后將這些特征利用統(tǒng)一的符號(hào)進(jìn)行形式化,使得計(jì)算機(jī)能夠理解這些復(fù)句規(guī)則的信息。根據(jù)這些復(fù)句規(guī)則的特點(diǎn),將這些規(guī)則分類入庫。其次,在規(guī)則庫不斷的完善和擴(kuò)充時(shí),對(duì)每一條入庫的規(guī)則在入庫之前進(jìn)行規(guī)則沖突的檢測和處理。通過沖突的檢測和處理使規(guī)則庫中的規(guī)則保持一致性,避免重復(fù)的、矛盾的規(guī)則入庫,同時(shí)保證包含沖突的規(guī)則在入庫之前得到處理,避免規(guī)則引擎調(diào)用的時(shí)候出現(xiàn)混亂。本文通過對(duì)人工挖掘的1029條規(guī)則進(jìn)行入庫檢測,根據(jù)其檢測的結(jié)果和人工的確認(rèn),發(fā)現(xiàn)規(guī)則沖突檢測的方法是可行有效的。針對(duì)人工挖掘規(guī)則的各種不便和可能的錯(cuò)誤,在規(guī)則形式化和人工挖掘規(guī)則的研究工作的基礎(chǔ)之上,本文探討了一種基于頻繁項(xiàng)集的漢語復(fù)句關(guān)系詞關(guān)聯(lián)規(guī)則挖掘算法。通過自動(dòng)的進(jìn)行大量的復(fù)句語料篩選、復(fù)句特征分析和規(guī)則庫中規(guī)則的匹配,可以將人們從繁重的人工挖掘的過程中解脫出來。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁數(shù): 63
      17人已閱讀
      ( 4 星級(jí))
    關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服客服 - 聯(lián)系我們

    機(jī)械圖紙?jiān)创a,實(shí)習(xí)報(bào)告等文檔下載

    備案號(hào):浙ICP備20018660號(hào)