眾賞文庫(kù)
全部分類
  • 抗擊疫情 >
    抗擊疫情
    病毒認(rèn)知 防護(hù)手冊(cè) 復(fù)工復(fù)產(chǎn) 應(yīng)急預(yù)案 防控方案 英雄事跡 院務(wù)工作
  • 成品畢設(shè) >
    成品畢設(shè)
    外文翻譯 畢業(yè)設(shè)計(jì) 畢業(yè)論文 開題報(bào)告 文獻(xiàn)綜述 任務(wù)書 課程設(shè)計(jì) 相關(guān)資料 大學(xué)生活 期刊論文 實(shí)習(xí)報(bào)告
  • 項(xiàng)目策劃 >
    項(xiàng)目策劃
    土地準(zhǔn)備 規(guī)劃設(shè)計(jì) 開工開盤 項(xiàng)目綜合 竣工移交 售后移交 智慧方案 安全專項(xiàng) 環(huán)境影響評(píng)估報(bào)告 可行性研究報(bào)告 項(xiàng)目建議書 商業(yè)計(jì)劃書 危害評(píng)估防治 招投標(biāo)文件
  • 專業(yè)資料 >
    專業(yè)資料
    人文法律 環(huán)境安全 食品科學(xué) 基礎(chǔ)建設(shè) 能源化工 農(nóng)林牧畜 綜合待分類 教育經(jīng)驗(yàn) 行政人力 企業(yè)管理 醫(yī)學(xué)衛(wèi)生 IT技術(shù) 土木建筑 考研專題 財(cái)會(huì)稅務(wù) 公路隧道 紡織服裝
  • 共享辦公 >
    共享辦公
    總結(jié)匯報(bào) 調(diào)研報(bào)告 工作計(jì)劃 述職報(bào)告 講話發(fā)言 心得體會(huì) 思想?yún)R報(bào) 事務(wù)文書 合同協(xié)議 活動(dòng)策劃 代理加盟 技術(shù)服務(wù) 求職簡(jiǎn)歷 辦公軟件 ppt模板 表格模板 融資協(xié)議 發(fā)言演講 黨團(tuán)工作 民主生活
  • 學(xué)術(shù)文檔 >
    學(xué)術(shù)文檔
    自然科學(xué) 生物科學(xué) 天文科學(xué) 醫(yī)學(xué)衛(wèi)生 工業(yè)技術(shù) 航空、航天 環(huán)境科學(xué)、安全科學(xué) 軍事 政學(xué) 文化、科學(xué)、教育、 交通運(yùn)輸 經(jīng)濟(jì) 語(yǔ)言、文字 文學(xué) 農(nóng)業(yè)科學(xué) 社會(huì)科學(xué)總論 藝術(shù) 歷史、地理 哲學(xué) 數(shù)理科學(xué)和化學(xué) 綜合性圖書 哲學(xué)宗教
  • 經(jīng)營(yíng)營(yíng)銷 >
    經(jīng)營(yíng)營(yíng)銷
    綜合文檔 經(jīng)濟(jì)財(cái)稅 人力資源 運(yùn)營(yíng)管理 企業(yè)管理 內(nèi)控風(fēng)控 地產(chǎn)策劃
  • 教學(xué)課件 >
    教學(xué)課件
    幼兒教育 小學(xué)教育 初中教育 高中教育 職業(yè)教育 成人教育 高等教育 考研資源 試題真題 作業(yè)習(xí)題 課后答案 綜合教學(xué)
  • 土木建筑 >
    土木建筑
    專項(xiàng)施工 應(yīng)急預(yù)案 建筑規(guī)范 工藝方案 技術(shù)交底 施工表格 圖片圖集
  • 課程導(dǎo)學(xué) >
    課程導(dǎo)學(xué)
    醫(yī)學(xué)綜合 中醫(yī)養(yǎng)生 醫(yī)學(xué)研究 身心發(fā)展 醫(yī)學(xué)試題 影像醫(yī)學(xué) 醫(yī)院辦公 外科醫(yī)學(xué) 老年醫(yī)學(xué) 內(nèi)科醫(yī)學(xué) 婦產(chǎn)科 神經(jīng)科 醫(yī)學(xué)課件 眼鼻喉科 皮膚病科 腫瘤科 兒科醫(yī)學(xué) 康復(fù)醫(yī)學(xué) 全科醫(yī)學(xué) 護(hù)理學(xué)科 針灸學(xué)科 重癥學(xué)科 病毒學(xué)科 獸醫(yī) 藥學(xué)
  • 漢語(yǔ) (共10000 份)
  • 用時(shí):23ms
    資源分類:
    全部 抗擊疫情 成品畢設(shè) 項(xiàng)目策劃 專業(yè)資料 共享辦公 學(xué)術(shù)文檔 經(jīng)營(yíng)營(yíng)銷 教學(xué)課件 土木建筑 課程導(dǎo)學(xué)
    二級(jí)分類:
    全部 自然科學(xué) 生物科學(xué) 天文科學(xué) 醫(yī)學(xué)衛(wèi)生 工業(yè)技術(shù) 航空、航天 環(huán)境科學(xué)、安全科學(xué) 軍事 政學(xué) 文化、科學(xué)、教育、體育 交通運(yùn)輸 經(jīng)濟(jì) 語(yǔ)言、文字 文學(xué) 農(nóng)業(yè)科學(xué) 社會(huì)科學(xué)總論 藝術(shù) 歷史、地理 哲學(xué) 數(shù)理科學(xué)和化學(xué) 綜合性圖書 哲學(xué)宗教
    三級(jí)分類:
    全部 政學(xué) 環(huán)境科學(xué)、安全科學(xué) 經(jīng)濟(jì) 數(shù)理科學(xué)和化學(xué) 自然科學(xué)總論 航空、航天 軍事 哲學(xué) 生物科學(xué) 工業(yè)技術(shù) 歷史、地理 文化、科學(xué)、教育、體育 醫(yī)學(xué)、衛(wèi)生 交通運(yùn)輸 語(yǔ)言、文字 天文學(xué)、地球科學(xué) 藝術(shù) 農(nóng)業(yè)科學(xué) 哲學(xué)、宗教 文學(xué) 社會(huì)科學(xué)總論
    四級(jí)分類:
    全部 語(yǔ)言學(xué) 常用外國(guó)語(yǔ) 漢語(yǔ) 中國(guó)少數(shù)民族語(yǔ)言 漢藏語(yǔ)系
    上傳類型:
    全部 互聯(lián)網(wǎng)共享 作者原創(chuàng) 獨(dú)家資料
    資源格式:
    不限 doc ppt pdf 圖片 flash 視頻 音頻 壓縮包
    上架時(shí)間:
    不限 三天內(nèi) 一周內(nèi) 一個(gè)月內(nèi) 一年內(nèi)
    特色搜索:
    不限 文件包巨大 瀏覽量超巨 購(gòu)買量排行 子文件超多好評(píng)如潮
    • 下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 53
      4人已閱讀
      ( 4 星級(jí))
    • 下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 26
      11人已閱讀
      ( 4 星級(jí))
    • 下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 79
      4人已閱讀
      ( 4 星級(jí))
    • 下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 74
      6人已閱讀
      ( 4 星級(jí))
    • 下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 47
      3人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:南京農(nóng)業(yè)大學(xué)碩士學(xué)位論文漢語(yǔ)商務(wù)廣告語(yǔ)偏離特征英譯策略研究姓名王海華申請(qǐng)學(xué)位級(jí)別碩士專業(yè)英語(yǔ)語(yǔ)言文學(xué)指導(dǎo)教師侯廣旭20090601ONCETRANSLATIONTECHNIQUESFORDEVIANTCHINESECOMMERCIALADVERTISINGSLOGANSABSTRACTDEVIATION,ASONEOFTHEIMPORTANTTHEORIESINSTYLISTICS,ISINHERENTLYRELATEDTOFOREGROUNDINGANDDEFAMILIARIZATION.ITISDEFINEDASTURNINGASIDEORCHANGINGFROMTHENORMS.PURPOSEFULDEVIATIONINCOPYWRITINGISTOMAKETHETEXTMOREPROMINENT,WHICHACCORDINGLYDEFAMILARIZINGTHEREADERS.THUS,THEADVERTISEMENTTEXTISMADEDEVIANTBUTIMPRESSIVE,JUSTIFYINGTHERESEARCHONEFFECTIVETECHNIQUESFORCETRANSLATIONOFDEVIANTCHINESECOMMERCIALADVERTISINGSLOGANS.TOPAINTACLEARERPICTUREFORTHEREADERS,THETHESISBEGINSWITLLANINTRODUCTIONTOTHECURRENTCONDITIONOFTRANSLATIONSERVICESONAGLOBALBASIS,INWHICH,ANEMERGINGTRANSLATIONINDUSTRYWILLBEPRESENTED、析THINSPIRINGACHIEVEMENTSBOMFROMRESEARCHERSANDTRANSLATORS.THEDATAUSEDINTHERESEARCHARELARGELYFROMTHEMATERIALSTRANSLATEDBYTHEWRITEROFTHISTHESIS,ACCOUNTINGFORAPPROXIMATELY60%.THESEDATA,EITHERCONSIDEREDSUCCESSFULONESTOEMBODYTHEADVERTISINGNATUREOREXAMINEDINTHETARGETMARKET,ORATLEASTACCEPTEDBYTHECURRENTSPONSORS,WILLBEPRESENTEDASEXAMPLESFORANALYSISANDGENERALIZEDINANATTEMPTTODEFENDTHEARGUMENTATIONTHATFOLLOWS.BEINGTHESUBJECTINTHERESEARCH,COMMERCIALADVERTISINGSLOGANSARECAREFULLYDEFINEDANDANALYZEDFROMTHEPERSPECTIVEOFSTYLISTICS,哳T11ANAIMTOASSISTTHEREADERSINBETTERUNDERSTANDINGITSNATURE.TOFAMILIARIZETHEREADERS,LITERATUREINTHISFIELDANDRELATEDONESWILLBEREVIEWED,SHOWINGTHATTRANSLATIONOFADVERTISEMENTTEXTHASRECEIVEDEXTENSIVESTUDYOVERTHEPREVIOUSTWODECADES.INADDITION,SOMEFUNDAMENTALTHOUGHTSANDTHEORIESREGARDINGTHECOPYWRITINGPRINCIPLESWILLBEAPPROACHED,ANALYZEDANDINTERNALIZEDINTHEHOPEOFPROVIDINGAGLOBALVIEWFORREADERSANDSETTINGTHETONETOTOUCHUPONTHEPRINCIPLESOFTRANSLATINGCOMMERCIALADVERTISINGSLOGANS.BASEDONTHECLASSIFICATIONOFVARIOUSCOMMERCIALADVERTISINGSLOGANSINTOFOURMAJORⅡ
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 66
      6人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:句法分析是自然語(yǔ)言處理中的關(guān)鍵性問(wèn)題之一,它主要研究詞和短語(yǔ)如何形成正確的句子,詞和短語(yǔ)在句子結(jié)構(gòu)中起什么作用以及它們之間的關(guān)系等。句法分析研究領(lǐng)域一直是以短語(yǔ)結(jié)構(gòu)方法為主流,隨著句法分析技術(shù)的發(fā)展,依存語(yǔ)法的優(yōu)越性逐漸體現(xiàn),依存句法分析也逐步得到重視。本論文主要采用決策式依存句法分析方法,針對(duì)漢語(yǔ)長(zhǎng)句的句法分析問(wèn)題展開研究工作,主要研究?jī)?nèi)容如下首先,對(duì)漢語(yǔ)句子做分割的預(yù)處理工作,通過(guò)構(gòu)建根搜索器ROOT-SEARCHER,找到每個(gè)漢語(yǔ)句子的根結(jié)點(diǎn),利用根結(jié)點(diǎn)信息將句子分割成兩個(gè)子句,然后分別分析出兩個(gè)子句的依存子結(jié)構(gòu)。利用這種分割方法,將長(zhǎng)句的分析化為對(duì)兩個(gè)短句的分析,句子的復(fù)雜度有所降低,因此,提高了句法分析的正確率,解決了長(zhǎng)句句法分析正確率較低的困難。第二,改進(jìn)了句子的分析方法,在分析方法上,采用決策式依存句法分析算法,并針對(duì)ARC-EAGER決策式依存句法分析算法所出現(xiàn)的EARLY-REDUCE問(wèn)題,對(duì)MEIXUNJIN的兩段式依存句法分析方法做了一定的改進(jìn),經(jīng)過(guò)改進(jìn)后的兩段式依存句法分析方法,能夠同時(shí)解決由動(dòng)詞和介詞所引起的EARLY-REDUCE問(wèn)題。最后,在句子的分析方向上,本論文根據(jù)分割后句子的特點(diǎn),以及漢語(yǔ)語(yǔ)言所具有的投影性特征,提出了采用向前分析和向后分析相結(jié)合的策略。相關(guān)實(shí)驗(yàn)證明,在算法執(zhí)行過(guò)程中,采用兩種分析方向相結(jié)合的方式,能夠顯著地提高依存句法分析的正確率。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 64
      9人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:基于電話的語(yǔ)音識(shí)別技術(shù)的不斷完善并迅速與傳統(tǒng)的基于電話的應(yīng)用結(jié)合。語(yǔ)音技術(shù)不但讓那些由于環(huán)境或生理限制無(wú)法使用圖形化瀏覽器的人得以訪問(wèn)WEB,也為所有的用戶提供了更為便捷的WEB訪問(wèn)功能新的語(yǔ)音技術(shù)可以創(chuàng)建出對(duì)話驅(qū)動(dòng)的應(yīng)用程序例如語(yǔ)音識(shí)別技術(shù)(ASR),語(yǔ)音合成技術(shù)TTS以及記錄和回放數(shù)字化語(yǔ)音在PC和服務(wù)器上并且與計(jì)算機(jī)電話集成(CTI)不斷融合。本文著力介紹了整合語(yǔ)音擴(kuò)展標(biāo)示語(yǔ)言(VOICEXML)、自動(dòng)語(yǔ)音識(shí)別(ASR)、文語(yǔ)轉(zhuǎn)換TTS、計(jì)算機(jī)電話集成(CTI)技術(shù)的平臺(tái)構(gòu)建及其特點(diǎn),同時(shí)舉例說(shuō)明了該平臺(tái)的一些應(yīng)用,最后展望了該平臺(tái)的一些改進(jìn)方向。相信對(duì)語(yǔ)音識(shí)別的研究、測(cè)試以及最終走向應(yīng)用是十分重要和必要的。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 46
      4人已閱讀
      ( 4 星級(jí))
    • 下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 49
      4人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:自然語(yǔ)言理解是跟計(jì)算機(jī)的誕生幾乎一同開始的。國(guó)外對(duì)自然語(yǔ)言理解的研究起步較早,而我國(guó)在這方面的研究是從80年代中期開始的。研究自然語(yǔ)言自然就離不開對(duì)動(dòng)詞的研究,在某種意義上,可以說(shuō)動(dòng)詞是句子的中心、核心、重心,別的成分都跟它掛鉤。目前我國(guó)對(duì)動(dòng)詞研究的著作很多,但這些研究基本上是面向人而不是機(jī)器的,即使象動(dòng)詞大詞典是面向機(jī)器的,但它沒(méi)有對(duì)語(yǔ)義進(jìn)行形式化的描述,這對(duì)于利用計(jì)算機(jī)來(lái)進(jìn)行自然語(yǔ)言的理解是遠(yuǎn)遠(yuǎn)不夠的。因而,對(duì)現(xiàn)代漢語(yǔ)動(dòng)詞進(jìn)行語(yǔ)義分析,并且將分析結(jié)果進(jìn)行形式化的描述是非常必要的。自然語(yǔ)言的計(jì)算模型是一種通用的漢語(yǔ)理解系統(tǒng)。這個(gè)系統(tǒng)將自然語(yǔ)言交流的過(guò)程分為三個(gè)層次語(yǔ)言形式,表層語(yǔ)義和深層語(yǔ)義;并提出了一種新的描寫漢語(yǔ)的文法語(yǔ)義結(jié)構(gòu)文法。語(yǔ)義結(jié)構(gòu)文法的規(guī)則式同時(shí)具有語(yǔ)法描寫和語(yǔ)義描寫,能把句子直接轉(zhuǎn)換為它的表層語(yǔ)義。本文采用了魯川等在動(dòng)詞大詞典中提出的漢語(yǔ)的格系統(tǒng),以1998年1月的人民日?qǐng)?bào)標(biāo)注語(yǔ)料庫(kù)為研究資料,利用遞歸的思想,統(tǒng)計(jì)了現(xiàn)代漢語(yǔ)中主要?jiǎng)釉~結(jié)構(gòu)的各語(yǔ)句模式,分析了每一模式的中心動(dòng)詞的表層語(yǔ)義,并給出了這些模式的的語(yǔ)義結(jié)構(gòu)文法的規(guī)則式。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 87
      8人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:本文首先分析了信息爆炸的現(xiàn)狀之后總結(jié)了情報(bào)檢索以及搜索引擎的發(fā)展闡述了計(jì)算語(yǔ)言學(xué)的一個(gè)重要分支自然語(yǔ)言處理的應(yīng)用價(jià)值提出了本課題的主要研究目標(biāo)明確了進(jìn)行本課題的必要性指出了開發(fā)虛擬信息系統(tǒng)的意義確定了所需完成的研究任務(wù)雖然目前國(guó)內(nèi)國(guó)際學(xué)術(shù)界對(duì)自然語(yǔ)言理解的研究比較熱門但與本課題有關(guān)的研究主要是QA系統(tǒng)和虛擬參考系統(tǒng)專門針對(duì)中文問(wèn)句分析的系統(tǒng)沒(méi)有見到尤其缺乏同時(shí)具有問(wèn)句理解、結(jié)果處理和回答問(wèn)題三種功能的具有網(wǎng)絡(luò)服務(wù)性質(zhì)的系統(tǒng)因此本文根據(jù)搜索引擎的使用現(xiàn)狀提出了虛擬信息顧問(wèn)的模型然后從現(xiàn)代漢語(yǔ)疑問(wèn)句的計(jì)算語(yǔ)言學(xué)分析入手提出了虛擬信息顧問(wèn)問(wèn)題理解子系統(tǒng)的模型之后通過(guò)理論分析、實(shí)際應(yīng)用和程序模擬三個(gè)階段的工作對(duì)虛擬信息顧問(wèn)問(wèn)題理解子系統(tǒng)進(jìn)行了深入的探索各種結(jié)果表明文中相關(guān)理論的合理性和可靠性驗(yàn)證了文中所提到的方法是切實(shí)可行的表明自然語(yǔ)言處理有著非常廣泛的應(yīng)用前景
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 58
      4人已閱讀
      ( 4 星級(jí))
    • 下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 156
      4人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:語(yǔ)塊可用于自然語(yǔ)言處理領(lǐng)域中,其中包括信息抽取、問(wèn)答系統(tǒng)、語(yǔ)句相似度的比較等應(yīng)用系統(tǒng)研究中,也可以應(yīng)用于句法分析。并在這些領(lǐng)域中發(fā)揮了重要的作用。本文主要從句法分析的角度以基于規(guī)則的方法為出發(fā)點(diǎn)來(lái)對(duì)漢語(yǔ)功能語(yǔ)塊進(jìn)行識(shí)別,這種方法根據(jù)詞性在句法分析中所起的作用來(lái)區(qū)分不同的功能語(yǔ)塊,以標(biāo)注顯示句子的結(jié)構(gòu)骨架。這種方法相比較于其它方法所選擇的特征少,識(shí)別的速度快,同時(shí)提高了對(duì)多動(dòng)詞連用結(jié)構(gòu)的識(shí)別率。此后又用決策樹的方法對(duì)漢語(yǔ)功能語(yǔ)塊進(jìn)行識(shí)別,這種方法不需要人工抽取規(guī)則,在一定程度上提高了識(shí)別率。對(duì)于漢語(yǔ)基本語(yǔ)塊,根據(jù)詞匯之間的關(guān)聯(lián)信息,語(yǔ)義關(guān)系以及句法形式來(lái)確定漢語(yǔ)基本語(yǔ)塊。對(duì)漢語(yǔ)基本語(yǔ)塊的識(shí)別,采用了規(guī)則抽取和統(tǒng)計(jì)相結(jié)合的方法,有效地提高了識(shí)別率。這種方法使?jié)h語(yǔ)基本語(yǔ)塊有很強(qiáng)的內(nèi)聚性,把句法形式與語(yǔ)義內(nèi)容關(guān)聯(lián)起來(lái),同時(shí)也考慮到了語(yǔ)義消歧,在一定程度上避免了歧義的發(fā)生,補(bǔ)充了單純依靠置信度進(jìn)行消歧的缺陷。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 44
      5人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:中國(guó)科學(xué)院計(jì)算技術(shù)研究所博士學(xué)位論文漢語(yǔ)組塊計(jì)算的若干研究姓名李素建申請(qǐng)學(xué)位級(jí)別博士專業(yè)計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師白碩200261漢語(yǔ)組塊計(jì)算的若干研究于已有的漢語(yǔ)語(yǔ)義資源同義詞詞林和知網(wǎng),引入了義原問(wèn)相似度和相關(guān)度的計(jì)算公式。I同時(shí)根據(jù)義原構(gòu)成詞語(yǔ)、詞語(yǔ)組成組塊的關(guān)系,逐步計(jì)算出詞語(yǔ)問(wèn)的相似度和相關(guān)度,最后得到組塊問(wèn)的相似度。對(duì)于英漢雙語(yǔ)組塊,本文提出了同時(shí)利用WJRDNET,得到雙語(yǔ)組塊的相似度,該相似度計(jì)算的實(shí)現(xiàn)將有利于改進(jìn)雙語(yǔ)組塊對(duì)齊的效果,乃至改進(jìn)機(jī)器翻譯系統(tǒng)的性能。本文的研究成果可以應(yīng)用到信息檢索、信息抽取、文本分類/聚類、機(jī)器翻譯等自然語(yǔ)言處理系統(tǒng)中去。、/一一、卅飛關(guān)鍵詞自然語(yǔ)言處理,語(yǔ)法分析,組塊分析,最大熵定理,有限自動(dòng)機(jī)N
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 117
      21人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:漢語(yǔ)多詞塊作為組塊體系的重要組成部分,是由兩個(gè)或兩個(gè)以上的詞語(yǔ)按照一定的關(guān)聯(lián)關(guān)系組合形成的信息描述單位。多詞塊主要包括句法信息、關(guān)系信息和序列標(biāo)記組合信息。漢語(yǔ)多詞塊識(shí)別不僅可以在一定程度上簡(jiǎn)化完全句法分析,而且有利于多詞塊信息在大規(guī)模真實(shí)任務(wù)中得到應(yīng)用。本文的任務(wù)是在給定一個(gè)已經(jīng)完成分詞和詞性標(biāo)注的句子后,自動(dòng)識(shí)別出該句子中所有的漢語(yǔ)多詞塊,從中獲得各種塊標(biāo)記信息。本文引進(jìn)條件隨機(jī)場(chǎng),它是一個(gè)用于標(biāo)記和分割數(shù)據(jù)的無(wú)向圖模型,能夠避免嚴(yán)格的獨(dú)立性假設(shè)和標(biāo)記偏置問(wèn)題,同時(shí)利用條件隨機(jī)場(chǎng)在序列標(biāo)注任務(wù)中表現(xiàn)出的良好性能,構(gòu)建了漢語(yǔ)多詞塊的自動(dòng)識(shí)別模型并對(duì)模型進(jìn)行了融合處理。主要工作如下1多詞塊自動(dòng)識(shí)別模型的構(gòu)建在漢語(yǔ)多詞塊描述體系的基礎(chǔ)上,以清華大學(xué)的“漢語(yǔ)多詞塊庫(kù)”作為語(yǔ)料來(lái)源,構(gòu)建了基于條件隨機(jī)場(chǎng)的兩個(gè)標(biāo)記標(biāo)注模型,即“句法標(biāo)記標(biāo)注模型”和“序列標(biāo)記標(biāo)注模型”。在句法標(biāo)記標(biāo)注模型中,采用IOB2邊界標(biāo)注策略,將句法標(biāo)記的標(biāo)注看作是一個(gè)序列標(biāo)注任務(wù),通過(guò)為句子的每個(gè)詞語(yǔ)賦予一個(gè)句法標(biāo)記,自動(dòng)標(biāo)注出該句子的所有多詞塊邊界標(biāo)記及其句法標(biāo)記在序列標(biāo)記標(biāo)注模型中,多詞塊中的序列標(biāo)記跟其塊內(nèi)每個(gè)詞之間存在一一對(duì)應(yīng)關(guān)系,通過(guò)對(duì)多詞塊中每個(gè)詞進(jìn)行自動(dòng)標(biāo)注,得到其對(duì)應(yīng)的序列標(biāo)記。2多詞塊自動(dòng)識(shí)別模型的融合處理針對(duì)上述兩種模型,分別設(shè)計(jì)了一系列實(shí)驗(yàn)。特征選取主要基于單個(gè)詞及其詞性、多個(gè)詞的組合及其詞性的組合、狀態(tài)轉(zhuǎn)移特征。在對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行有效融合的過(guò)程中,由多詞塊的邊界標(biāo)記和序列標(biāo)記,確定其序列標(biāo)記組合,同時(shí)使用可靠的啟發(fā)式規(guī)則集,從多詞塊的序列標(biāo)記組合中推導(dǎo)出其對(duì)應(yīng)的關(guān)系標(biāo)記,從而得到了塊的主要描述信息。本文在多詞塊自動(dòng)識(shí)別方面所作的工作,為漢語(yǔ)句法形式和語(yǔ)義內(nèi)容之間建立有機(jī)聯(lián)系做出了準(zhǔn)備。如何進(jìn)一步提高多詞塊自動(dòng)識(shí)別的性能是下一步的研究重點(diǎn)。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 54
      5人已閱讀
      ( 4 星級(jí))
    關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服客服 - 聯(lián)系我們

    機(jī)械圖紙?jiān)创a,實(shí)習(xí)報(bào)告等文檔下載

    備案號(hào):浙ICP備20018660號(hào)