精品人妻无码一区二区三区软件 ,麻豆亚洲AV成人无码久久精品,成人欧美一区二区三区视频,免费av毛片不卡无码

<tr id="z3ipr"></tr>
您現(xiàn)在的位置是:首頁(yè)小學(xué)教育論文

中小學(xué)藏語(yǔ)文問答系統(tǒng)中答案抽取算法的研究

發(fā)布時(shí)間:2019-11-16 14:02:53更新時(shí)間:2019-11-16 14:02:53 1

  摘要:該文提出了中小學(xué)藏語(yǔ)文問答系統(tǒng)中答案抽取算法,即采用了基于關(guān)鍵詞的相似度算法來抽取最佳的答案。

  關(guān)鍵詞:相似度;答案抽取

中小學(xué)藏語(yǔ)文問答系統(tǒng)

  1 概述

  目前,國(guó)內(nèi)外有很多相對(duì)成熟的英文問答系統(tǒng)和中文問答系統(tǒng),學(xué)習(xí)中英文方面的內(nèi)容很方便,但到目前為止還沒有藏語(yǔ)文問答系統(tǒng)方面的研究成果,查找藏語(yǔ)文方面的內(nèi)容必須借助書本或咨詢的方式來完成,那樣給教師的教學(xué)和學(xué)生的學(xué)習(xí)也帶來了不便,所以研究這方面的內(nèi)容是很有必要的。

  2 中小學(xué)藏語(yǔ)文問答系統(tǒng)

  中小學(xué)藏語(yǔ)文問答系統(tǒng)是中小學(xué)藏語(yǔ)文課本為主的問答系統(tǒng),它主要由問題查詢、問題錄入和問題修改等主要有3個(gè)模塊。每個(gè)模塊的主要作用是:?jiǎn)栴}查詢模塊主要是用戶的問題提交到問答庫(kù)中并從中抽出最佳的答案返回給用戶。問題錄入模塊主要是向問答庫(kù)中添加新的問題。問題修改模塊主要是問答庫(kù)中已有的問題或答案進(jìn)行修改和補(bǔ)充。

  3 中小學(xué)藏語(yǔ)文答系統(tǒng)中答案抽取算法

  3.1關(guān)鍵詞抽取

  3.2基于關(guān)鍵詞的相似度計(jì)算藏文句子是由一組不同含義的單詞、格助詞和虛詞組成。藏文句子就是一個(gè)字符串,經(jīng)過分詞處理后,把句子看成詞的線性序列,根據(jù)句子中的單詞出現(xiàn)的頻率等相關(guān)信息來計(jì)算句子的相似度。在向量空間模式中,把兩個(gè)句子之間相互匹配的問題轉(zhuǎn)化為向量空間中兩個(gè)向量之間相互匹配的問題,兩個(gè)句子的相似度可以用兩個(gè)空間向量之間的夾角來衡量,夾角越小相似度越高。公式如下:(1)我們把句子看成是由許多相互獨(dú)立的單字所組成,兩個(gè)句子進(jìn)行分詞和去除一些冗余信息后,得到S1

  4 實(shí)驗(yàn)結(jié)果分析

  實(shí)驗(yàn)結(jié)果表明:這種算法雖然能抽出答案,但句子之間的同義詞過多時(shí),相似度依然不高,原因是沒有考慮到句子的語(yǔ)義信息,該系統(tǒng)還對(duì)解決實(shí)際問題還未考慮周全,有待進(jìn)一步完善。雖然目前該系統(tǒng)還不夠完善,但是已經(jīng)為中小學(xué)藏語(yǔ)文問答系統(tǒng)中答案抽取的研究奠定了一定的理論基礎(chǔ),該方法完全可行。

  參考文獻(xiàn)

  [1] 余正濤,鄧錦輝,韓露,等. 受限域 FAQ 中文問答系統(tǒng)研究[J]. 計(jì)算機(jī)研究與發(fā)展,2007,44(sl):579-586.

  [2] 秦兵,劉挺,王洋,鄭實(shí)福,等. 基于常問問答集的中文問答系統(tǒng)研究[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2003,35(10):1179-1182.

  [3] 安見才讓. 藏語(yǔ)句子相似度算法的研究[J]. 中文信息學(xué)報(bào), 2011,25(4):110-114.

  [4] 蔡?hào)|風(fēng),白宇,于水. 一種基于語(yǔ)境的詞語(yǔ)相似度計(jì)算方[J].中文信息學(xué)報(bào),2010,24(3):24-28.

  《中小學(xué)藏語(yǔ)文問答系統(tǒng)中答案抽取算法的研究》來源:《電腦知識(shí)與技術(shù)》,作者:群毛措,安見才讓。


轉(zhuǎn)載請(qǐng)注明來自:http://www.jinnzone.com/xiaoxuejiaoyulw/69153.html