毛片一区二区三区,国产免费网,亚洲精品美女久久久久,国产精品成久久久久三级

情感詞獲取與分類評(píng)級(jí)論文

時(shí)間:2021-06-11 12:25:32 論文 我要投稿

情感詞獲取與分類評(píng)級(jí)論文

  一、研究背景

情感詞獲取與分類評(píng)級(jí)論文

  近年來(lái)BBS的迅速發(fā)展,主觀性的言論越來(lái)越多。如何構(gòu)建一個(gè)高效的系統(tǒng)對(duì)如此豐富的信息資源進(jìn)行分析和處理,成為一個(gè)重要的研究問(wèn)題。而對(duì)BBS信息資源的分析和處理,可以通過(guò)中心詞和情感詞兩個(gè)維度進(jìn)行處理。對(duì)于中心詞的歸類已經(jīng)有了相對(duì)較為完整的分析體系,產(chǎn)生了很多有監(jiān)督的學(xué)習(xí)方法以及文本特征表示方法和特征選擇機(jī)制。而情感詞的分類和評(píng)級(jí)以主觀詞為主,因此針對(duì)中心詞的選擇機(jī)制及方法在情感詞上不能完全加以應(yīng)用。本文主要以中山大學(xué)BBS的帖子為研究?jī)?nèi)容,選擇合適的情感詞分類方法,對(duì)情感詞進(jìn)行細(xì)分及評(píng)級(jí),從而得出一個(gè)滿足中大BBS輿情分析系統(tǒng)的情感詞分類體系。

  二、國(guó)內(nèi)外研究現(xiàn)狀分析

  目前,基于語(yǔ)義的文本傾向性研究方法主要有兩種:

  一種是通過(guò)現(xiàn)有詞典構(gòu)建情感傾向詞典。如,Hiroya利用待測(cè)詞與褒義詞、貶義詞的語(yǔ)義距離計(jì)算待測(cè)詞匯的語(yǔ)義傾向性;Ku等利用WORDNET中的其他與詞匯相關(guān)的信息來(lái)判斷詞匯的語(yǔ)義傾向性;徐琳宏等采用HOWNET作為基準(zhǔn)詞,并在實(shí)驗(yàn)中加入否定詞和副詞的處理,計(jì)算待測(cè)詞與關(guān)聯(lián)度確定語(yǔ)義傾向,從語(yǔ)義理解方面對(duì)電影評(píng)論進(jìn)行了傾向性識(shí)別研究。

  另一種是建立一個(gè)語(yǔ)義模式庫(kù),采用語(yǔ)義分析技術(shù)用于文本傾向性判斷。例如,復(fù)旦大學(xué)的朱嫣嵐等年提出的基于HOWNET的.詞匯語(yǔ)義傾向計(jì)算方法,利用詞語(yǔ)間的相似度來(lái)計(jì)算詞的褒貶程度。路彬等設(shè)計(jì)了一種基于語(yǔ)義分析的信息過(guò)濾模型,該模型針對(duì)不良信息的特點(diǎn),以自然語(yǔ)句為處理單元,采用主題詞和語(yǔ)義分析的兩級(jí)過(guò)濾工作模式。

  但情感詞的分類和評(píng)級(jí)以主觀詞為主,因此針對(duì)中心詞的選擇機(jī)制及方法在情感詞上不能完全加以應(yīng)用。

  三、研究目標(biāo)

  通過(guò)對(duì)帖子出現(xiàn)的情感的類型與強(qiáng)度進(jìn)行標(biāo)引,將情感詞進(jìn)行分類,把情感詞的強(qiáng)度按正面到負(fù)面分成等級(jí)進(jìn)行標(biāo)引。其中的軟件處理流程類似于中心詞的標(biāo)引。當(dāng)新詞(解析字典沒(méi)有的詞)發(fā)現(xiàn)以后,通過(guò)語(yǔ)義相近度計(jì)算軟件,比較與字典中詞匯的相近程度,通過(guò)人工干預(yù)(半自動(dòng)或全自動(dòng))進(jìn)行中心詞與情感詞的添加。

  最后通過(guò)對(duì)帖子數(shù)據(jù)的分析和調(diào)查,對(duì)情感詞的分類和標(biāo)引,開(kāi)發(fā)一個(gè)可以實(shí)現(xiàn)將中大bbs的帖子進(jìn)行實(shí)時(shí)抓取和自動(dòng)分類的系統(tǒng)。

  四、研究?jī)?nèi)容

  帖子的分類標(biāo)引以及中心詞的主題分類標(biāo)引這兩個(gè)方面在去年師兄師姐的努力下已經(jīng)完成了44067個(gè)帖子的抓取和分類,因此今年我們主要針對(duì)帖子情感詞分類以及評(píng)級(jí)這一塊開(kāi)始入手。

  情感心理學(xué)認(rèn)為,情感的基本類型可以分為以下四種:即快樂(lè),憤怒,恐懼和悲傷。

  為進(jìn)一步解決這個(gè)問(wèn)題,我們通過(guò)對(duì)人類情感有關(guān)資料的查找發(fā)現(xiàn):人的感情復(fù)雜多樣,由于不同事情引起的同一類情感也有許多不同,即使是同一個(gè)人對(duì)同一件事情在同一個(gè)環(huán)境下也可能會(huì)有不同的情感,而不同的視野角度對(duì)情感詞的分類也有所不同。因此通過(guò)對(duì)BBS中隨機(jī)抽取的詞語(yǔ),我們除去可以分類的,根據(jù)無(wú)法準(zhǔn)確分類的進(jìn)行歸納,我們利用知網(wǎng)發(fā)布的wordsimilarity進(jìn)行義項(xiàng)查找,發(fā)現(xiàn)一項(xiàng)出現(xiàn)頻率較高的情感類型:憐憫。

  古人云:人有七情六欲,對(duì)于心理學(xué)來(lái)說(shuō),七情分別是:喜怒哀樂(lè)驚恐憐。喜怒哀樂(lè)驚恐都可以在基本類型中找到位置,而憐似乎放在哪一個(gè)類型里面都不完全恰當(dāng)。

  綜上,我們把憐憫列為單獨(dú)的一項(xiàng)。情感大類分為:快樂(lè),憤怒,恐懼,悲哀和憐憫五種。

  快樂(lè)是指一個(gè)人期望和追求的目的達(dá)到后產(chǎn)生的情緒體驗(yàn)。由于需要得到滿足,愿望得以實(shí)現(xiàn),心理的急迫感和緊張感解除,快樂(lè)隨之而生:

  樂(lè):指歡樂(lè),身心愉悅,充滿幸福的一種情感;

  喜:包括喜愛(ài)、喜悅、喜好、喜歡、高興、快樂(lè)等情感。

  憤怒是指需求受到抑制或阻礙,愿望無(wú)法實(shí)現(xiàn)時(shí)產(chǎn)生的情緒體驗(yàn)。憤怒時(shí)緊張感增加,有時(shí)不能自我控制,甚至出現(xiàn)攻擊行為:

  怒:包括憤怒、惱怒、發(fā)怒、怨恨、憤恨等情感。

  恐懼是當(dāng)危險(xiǎn)狀況出現(xiàn)時(shí),人們企圖擺脫和逃避,而又無(wú)力應(yīng)付時(shí)產(chǎn)生的情緒體驗(yàn):

  驚:指驚咤、驚愕、驚慌、驚悸、驚奇、驚嘆、驚喜、驚訝等情感;

  恐:指恐慌、恐懼、害怕、擔(dān)心、擔(dān)憂、畏懼等情感。

  悲哀是指心愛(ài)的事物失去時(shí),或者夢(mèng)想破滅時(shí)產(chǎn)生的情緒體驗(yàn):

  哀:包括悲傷、悲痛、悲哀、憐憫、哀憐、哀愁、哀憫、哀怨、哀思等情感。

  憐憫是指對(duì)肉體或精神上遭受痛苦的人或者對(duì)不幸的人表示同情的情緒體驗(yàn):

  憐:包括憐憫、哀憐、同情等情感。

  為了使分類體系可以更加規(guī)范準(zhǔn)確的劃分情感詞,我們利用知網(wǎng)發(fā)布的wordsimilarity對(duì)以上五類情感詞進(jìn)行義原判斷,得到以下結(jié)果:

  為了方便分類,我們?cè)侔亚楦性~義原兩兩之間進(jìn)行距離計(jì)算,得到以下結(jié)果:

  對(duì)此,我們可以發(fā)現(xiàn)害怕,生氣,悲哀三個(gè)負(fù)面情感詞兩兩之間的距離和相似度是一樣的;而喜悅,憐憫分別與三個(gè)負(fù)面義原之間的距離和相似度是一樣的;憐憫與喜悅之間的距離和相似度與憐憫與其他三個(gè)負(fù)面義原之間的距離和相似度是一樣的。

  因此,我們先著手研究負(fù)面情感詞三個(gè)義原之間的關(guān)系,我們先依據(jù)義原距離構(gòu)建一個(gè)等邊三角形,三角形的三個(gè)頂點(diǎn)分別為三個(gè)義原,如圖:害怕→生氣→悲哀→生氣→害怕

  為了進(jìn)一步確認(rèn)分類體系,我們?cè)谏弦粚猛碌墓ぷ骰A(chǔ)上,通過(guò)對(duì)他們抓取到部分中大BBS帖子(共5578個(gè))人工篩選的情感詞進(jìn)行驗(yàn)證,共342個(gè)。由4個(gè)成員獨(dú)立進(jìn)行情感詞的類型分類,從中取得分類一致的結(jié)果,對(duì)于有歧義的情感詞,我們對(duì)其進(jìn)行再次分類,刪除無(wú)法得出一致結(jié)果的詞語(yǔ)。以同樣的步驟對(duì)正面情感詞進(jìn)行操作。

  這樣,結(jié)合HOWNET發(fā)布的,一共得到各類情感詞978個(gè),分類如下表。

  即在此基礎(chǔ)上,建立情感詞分類體系如下:

  五、結(jié)語(yǔ)

  本分類體系是根據(jù)已有研究成果和從中大BBS帖子中已抽取出并去重后的情感詞詞表的基礎(chǔ)上確立的分類體系,通過(guò)人工分類和修正,將情感詞進(jìn)行有效分類,這個(gè)分類比簡(jiǎn)單分正面情感詞和負(fù)面情感詞更適用于中大BBS的輿情分析系統(tǒng).對(duì)于類別“其他”中的詞匯,應(yīng)在后續(xù)情感詞分類中會(huì)根據(jù)情感詞的情況對(duì)各子類進(jìn)行必要的添加、去除或修正。

【情感詞獲取與分類評(píng)級(jí)論文】相關(guān)文章:

對(duì)信用評(píng)級(jí)的思考監(jiān)管論文06-13

環(huán)境評(píng)級(jí)水利水電論文05-29

關(guān)于對(duì)大機(jī)械行業(yè)的評(píng)級(jí)和研判的論文04-05

情感角度詩(shī)歌的分類04-12

公允價(jià)值獲取技術(shù)研究論文04-12

從失誤中獲取機(jī)遇議論文07-01

教師評(píng)級(jí)述職報(bào)告11-04

教師評(píng)級(jí)述職報(bào)告10-29

教師評(píng)級(jí)述職報(bào)告11-15