Web觀點挖掘系統(tǒng)的關(guān)鍵技術(shù)研究
本文關(guān)鍵詞:Web觀點挖掘系統(tǒng)的關(guān)鍵技術(shù)研究,由筆耕文化傳播整理發(fā)布。
《揚(yáng)州大學(xué)》 2011年
Web觀點挖掘系統(tǒng)的關(guān)鍵技術(shù)研究
宮海平
【摘要】:隨著互聯(lián)網(wǎng)的迅速發(fā)展和普及,互聯(lián)網(wǎng)已成為人們獲取信息的重要渠道;同時,它也成為人們表達(dá)自己觀點、看法、情感的平臺。因此,在各大電子商務(wù)網(wǎng)站、電子公告板以及門戶網(wǎng)站上出現(xiàn)了大量的有關(guān)各種商品的評論信息。商家和廠家的決策者需要了解顧客使用他們商品情況的反饋意見,潛在的購買者也需要根據(jù)別人的使用體驗來作出是否購買該商品的決定。對于商品生產(chǎn)廠家和潛在的商品購買者而言,面對網(wǎng)絡(luò)上如此大量、復(fù)雜的評論信息,如何迅速有效地獲取自己感興趣的商品評論的總體觀點極性傾向(正面的還是負(fù)面的)就成為了一個新的問題。觀點挖掘技術(shù)的出現(xiàn),正是為了解決這個問題。它融合了信息檢索、信息抽取、文本分類、機(jī)器學(xué)習(xí)、自然語言處理、本體論等眾多技術(shù),具有一定的文本理解能力,更具有一定的智能性。 近年來觀點挖掘技術(shù)的研究十分活躍,由于觀點挖掘涉及到大量的理論技術(shù),本文只對觀點挖掘系統(tǒng)中的幾個關(guān)鍵方面進(jìn)行了深入的研究,并嘗試構(gòu)建了一個觀點挖掘系統(tǒng)(OMS)框架,主要的研究工作如下: 1)根據(jù)PageRank算法的思想,結(jié)合基于文本內(nèi)容的啟發(fā)式方法和基于Web超鏈分析的方法二者之間的優(yōu)點,提出一種新的爬行方法,為我們的觀點搜索系統(tǒng)專門設(shè)計了分布式的、改進(jìn)的聚焦網(wǎng)絡(luò)爬蟲算法,并實現(xiàn)了這個高效的分布式的聚焦爬蟲子系統(tǒng)。 2)基于最大熵和支持向量機(jī)的方法進(jìn)行評論的高質(zhì)量與低質(zhì)量分類研究,過濾掉大量低質(zhì)量的商品評論,從而保證觀點搜索系統(tǒng)能夠給出高質(zhì)量的查詢結(jié)果。 3)利用《知網(wǎng)》構(gòu)造具有主觀性詞的種子列表,然后,根據(jù)從《知網(wǎng)》中獲得的主觀詞種子列表以及《知網(wǎng)》中詞與詞之間相似或相反的關(guān)系提出了一個觀點詞的極性傾向判別算法,從而構(gòu)建一個帶有標(biāo)注詞語情感極性傾向的主觀詞詞典。 4)使用了本論文的成果以及其它研究者的成果設(shè)計了一個基于Web的觀點評論挖掘系統(tǒng)框架。
【關(guān)鍵詞】:
【學(xué)位授予單位】:揚(yáng)州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:TP311.13
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前3條
1 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[J];中文信息學(xué)報;2006年01期
2 唐慧豐;譚松波;程學(xué)旗;;基于監(jiān)督學(xué)習(xí)的中文情感分類技術(shù)比較研究[J];中文信息學(xué)報;2007年06期
3 徐軍;丁宇新;王曉龍;;使用機(jī)器學(xué)習(xí)方法進(jìn)行新聞的情感自動分類[J];中文信息學(xué)報;2007年06期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 楊暉;基于標(biāo)簽分類內(nèi)容共享平臺的網(wǎng)頁自動文摘模型[D];重慶大學(xué);2007年
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李榮軍;王小捷;周延泉;;PageRank模型在中文情感詞極性判別中的應(yīng)用[J];北京郵電大學(xué)學(xué)報;2010年05期
2 龐娜;;增量學(xué)習(xí)算法對文本情感識別模型的改進(jìn)[J];電腦開發(fā)與應(yīng)用;2011年07期
3 梁坤;古麗拉·阿東別克;;基于SVM的中文新聞評論的情感自動分類研究[J];電腦知識與技術(shù);2009年13期
4 張彬;楊志曉;;基于基準(zhǔn)詞的文本情感傾向性研究[J];電腦知識與技術(shù);2011年08期
5 李藝紅;蔣秀鳳;;中文句子傾向性分析[J];福州大學(xué)學(xué)報(自然科學(xué)版);2010年04期
6 廖祥文;張小琴;;基于句型結(jié)構(gòu)的領(lǐng)域傾向詞表構(gòu)建[J];福州大學(xué)學(xué)報(自然科學(xué)版);2011年04期
7 李迎凱;徐小良;;一種改進(jìn)的基于知網(wǎng)的句子相似度計算方法[J];電子科技;2012年07期
8 羅安;王勇;張福浩;劉紀(jì)平;;基于角色標(biāo)注的中文POI名稱語義分類方法[J];測繪通報;2012年S1期
9 薛云霞;李壽山;王中卿;;基于社會關(guān)系網(wǎng)絡(luò)的半監(jiān)督情感分類[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期
10 鄒明;;基于情感分析的惡意發(fā)帖檢測方法研究[J];電腦知識與技術(shù);2014年07期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 邊海容;萬常選;李國林;楊莉;;Web金融信息情感傾向與上市公司財務(wù)危機(jī)的關(guān)系研究[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計算機(jī)模擬與信息技術(shù)學(xué)術(shù)會議論文集[C];2011年
2 朱宏博;張芊;趙海;宋純賀;;基于貝葉斯網(wǎng)絡(luò)英文電影對白的潛在語義分析[A];第八屆沈陽科學(xué)學(xué)術(shù)年會論文集[C];2011年
3 ;Comparing Chinese reviews based on Fuzzy PROMETHEE: A new approach to sentiment analysis[A];第六屆(2011)中國管理學(xué)年會——商務(wù)智能分會場論文集[C];2011年
4 王根;趙軍;;中文褒貶義詞語傾向性的分析[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
5 徐琳宏;林鴻飛;楊志豪;;基于語義理解的文本傾向性識別機(jī)制[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
6 姚天昉;聶青陽;李建超;李林琳;婁德成;陳珂;付宇;;一個用于漢語汽車評論的意見挖掘系統(tǒng)[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年
7 李斌;盧俊之;章成志;陳小荷;;基于聚類引擎的話題褒貶度計算[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
8 倪茂樹;林鴻飛;;基于關(guān)聯(lián)規(guī)則和極性分析的商品評論挖掘[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
9 蔡健平;林世平;;基于機(jī)器學(xué)習(xí)的詞語和句子極性分析[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
10 王克;張春良;高曉興;朱靖波;;基于三類訓(xùn)練兩類判別框架的主客觀性句子識別[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 何建民;面向網(wǎng)絡(luò)社區(qū)聆聽客戶聲音方法研究[D];合肥工業(yè)大學(xué);2010年
2 鄧斌;B2C在線評論中的客戶知識管理研究[D];電子科技大學(xué);2010年
3 侯鋒;中文報業(yè)出版的文字質(zhì)量智能輔助控制技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2010年
4 張長利;面向特定領(lǐng)域的互聯(lián)網(wǎng)輿情分析技術(shù)研究[D];吉林大學(xué);2011年
5 楊峰;本體映射關(guān)鍵技術(shù)研究[D];吉林大學(xué);2011年
6 劉玉國;基于內(nèi)容的互聯(lián)網(wǎng)輿情信息挖掘關(guān)鍵技術(shù)研究[D];山東大學(xué);2011年
7 李榮軍;中文商品評論傾向性分析研究[D];北京郵電大學(xué);2011年
8 徐軍;面向金融信息檢索的體裁分類與情感分析技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年
9 楊卉;Web文本觀點挖掘及隱含情感傾向的研究[D];吉林大學(xué);2011年
10 羅芳;意見挖掘中若干關(guān)鍵問題研究[D];武漢理工大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 郭明;基于文本分類技術(shù)的文本情感傾向性研究[D];鄭州大學(xué);2010年
2 左維松;規(guī)則和統(tǒng)計相結(jié)合的篇章情感傾向性分析研究[D];鄭州大學(xué);2010年
3 孔勝;文本資源的知識抽取研究[D];大連理工大學(xué);2010年
4 邢鑫巖;基于序列模型的情感分析研究[D];大連理工大學(xué);2010年
5 楊鼎;基于樸素貝葉斯的中文文本情感傾向分類研究[D];湖南工業(yè)大學(xué);2010年
6 鄧忠瑩;中文文本傾向性分類系統(tǒng)研究[D];昆明理工大學(xué);2009年
7 周杰;網(wǎng)絡(luò)輿情話題情感傾向性分析技術(shù)研究[D];解放軍信息工程大學(xué);2010年
8 李海林;網(wǎng)絡(luò)輿情熱點信息發(fā)現(xiàn)及其傾向性研究[D];武漢理工大學(xué);2010年
9 汪前秀;基于改進(jìn)的VSM的不良文本過濾模型研究[D];東北財經(jīng)大學(xué);2010年
10 羅亞平;面向網(wǎng)絡(luò)輿情的中文評論文本情感傾向分析研究[D];東北財經(jīng)大學(xué);2010年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前8條
1 李蕾,鐘義信,郭祥昊;面向特定領(lǐng)域的理解型中文自動文摘系統(tǒng)[J];計算機(jī)研究與發(fā)展;2000年04期
2 季姮,羅振聲,萬敏,高小云;基于概念統(tǒng)計和語義層次分析的英文自動文摘研究[J];中文信息學(xué)報;2003年02期
3 代六玲,黃河燕,陳肇雄;中文文本分類中特征抽取方法的比較研究[J];中文信息學(xué)報;2004年01期
4 周茜,趙明生,扈旻;中文文本分類中的特征選擇研究[J];中文信息學(xué)報;2004年03期
5 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[J];中文信息學(xué)報;2006年01期
6 劉挺,吳巖,王開鑄;自動文摘綜述[J];情報科學(xué);1998年01期
7 郭燕慧,鐘義信,馬志勇,姚均勇;自動文摘綜述[J];情報學(xué)報;2002年05期
8 侯志霞,曹軍;自然語言處理的發(fā)展概況及前景展望[J];山東外語教學(xué);2003年05期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 謝長衛(wèi);;分布式環(huán)境下的集成數(shù)據(jù)挖掘系統(tǒng)[J];黑龍江科技信息;2007年16期
2 蒲筱哥;基于Web的個性化信息智能挖掘系統(tǒng)的構(gòu)建[J];現(xiàn)代圖書情報技術(shù);2005年04期
3 李靜;;高校教學(xué)管理關(guān)聯(lián)規(guī)則挖掘系統(tǒng)設(shè)計與實現(xiàn)[J];現(xiàn)代教育技術(shù);2007年02期
4 劉敏鈺,薛鴻民;Web數(shù)據(jù)挖掘系統(tǒng)的設(shè)計及關(guān)鍵技術(shù)研究[J];航空計算技術(shù);2005年01期
5 賈豐,張燕;網(wǎng)絡(luò)信息挖掘系統(tǒng)評價初探[J];情報理論與實踐;2003年03期
6 章成志;www信息挖掘技術(shù)及其在農(nóng)業(yè)信息領(lǐng)域中的應(yīng)用[J];計算機(jī)與農(nóng)業(yè);2001年12期
7 朱煒,王曉國,黃韶坤,李啟炎;Email挖掘系統(tǒng)的體系模型及其具體實現(xiàn)[J];計算機(jī)輔助工程;2004年02期
8 殷燕,白慶華,秦耕,成曉,李偉,杜磊;基于Multi Agent技術(shù)的信息挖掘系統(tǒng)研究[J];計算機(jī)應(yīng)用研究;1999年12期
9 趙瑜,王志堅,尹燕敏,楊敏;水文時間序列趨勢預(yù)測挖掘系統(tǒng)研究[J];計算機(jī)工程;2003年02期
10 張霄軍,張凌嵐;基于XML的Web中文文本挖掘系統(tǒng)設(shè)計[J];術(shù)語標(biāo)準(zhǔn)化與信息技術(shù);2004年03期
中國重要會議論文全文數(shù)據(jù)庫 前6條
1 崔晉川;常維寶;;基于因特網(wǎng)的綜合數(shù)據(jù)挖掘系統(tǒng)模型[A];西部大開發(fā) 科教先行與可持續(xù)發(fā)展——中國科協(xié)2000年學(xué)術(shù)年會文集[C];2000年
2 陶蘭;李四明;馮爽;;面向領(lǐng)域的網(wǎng)上信息挖掘系統(tǒng)研究與實現(xiàn)[A];第六屆全國計算機(jī)應(yīng)用聯(lián)合學(xué)術(shù)會議論文集[C];2002年
3 王海濤;王振瑯;;淺述緬甸反鏟挖泥船挖掘系統(tǒng)設(shè)計[A];第九屆全國內(nèi)河船舶及航運技術(shù)學(xué)術(shù)交流會論文集[C];2004年
4 劉湘平;郭明;;UCW400刀輪挖泥船[A];機(jī)械疏浚專業(yè)委員會第十六次疏浚與吹填技術(shù)經(jīng)驗交流會論文與技術(shù)經(jīng)驗總結(jié)文集[C];2002年
5 曾嶸;夏其昌;吳家睿;;蛋白質(zhì)組研究技術(shù)平臺的建立及其應(yīng)用[A];中國蛋白質(zhì)組學(xué)首屆學(xué)術(shù)大會論文摘要集[C];2003年
6 李昌勇;楊利民;方振峰;;700t/d燒劣質(zhì)低揮發(fā)份燃料新型干法生產(chǎn)線的優(yōu)化改造[A];第六屆全國新型干法水泥技術(shù)經(jīng)驗交流會論文匯編[C];2005年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 汪春玫 王萍;[N];人民郵電;2004年
2 趙雷;[N];中華工商時報;2005年
3 ;[N];網(wǎng)絡(luò)世界;2003年
4 戴肅軍 作者單位:江蘇總隊;[N];人民武警;2005年
5 ;[N];電腦報;2004年
6 北京理工大學(xué) 劉勇 張麗平;[N];計算機(jī)世界;2003年
7 ;[N];中國電子報;2002年
8 廣東 林鳴;[N];電腦報;2004年
9 方茜;[N];中國機(jī)電日報;2002年
10 劉志勇;[N];中國電腦教育報;2003年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 謝毓湘;輔助情報分析的新聞視頻挖掘技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2004年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 程再峰;中小型工程企業(yè)客戶潛在價值分析與挖掘系統(tǒng)設(shè)計及評價[D];浙江大學(xué);2004年
2 喬智勇;Web數(shù)據(jù)挖掘系統(tǒng)的設(shè)計及關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2002年
3 趙國富;基于聚類的空間數(shù)據(jù)挖掘方法與應(yīng)用研究[D];山東理工大學(xué);2006年
4 張磊;基于Internet的智能信息挖掘系統(tǒng)建模及關(guān)鍵技術(shù)研究[D];西北工業(yè)大學(xué);2003年
5 顏學(xué)優(yōu);網(wǎng)絡(luò)信息挖掘在電子商務(wù)中的應(yīng)用研究[D];吉林大學(xué);2007年
6 于青子;具有明確語義的關(guān)聯(lián)規(guī)則挖掘系統(tǒng)的研究與實現(xiàn)[D];河海大學(xué);2002年
7 金妮;基于數(shù)據(jù)倉庫和OLAP技術(shù)的聚類挖掘系統(tǒng)的設(shè)計與實現(xiàn)[D];大連理工大學(xué);2005年
8 蔡立軍;電子文檔信息挖掘系統(tǒng)的研究[D];湖南大學(xué);2003年
9 尹華;數(shù)據(jù)挖掘項目實施過程研究——基于分類的信用卡挖掘系統(tǒng)應(yīng)用[D];武漢大學(xué);2004年
10 王惠坡;基于決策樹的貨票數(shù)據(jù)挖掘系統(tǒng)的研究[D];鄭州大學(xué);2003年
本文關(guān)鍵詞:Web觀點挖掘系統(tǒng)的關(guān)鍵技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
本文編號:86947
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/86947.html