航空公司微博評論的意見信息抽取研究——以國航、南航和東航為例
本文選題:意見信息 + 條件隨機(jī)場; 參考:《系統(tǒng)科學(xué)與數(shù)學(xué)》2017年04期
【摘要】:如今越來越多的乘客選擇乘坐舒適快捷的飛機(jī)出行,中國航空運(yùn)輸需求因此逐年增長,航空公司在獲得更多盈利空間的同時(shí)也面臨激烈的競爭.對航空公司的用戶評論進(jìn)行意見信息抽取,不僅可用于航空公司改進(jìn)服務(wù)質(zhì)量和用戶體驗(yàn),還可為用戶選擇滿意的航空公司提供參考.文章首次以新浪微博平臺上航空公司的用戶評論為基礎(chǔ)數(shù)據(jù),利用條件隨機(jī)場進(jìn)行意見信息抽取.在有關(guān)研究中,專家學(xué)者大多憑借以往知識的了解對特征對象和特征詞進(jìn)行人工標(biāo)注,鮮少分析用戶在本評論語料中的關(guān)注點(diǎn).因此,文章創(chuàng)新性地在人工標(biāo)注前首先利用TF-IDF算法進(jìn)行關(guān)鍵詞提取,找到本評論語料中用戶的關(guān)注點(diǎn),最后以超過93%的F平均值證明模型的有效性,為后續(xù)的研究提供了新方向.
[Abstract]:Nowadays, more and more passengers choose to travel by comfortable and fast air. As a result, the demand for air transportation in China is increasing year by year, and airlines are facing fierce competition while gaining more profit space. It can not only be used to improve the service quality and user experience of airlines, but also provide reference for users to select satisfactory airlines. Based on the comments of airline users on Sina Weibo platform for the first time, the paper uses conditional random field to extract opinion information. In the relevant studies, most experts and scholars rely on the knowledge of the past to manually annotate feature objects and feature words, and rarely analyze the concerns of users in this review corpus. Therefore, this paper innovatively uses TF-IDF algorithm to extract keywords before manual annotation, finds the user's concerns in this review corpus, and finally proves the validity of the model with more than 93% F average. It provides a new direction for further research.
【作者單位】: 東北財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院;遼寧大學(xué)亞澳商學(xué)院;
【基金】:國家社科基金重大項(xiàng)目(13&ZD171) 遼寧省教育廳科學(xué)研究項(xiàng)目(LN2016YB026) 東北財(cái)經(jīng)大學(xué)研究生教學(xué)改革研究項(xiàng)目(yjyb201634)資助課題
【分類號】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 羅亮;邵澤輝;;基于條件隨機(jī)場進(jìn)行蛋白質(zhì)二級結(jié)構(gòu)預(yù)測[J];計(jì)算機(jī)應(yīng)用研究;2009年03期
2 宗萍;施水才;王濤;呂學(xué)強(qiáng);;基于條件隨機(jī)場的英文地理行政實(shí)體識別[J];現(xiàn)代圖書情報(bào)技術(shù);2009年02期
3 張開旭;夏云慶;宇航;;基于條件隨機(jī)場的古漢語自動斷句與標(biāo)點(diǎn)方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年10期
4 成姣;蔡東風(fēng);季鐸;;基于條件隨機(jī)場的日語依存分析[J];沈陽航空工業(yè)學(xué)院學(xué)報(bào);2010年05期
5 李玲玲;金泰松;李翠華;;基于局部特征和隱條件隨機(jī)場的場景分類方法[J];北京理工大學(xué)學(xué)報(bào);2012年07期
6 寧偉;蔡東風(fēng);張桂平;季鐸;苗雪雷;;基于條件隨機(jī)場的冠詞選擇研究[J];中文信息學(xué)報(bào);2008年06期
7 張玉芳;莫凌琳;熊忠陽;耿曉斐;;基于條件隨機(jī)場的科研論文信息分層抽取[J];計(jì)算機(jī)應(yīng)用研究;2009年10期
8 王昌厚;;基于條件隨機(jī)場的中文命名體識別[J];福建電腦;2012年02期
9 施水才;王鍇;韓艷鏵;呂學(xué)強(qiáng);;基于條件隨機(jī)場的領(lǐng)域術(shù)語識別研究[J];計(jì)算機(jī)工程與應(yīng)用;2013年10期
10 王東波;陳小荷;年洪東;;基于條件隨機(jī)場的有標(biāo)記聯(lián)合結(jié)構(gòu)自動識別[J];中文信息學(xué)報(bào);2008年06期
相關(guān)會議論文 前4條
1 王東波;陳小荷;年洪東;;基于條件隨機(jī)場的有標(biāo)記聯(lián)合結(jié)構(gòu)自動識別[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會會議論文集[C];2008年
2 張奇;翁富良;黃萱菁;吳立德;;英文口語中非流利區(qū)域的檢測[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
3 魏瑋;杜金華;徐波;;基于分層語塊分析的統(tǒng)計(jì)翻譯研究[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
4 王根;趙軍;;基于多重冗余標(biāo)記CRF的句子情感分析研究[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
相關(guān)重要報(bào)紙文章 前7條
1 本報(bào)記者 朱小兵;國航:信息安全180度大轉(zhuǎn)彎[N];計(jì)算機(jī)世界;2009年
2 本報(bào)記者 吳玉征;國航:信息化創(chuàng)新競爭力[N];計(jì)算機(jī)世界;2009年
3 本報(bào)記者 湯銘;中國航信部署開放系統(tǒng)[N];計(jì)算機(jī)世界;2010年
4 本報(bào)記者 宋家雨;“銀翼”下的IT發(fā)動機(jī)[N];網(wǎng)絡(luò)世界;2006年
5 本報(bào)記者 宋家雨;為飛行中的飛機(jī)更換發(fā)動機(jī)[N];網(wǎng)絡(luò)世界;2009年
6 國航信息管理部 王洪偉;近觀國航IT建設(shè)四大轉(zhuǎn)變[N];計(jì)算機(jī)世界;2010年
7 本報(bào)記者 程鴻;安全飛行的奧秘[N];計(jì)算機(jī)世界;2000年
相關(guān)碩士學(xué)位論文 前10條
1 趙九洋;圖像中行人檢測關(guān)鍵技術(shù)研究[D];南京大學(xué);2015年
2 寧振;基于層疊條件隨機(jī)場的情感分析[D];南昌大學(xué);2015年
3 楊獻(xiàn)祥;面向中文微博的產(chǎn)品名實(shí)體識別與規(guī)范化算法設(shè)計(jì)與實(shí)現(xiàn)[D];北京理工大學(xué);2015年
4 肖s,
本文編號:1797666
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1797666.html