基于影評數(shù)據(jù)的在線評論有用性影響因素研究
本文關(guān)鍵詞:基于影評數(shù)據(jù)的在線評論有用性影響因素研究,由筆耕文化傳播整理發(fā)布。
第13卷第8期 2010年8月
管理科學(xué)學(xué)報(bào)
JOURNAL OF MANAGEMENT SCIENCES IN CmNA
V01.13 No.8 Aug.2010
基于影評數(shù)據(jù)的在線評論有用性影響因素研究①
郝媛媛,葉強(qiáng),李一軍
(哈爾濱工業(yè)大學(xué)管理學(xué)院,哈爾濱150001)
摘要:面對互聯(lián)網(wǎng)上海量的在線客戶評論,如何能快速有效地進(jìn)行識別和選擇從而發(fā)現(xiàn)和利 用其中有用的評論,已經(jīng)成為人們關(guān)注的重要問題.以體驗(yàn)型商品電影的在線評論為研究對 象,結(jié)合文本挖掘技術(shù)和實(shí)證研究方法,從文本特征出發(fā)探索影響在線評論有用性的因素,建 立在線評論有用性影響因素模型,并利用該模型對評論有用性進(jìn)行分類預(yù)測.與現(xiàn)有相關(guān)研究 相比,提出的模型總體擬合效果顯著提高,并發(fā)現(xiàn)在線影評中積極的情感傾向、較高的正負(fù)情 感混雜度、較高的主客觀表達(dá)混雜度以及較長的平均各句長度,對評論的有用性具有顯著的正 面影響.最后預(yù)測結(jié)果表明,該模型對在線影評的有用性具有較強(qiáng)的判別能力. 關(guān)鍵詞:口碑;在線評論;有用性;文本特征;正負(fù)情感;主客觀表達(dá)形式;文本挖掘
中圖分類號:F713.55 文獻(xiàn)標(biāo)識碼:A 文章編號:1007—9807(2010)08—0078一ll
0
引
言
息搜索成本.盡管如此,評論文本信息仍然是人們 決策的重要參考源,很多評論閱讀者仍需通過查 看評論文本來了解產(chǎn)品好壞的具體方面,如對
Yahoo。停铮觯椋澹缶W(wǎng)站(movies.yahoo.eom)上影評
口碑(word-of-mouth)是個(gè)體間關(guān)于產(chǎn)品或服 務(wù)看法的非正式傳播方式….消費(fèi)者行為及營銷 領(lǐng)域的眾多研究u一1均表明,口碑傳播對消除購 買者的不確定性,輔助其做出有效決策具有重要 作用(特別是在體驗(yàn)型商品購買決策過程中).現(xiàn) 今,互聯(lián)網(wǎng)強(qiáng)大的信息存儲和搜索功能為口碑的 交流提供了極大的方便,更多人在網(wǎng)上論壇、聊天 室、博客和專門的商品評論網(wǎng)站等網(wǎng)絡(luò)空間發(fā)表 和共享有關(guān)商品的評論,為消費(fèi)者提供了豐富的 決策參考信息(特別是專門的商品評論網(wǎng)站上展
示了更為集中和全面的商品評論,本文的研究即
有用性評價(jià)信息的統(tǒng)計(jì)結(jié)果顯示:對于多數(shù)電影, 其所有評論中平均至少有52%的評論的文本被 閱讀過.在線評論的文本內(nèi)容可長期存儲并累積 下來,可為人們提供海量的信息資源,但并非所有 評論都有價(jià)值,由于網(wǎng)絡(luò)的匿名性、非面對面地接 觸、溝通成本低廉等特征¨J,評論的質(zhì)量往往良 莠不齊,一些評論者會(huì)不負(fù)責(zé)地隨意發(fā)表評論.評 論信息的過載及其質(zhì)量的參差不齊嚴(yán)重干擾了評 論閱讀者對商品質(zhì)量的有效判斷,增加了信息搜 索成本,降低了決策效率.因此,及時(shí)有效地識別 在線評論文本中有價(jià)值的信息對提高消費(fèi)者的決 策效率和效果至關(guān)重要.目前,一些網(wǎng)站提供評論 的有用性評價(jià)信息來幫助評論閱讀者識別評論的 價(jià)值.但該指標(biāo)需要長時(shí)間累積,無法及時(shí)提供最 新發(fā)布的評論的有用性信息,應(yīng)用效果欠佳[6].
主要針對這類在線評論).但與此同時(shí),也帶來了 信息大爆炸時(shí)代的普遍問題:面對海量評論,評論 閱讀者可能“迷失”其中,無法有效識別和利用其 中有價(jià)值的信息來判斷商品的真實(shí)質(zhì)量.
針對這個(gè)問題,一些評論網(wǎng)站提供評論者對
商品總體評分的信息,以幫助人們無需閱讀評論 文本即可了解評論者對商品的總體評價(jià),降低信
①收稿日期:2008—10—13;修訂日期:2009—07—15.
基金項(xiàng)目:國家自然科學(xué)基金資助項(xiàng)目(70771032;70890080—70890082)
作者簡介:郝媛媛(198l一),女,黑龍江哈爾濱人,博士生.Email:haoyy0112@163.咖
萬方數(shù)據(jù)
第8期
郝媛嬡等:基于影評數(shù)據(jù)的在線評論有用性影響因素研究
一79一
因此,有必要從評論的文本特征出發(fā),挖掘影響在
指出,人們更傾向于發(fā)表或關(guān)注極端評論而不是 中間評論,因?yàn)閷Ξa(chǎn)品極端正向或負(fù)向的體驗(yàn)更 容易引發(fā)口碑交流行為.Ghose和Ipeirotis¨1在研
究中設(shè)置了啞變量來考察極端評論與中間評論對 評論有用性影響的差異,結(jié)果發(fā)現(xiàn)極端評論的有 用性評價(jià)高于中間評論.另外一些學(xué)者進(jìn)一步認(rèn) 為極端評論中正向評論與負(fù)向評論的影響亦存在
線評論有用性的重要特征,以實(shí)現(xiàn)在評論發(fā)布后 即能自動(dòng)識別評論有用性.
目前,盡管文本挖掘技術(shù)的重大進(jìn)展使文本
中情感特征的自動(dòng)識別成為可能,但將文本挖掘 技術(shù)和基于理論的實(shí)證研究相結(jié)合,從文本特征 角度探索在線評論有用性影響因素的研究較為缺 乏.國內(nèi)研究的重點(diǎn)主要集中在對網(wǎng)絡(luò)口碑的研 究現(xiàn)狀進(jìn)行綜述(如文獻(xiàn)[7—8]),或研究網(wǎng)絡(luò)口 碑文本挖掘技術(shù)(如文獻(xiàn)[9]),或探討口碑傳播 的內(nèi)在機(jī)制及傳播意愿(如文獻(xiàn)[10—13]),或從
商家視角探索網(wǎng)絡(luò)口碑與口碑效應(yīng)或購買意愿的
差異.在傳統(tǒng)口碑傳播的研究中,很多學(xué)者曾指出
負(fù)向口碑比正向口碑更影響人們的決策,并運(yùn)用
不同理論解釋人們更關(guān)注負(fù)向口碑的原因:如心 理學(xué)領(lǐng)域有關(guān)印象形成的研究¨列發(fā)現(xiàn),人們在對
某一對象進(jìn)行評價(jià)的心理過程中,會(huì)對有關(guān)被評
關(guān)系(如文獻(xiàn)[14—17]),而從客戶角度探討什么 樣的評論對消費(fèi)者決策更有幫助的研究基本空白.
而國外這類研究剛剛起步,Ghose和Ipeirotis【6J初探 性的研究主要針對搜索型商品(如視聽播放器、
價(jià)對象的負(fù)面信息賦予高于正面信息的權(quán)重,這 是因?yàn)槿藗冊诿鎸φ婧拓?fù)面消息或事件時(shí)的反
應(yīng)強(qiáng)度是不同的,負(fù)面消息給人們的心理喚醒、注
意、情緒、評價(jià)、歸因以及社會(huì)行動(dòng)等反應(yīng)所造成 的刺激都要強(qiáng)于正面信息.在營銷領(lǐng)域,Ahluwalia 等啪1發(fā)現(xiàn),消費(fèi)者通常會(huì)認(rèn)為負(fù)面信息比正面 信息更具診斷價(jià)值,因而在購買決策時(shí)更多地依 賴負(fù)面信息.而近年,比較不同類別商品正負(fù)面口
碑影響的一些研究則得出相反的結(jié)論,如Sen和
數(shù)碼相機(jī)等),分析評論的主客觀傾向及主客觀 混雜度對商品評論有用性的影響.盡管Ghose等 做出了有益嘗試,但仍存在以下問題:1)仍有影 響評論有用性的重要因素未納入到模型中,這影 響了模型預(yù)測力的提高.2)模型中僅將評論正負(fù) 情感傾向分為極端評論與中間評論兩類進(jìn)行考 察,而未進(jìn)一步分離并考察極端評論中正面和負(fù) 面情感對評論有用性的影響是否存在差異.3)僅
研究了搜索型商品在線評論的有用性,研究成果
Lerman¨川對體驗(yàn)享樂型和實(shí)用性兩類商品的實(shí) 證結(jié)果表明在線評論的不同情感傾向?qū)υu論有用
性的影響確實(shí)存在差異,不過是正向評論的影響
更大,且對于體驗(yàn)享樂型商品,其負(fù)向評論的有用 性要低于實(shí)用型商品.一些理論支持了體驗(yàn)型商
品負(fù)向評論影響不大的結(jié)論:如Adaval瞄。提出了
是否可推廣至體驗(yàn)型商品有待驗(yàn)證.
因此,基于現(xiàn)實(shí)中對及時(shí)有效地識別在線評
論有用性的迫切需要,在Ghose等已有研究基礎(chǔ) 上,本文以體驗(yàn)型商品——電影為研究對象,進(jìn)一 步考察正面和負(fù)面情感對評論有用性影響的差 異,并發(fā)掘影響評論有用性的其他重要文本特征 因素,建立擬合度更高的評論有用性影響因素模
型,幫助消費(fèi)者更準(zhǔn)確及時(shí)地識別評論有用性,提
情感一致性理論,他發(fā)現(xiàn),當(dāng)潛在消費(fèi)者評判商品 的體驗(yàn)屬性時(shí),往往對與自己心情一致的屬性信
息給予更大權(quán)重.當(dāng)消費(fèi)者閱讀體驗(yàn)型商品的評
論時(shí)往往懷著正向的預(yù)期和心情(希望選擇一種 使其心情愉悅的商品),而負(fù)向評論與消費(fèi)者當(dāng)
時(shí)正向的心理預(yù)期恰恰相反,因此負(fù)向信息對消
高決策效率和效果.
費(fèi)者決策的影響被降低.另一種從決策過程角度
出發(fā)的解釋是,實(shí)用型商品購買的主要目標(biāo)是效
理論基礎(chǔ)及假設(shè)的提出
1.1評論的正負(fù)情感與評論有用性 一些學(xué)者的研究表明評論的正負(fù)情感影響著
用最大化舊J,而用于效用判斷的商品屬性標(biāo)準(zhǔn)都
是明確、可感知、客觀的,因此人們可以依賴已消
費(fèi)者的口碑反饋來了解商品的這些屬性;而對體 驗(yàn)型商品的評價(jià)則復(fù)雜得多,消費(fèi)者追求的目標(biāo) 是對獲得某種更高層次價(jià)值的預(yù)期的最大化ⅢJ, 實(shí)現(xiàn)何種價(jià)值以及對價(jià)值的預(yù)期在個(gè)體消費(fèi)者之 間存在重大差異,很難有公認(rèn)的判別標(biāo)準(zhǔn).既然一
消費(fèi)者對評論價(jià)值的感知,不同正負(fù)情感的評論 發(fā)表的比例和受關(guān)注的程度均可能存在差異,從
而導(dǎo)致評論有用性存在差異.如Dellarocas等…1
萬方數(shù)據(jù)
一80一
管理科學(xué)學(xué)報(bào)
2010年8月
些人對體驗(yàn)型商品的負(fù)向評價(jià)不一定被其他閱讀 者認(rèn)可,而評論閱讀者對這類商品的預(yù)期往往又 傾向于正面,因此,對于體驗(yàn)型商品,負(fù)向評論對 人們決策的參考價(jià)值被減弱.Sen和Lerman悼刈基
于歸因理論(attribution theory),從評論者發(fā)表評
Duhan等的定義,將評論的觀點(diǎn)句中客觀表達(dá)形 式的句子(簡稱objective expression)定義為:一般 以陳述的語句,采用第3人稱語氣,客觀地評述商 品總體或其各屬性特征,這類評論句的表達(dá)通常 與影評專家影評的表達(dá)形式相近,例如,“The
animation has improved quite lady realistic to
were
a
論的動(dòng)機(jī)的角度解釋和驗(yàn)證了關(guān)于體驗(yàn)型商品的 負(fù)向評論影響減弱的原因:對于體驗(yàn)型商品,消費(fèi) 者更傾向于把評論者發(fā)表負(fù)向評論的動(dòng)機(jī)歸因于 與個(gè)人相關(guān)而非與商品本質(zhì)相關(guān),因而認(rèn)為負(fù)向 評論缺乏可信性.借鑒Ghose和Ipeirotis舊。對所研 究的評論文本特征選擇了平均值(反映特征傾向 的集中趨勢)和標(biāo)準(zhǔn)差(反映特征的混雜程度)兩 個(gè)指標(biāo),本文也同時(shí)考察各文本特征的均值及標(biāo) 準(zhǔn)差對有用性的影響,其中,評論正負(fù)情感混雜度 可能正向反映評論的客觀性,因此預(yù)期該指標(biāo)對 評論有用性的影響為正.綜合以上理論闡述,提出
假設(shè)H1.
lot and is spectacu—
watch.The
music and sound effects
also buzzing with delightful
energy.”.而評論
的觀點(diǎn)句中主觀形式表達(dá)的句子(簡稱subjective expression)定義為:除客觀表達(dá)形式之外的通常 采用第1人稱語氣,帶有很強(qiáng)個(gè)人主觀色彩的觀 點(diǎn)評述,例如“For
We
children with
no
US,ICE AGE2 is
a
greatest film.
love Sid with big eyes!”!埃簦澹颍颍椋猓欤澹澹觯澹 small understanding of what poor acting is if poorly
will think this movie
acted.”.如前所述,
特別是對于體驗(yàn)型商品,每個(gè)人的觀點(diǎn)可能千差 萬別,個(gè)人觀點(diǎn)不一定被其他評論閱讀者接受.而 如果以較為中立的口氣來客觀評述電影各個(gè)方面
的好壞,要比試圖將主觀情感好惡強(qiáng)加于人要更
H1在線評論內(nèi)容的正負(fù)情感對評論有用 性存在影響.其中: H1—1評論內(nèi)容的平均正向情感傾向?qū)υu 論有用性存在正向影響.(即評論的正向情感傾 向越大,評論的有用性越高). HI一2評論內(nèi)容的正負(fù)情感混雜度對評論 有用性存在正向影響.
1.2評論中觀點(diǎn)的表達(dá)形式與評論有用性 對采集的在線影評數(shù)據(jù)的文本特征進(jìn)一步分 析發(fā)現(xiàn),在評論中,觀點(diǎn)評價(jià)的內(nèi)容在表達(dá)形式上
具有說服力.另外,評論表達(dá)形式的混雜度同樣可 能正向反映評論的客觀性.因此,本文提出以下假 設(shè)H2.
H2在線評論內(nèi)容中觀點(diǎn)句的主觀與客觀
表達(dá)形式對評論有用性存在影響.其中: 112—1評論內(nèi)容中觀點(diǎn)句的平均主觀表達(dá) 傾向?qū)υu論有用性存在負(fù)向影響.(即評論主觀 表達(dá)的傾向越大,評論有用性越低). H2-2評論內(nèi)容中觀點(diǎn)句的主客觀表達(dá)形 式的混雜度對評論有用性存在正向影響.
1.3評論的體裁與評論有用性
也存在很大差別,有用性較高的評論中采用客觀 形式表達(dá)的句子更多,觀點(diǎn)句的主觀與客觀表達(dá) 形式對評論的有用性的影響可能存在差異.營銷 領(lǐng)域中,Duhan等Ⅲ1曾對口碑的主客觀表達(dá)形式 相關(guān)概念做過相應(yīng)的界定,他們將口碑分為“小
fective
在機(jī)器語言學(xué)習(xí)研究領(lǐng)域,Pang和LeeⅢo從 評論文本體裁的角度將文本內(nèi)容分為客觀 (objectivity)和主觀(subjectivity)兩類,并提出了 識別這兩類文本內(nèi)容的機(jī)器自動(dòng)分類技術(shù).其中, 客觀的文本內(nèi)容被定義為:評論者對商品特征或 屬性做出的與商家描述一致或不一致的描述;而 主觀的文本內(nèi)容被定義為:評論者對商品的主觀 態(tài)度或情感的表達(dá),這類文本內(nèi)容不會(huì)出現(xiàn)在商 家的商品描述信息中.為與前面提出的主客觀表 達(dá)形式文本特征相區(qū)別,對從文本體裁角度將文 本內(nèi)容分成的兩類內(nèi)容稱為“觀點(diǎn)評價(jià)”和“客觀 描述”.Ghose和Ipeirotis∞o進(jìn)一步研究了這兩類
cues”和“instrumental cues”兩類內(nèi)容,其中
“affective
cues”定義為基于購買者內(nèi)在主觀標(biāo)準(zhǔn)
(如美感、藝術(shù)效果等)的評價(jià);“instrumental
cues”定義為基于產(chǎn)品屬性的客觀評述.Duhan等
揭示了主客觀表達(dá)形式的重要區(qū)別,即客觀表達(dá) 形式的口碑中包含更多的評述產(chǎn)品屬性的內(nèi)容. 而在分析中發(fā)現(xiàn),文本評論的表達(dá)方式(如語氣 和用詞等)都會(huì)影響評論者的主客觀表達(dá)效果.
如評論“a
see
must
see
film.”在表達(dá)上要比“you
must
it!”更客觀,更容易讓人接受.因此,借鑒
萬方數(shù)據(jù)
第8期
郝媛媛等:基于影評數(shù)據(jù)的在線評論有用性影響因素研究
一81一
文本體裁對視聽產(chǎn)品和數(shù)碼相機(jī)兩種商品在線評
論有用性的影響,結(jié)果發(fā)現(xiàn)這些商品評論中平均
有用性存在正向影響. H5在線評論標(biāo)題的觀點(diǎn)評價(jià)傾向?qū)υu論
有用性存在正向影響.
觀點(diǎn)評價(jià)傾向越大(即觀點(diǎn)評價(jià)的內(nèi)容越多),評 論有用性越低,而既有觀點(diǎn)評價(jià)又有對商品的客 觀描述,兩類信息越混雜,評論的有用性越高.對 于體驗(yàn)型商品來說,Nelson曙¨指出這類商品的主 要屬性通常不易判斷,需要通過體驗(yàn)才能獲知.這 樣,對于體驗(yàn)型商品,商品客觀描述不足以幫助人 們判斷其真實(shí)質(zhì)量,而其他用戶的主觀感受和評 價(jià)對其決策的影響增大.另外,無論對于什么類型 的商品,既包含觀點(diǎn)評價(jià)又包含客觀描述的評論 更全面地反映了商品的質(zhì)量,對消費(fèi)者決策的影 響更大.因此,本文提出假設(shè)H3.
I-13在線評論內(nèi)容中客觀描述和觀點(diǎn)評價(jià)
H6在線評論標(biāo)題中觀點(diǎn)句的主觀表達(dá)傾 向?qū)υu論有用性存在負(fù)向影響.
1.5其他控制變量與評論有用性
Ghose和Ipeirotisl61在其研究中加入了評論
發(fā)布天數(shù)和評論可讀性兩個(gè)控制變量.實(shí)際上,評 論發(fā)布天數(shù)越長,對電影關(guān)注的熱度可能會(huì)逐漸 減弱,因此電影的評論被關(guān)注并被評價(jià)的可能性
就會(huì)降低,因此本文初步認(rèn)為評論發(fā)布天數(shù)對評 論有用性存在負(fù)向影響.對于評論可讀性,Ghose 等認(rèn)為閱讀評論的認(rèn)知成本(評論的可讀性)會(huì) 影響評論有用性,并以評論中平均每句長度作為 可讀性代理指標(biāo),結(jié)果發(fā)現(xiàn)評論可讀性對評論有 用性存在正向影響,與其初始理論解釋相反,兩者 的關(guān)系有待進(jìn)一步檢驗(yàn).因此,本文提出假設(shè)H7
和H8.
兩類體裁對評論有用性存在影響.其中:
H3-1
評論內(nèi)容的平均觀點(diǎn)評價(jià)傾向?qū)υu
論有用性存在正向影響(即評論的觀點(diǎn)評價(jià)傾向 越大,評論有用性越高).
H3-2評論內(nèi)容中觀點(diǎn)評價(jià)與客觀描述的
I'I'/在線評論發(fā)布天數(shù)對評論有用性存在 負(fù)向影響.
H8在線評論內(nèi)容中平均句子長度對評論 有用性存在影響.
混雜度對評論有用性存在正向影響.
1.4評論標(biāo)題與評論有用性
對于在線評論,文本內(nèi)容可細(xì)分為評論標(biāo)題 和評論內(nèi)容(即正文)兩部分.在Ghose和Ipeirotis
的研究№1中,評論標(biāo)題并未被列為評論文本來加
2在線評論有用性影響因素模型
基于以上理論假設(shè),建立在線評論有用性影
響因素模型(見公式(1)).以在線評論的文本特
以考察.而評論標(biāo)題也可能對評論總體有用性存 在影響,因?yàn)椋壕W(wǎng)上評論與網(wǎng)下口碑傳播的顯著差 異是網(wǎng)下口碑往往是被動(dòng)接受,而網(wǎng)上評論必須 經(jīng)過消費(fèi)者主動(dòng)搜索才能獲得,這種主動(dòng)獲取信
息的方式使消費(fèi)者可以自主挑選感興趣的評論而
征——評論內(nèi)容的正向情感傾向、觀點(diǎn)評價(jià)傾向 概率及觀點(diǎn)句中主觀表達(dá)傾向概率的平均值和標(biāo) 準(zhǔn)差,以及評論標(biāo)題的正向情感傾向概率、觀點(diǎn)評 價(jià)傾向概率、主觀表達(dá)傾向概率的平均值作為自 變量,對評論有用性進(jìn)行回歸.其中,采用網(wǎng)站上
提供的認(rèn)為該評論有用的投票數(shù)和總投票數(shù)相除
有選擇地進(jìn)行閱讀.幫助其初步判斷評論是否值
得進(jìn)一步閱讀的重要工具就是評論的標(biāo)題,標(biāo)題
是正文內(nèi)容的概括和宣傳廣告,評論標(biāo)題具有吸 引力,才有可能進(jìn)一步引發(fā)消費(fèi)者閱讀評論內(nèi)容 的行為.基于以上經(jīng)驗(yàn)總結(jié),本文認(rèn)為,不被關(guān)注
即無法產(chǎn)生影響,評論標(biāo)題影響著評論內(nèi)容被閱 讀并產(chǎn)生影響的可能性,因而影響著消費(fèi)者對評
得到的比例值作為評論有用性的代理指標(biāo).而對 于評論對特定商品的正向情感傾向,采用網(wǎng)站上 該條評論對商品的打分作為代理指標(biāo),而不采用
機(jī)器挖掘方法得到的概率值,主要考慮是:評論者
論有用性的評價(jià).對于標(biāo)題文本特征的影響方向, 我們預(yù)期與評論正文文本特征的影響方向一致.
因此,提出假設(shè)H4一H6.(評論標(biāo)題通常較短,僅
打分是最為原始的數(shù)據(jù),比由機(jī)器學(xué)習(xí)估算出的
概率更準(zhǔn)確客觀.參考Ghose和Ipeirotis的研 究[6 J,評論有用性、評論發(fā)布天數(shù)以及可讀性均
有一句的標(biāo)題占多數(shù),故不考慮混雜度指標(biāo).) H4在線評論標(biāo)題的正負(fù)情感傾向?qū)υu論
采用常用對數(shù)形式.各變量的符號及解釋見表1.
萬方數(shù)據(jù)
一82一
管理科學(xué)學(xué)報(bào)
2010年8月
Log(Helpful)kr=a+口l(Rating)kr+島(DevPos)kr+盧3(AvgSub)h+角(DevSub)h+ 盧5(AugSubExp)h+盧6(DevSubExp)kr+JB7(title_AvgP05)kr+盧8(title_AvgSub)h+ 島(title_AvgSubExp)h+盧10Log(Elapseddays)kr+盧11Log(Read)h+占kr
表1
Table
1
(1)
模型中各變量代表符號及解釋
Explanations
for variables in the model
變量
解釋 評論有用性比例(有用的投票數(shù)/總投票數(shù))(常 用對數(shù)形式)
變量
解釋
LoS(Hetpfq)h
(DevSubgxp)h
商品k評論r觀點(diǎn)句中主觀表達(dá)傾向概率的
標(biāo)準(zhǔn)差
(Rating)h (DevPos)h (AvgSub)h (DevSub)h
商品k評論r內(nèi)容的正負(fù)情感傾向打分 商品k評論r內(nèi)容的正向情感傾向概率的標(biāo)準(zhǔn)差 商品&評論r內(nèi)容的觀點(diǎn)評價(jià)傾向概率 商品k評論r內(nèi)容的觀點(diǎn)評價(jià)傾向概率的標(biāo)準(zhǔn)差 商品k評論r平均句子長度(評論中單詞總數(shù)/句
(AvgSubExp)kr (title_AvgPos)h (tige.AvgSub)kr (title_,4vgSubExp)h Log(Elapseddays)kr
商品k評論r觀點(diǎn)句中主觀表達(dá)傾向概率
商品k評論r標(biāo)題的正向情感傾向概率
商品k評論r標(biāo)題的觀點(diǎn)評價(jià)傾向概率
商品k評論r標(biāo)胚的主觀表達(dá)傾向概率 商品k評論r發(fā)表時(shí)間距商品發(fā)布日的天數(shù) (常用對數(shù)形式)
Log(Read)h
子個(gè)數(shù))(常用對數(shù)形式)
表電影從其發(fā)布至影院放映結(jié)束這段時(shí)間的影評 3
3.1
研究數(shù)據(jù)及文本特征識別方法
研究對象
數(shù)據(jù),包括各個(gè)評論的正負(fù)情感傾向打分、發(fā)布時(shí) 間、有用性評價(jià)、標(biāo)題、正文內(nèi)容.其中,評論的有 用性評價(jià)指由一些消費(fèi)者在閱讀評論后對該評論
是否有用做出投票,然后評論網(wǎng)站將累計(jì)的有用
通過對本校市場營銷學(xué)科教授的訪談,形成 包括小說、音箱、化妝品、電影等8種體驗(yàn)型商品
的候選商品列表.然后,根據(jù)Nelson的量表舊7 o設(shè)
性評價(jià)信息以投票總?cè)藬?shù)中多少人認(rèn)為有用的形
式呈現(xiàn)給后來的評論閱讀者.
計(jì)了一道反映商品體驗(yàn)性需求的測項(xiàng)(“您認(rèn)為 在購買前無需試體驗(yàn),僅根據(jù)網(wǎng)上對該商品的描 述性信息(非買家評論)容易評估其品質(zhì)嗎?l非 常容易……5非常難),并隨機(jī)邀請本校的10名 在校大學(xué)生對列表中所有候選商品進(jìn)行打分.結(jié) 果顯示,被試者對化妝品及電影的體驗(yàn)性需求最 強(qiáng).最后,選取電影作為體驗(yàn)型商品進(jìn)行下一步的
實(shí)證分析,主要原因是:電影是人們公認(rèn)的受口碑
通常情況下,電影發(fā)布后1個(gè)月內(nèi)影評發(fā)布 密集,人們對評論的關(guān)注度和評價(jià)也較為集中.鑒 于后期的一些評論未被評價(jià)可能是由電影受關(guān)注 程度降低導(dǎo)致的,后期有用性評價(jià)的數(shù)據(jù)實(shí)際上 無法客觀地反映評論本身的質(zhì)量,本文主要考察 14個(gè)樣本電影發(fā)布后1個(gè)月內(nèi)的評論.另外,一些 評論的有用性評價(jià)總票數(shù)為1(即僅有1人評 價(jià)),考慮到這些評論的評價(jià)人數(shù)過少,得到的有 用性評價(jià)指標(biāo)值的代表性差,因此,剔除有用性評 價(jià)總票數(shù)為l的評論.最后,共得到1 686個(gè)影評
樣本用于模型檢驗(yàn).
3.3
影響較大的商品;另外,電影是典型的體驗(yàn)型商 品,目前研究體驗(yàn)型商品的文獻(xiàn)大多選取電影為 研究對象,本文以同一種商品進(jìn)行研究,有利于研
究結(jié)果的比較和驗(yàn)證. 3.2研究數(shù)據(jù)
文本特征識別方法
模型中,多數(shù)評論文本特征的識別均采用機(jī) 器文本挖掘分類工具LingPipe(可在WWW.alias。i. com/lingpipe下載)來實(shí)現(xiàn),應(yīng)用步驟如下:利用 Java編程使用其動(dòng)態(tài)語言模型構(gòu)造相應(yīng)的分類 器,用人工標(biāo)注好類別的文本語料進(jìn)行訓(xùn)練,然后 選用其他測試樣本對分類效果進(jìn)行評估,最后利 用訓(xùn)練好的分類器對未知類別的文本進(jìn)行情感分 類和傾向概率的計(jì)算.
本研究所需的數(shù)據(jù)均通過Java程序自動(dòng)抓 取和解析網(wǎng)頁獲得.在線影評數(shù)據(jù)來自美國著名
的Yahoo。停铮觯椋澹笥霸u網(wǎng)站(movies.yahoo.
eom):首先在2006年度票房排行前500名電影 中,對動(dòng)畫、喜劇、恐怖、驚悚、戰(zhàn)爭、冒險(xiǎn)、科幻7 類主要題材分別隨機(jī)抽取了2部電影作為代表電 影,然后在Yahoo。停铮觯椋澹缶W(wǎng)站上抓取這14個(gè)代
萬方數(shù)據(jù)
第8期
郝嬡嬡等:基于影評數(shù)據(jù)的在線評論有用性影響因素研究
一83一
本文中文本特征識別所需的訓(xùn)練及測試樣 本主要有兩個(gè)來源:一是研究者提供的語料庫,
Yahoo!Movies網(wǎng)站上除用于14個(gè)電影樣本外的其
他電影評論中,選取正向和負(fù)向評價(jià)語句各400個(gè)作 為正負(fù)情感的訓(xùn)練及測試語料.
基于相應(yīng)的訓(xùn)練語料,對本研究構(gòu)造的觀點(diǎn)
二是Yahoo!Movies網(wǎng)站上除14個(gè)電影樣本外
其他電影的評論數(shù)據(jù).具體的選取過程如下:1) 對于評論文本觀點(diǎn)評價(jià)/客觀描述的分類,根據(jù) 前述的定義,采用Pang和Lee提供的電影劇情
評價(jià)/客觀描述、正負(fù)向情感、觀點(diǎn)句中主客觀表
達(dá)3個(gè)分類器分別進(jìn)行訓(xùn)練,然后利用相應(yīng)測試
描述訓(xùn)練語料庫(http://www.cs.cornell. edu/people/pabo/movie—review-data/)中800個(gè)
電影劇情介紹文本作為本研究中電影評論客觀描述
語料評估分類器的分類準(zhǔn)確率,所得準(zhǔn)確率分別 為:85.15%,83.34%,78.71%,說明3個(gè)分類器 的分類效果良好.
4
信息的訓(xùn)練及測試語料(其中2/3的數(shù)據(jù)用作訓(xùn)練, 其余1/3用作測試,以下其他文本特征的訓(xùn)練樣本和 測試樣本的分配與此相同);從Yahoo。停铮觯椋澹缶W(wǎng)站 上除14個(gè)電影樣本外的其他電影評論中,剔除其中 劇情描述及主客觀模糊的句子,篩選出765個(gè)觀點(diǎn)評 價(jià)句作為電影觀點(diǎn)評價(jià)信息的訓(xùn)練及測試語料.2) 對于評論觀點(diǎn)句的主客觀表達(dá)形式的分類,根據(jù)前
述的定義,從Yahoo!Movies網(wǎng)站提供的大型影評機(jī) 構(gòu)的影評中,隨機(jī)選。担埃皞(gè)專家評論文本作為影評 客觀表達(dá)信息的訓(xùn)練及測試語料;從Yahoo!Movies 4.1初步統(tǒng)計(jì)分析 模型中各變量基本均可被視為連續(xù)變量,描 述性統(tǒng)計(jì)分析結(jié)果見表2.
模型結(jié)果分析
為在初步分析中更為清晰地呈現(xiàn)評論情感傾 向與評論有用性的關(guān)系,將連續(xù)變量——評論有 用性評價(jià)指標(biāo)及電影正負(fù)情感打分進(jìn)行離散化分 類:對評論有用性評價(jià)以0.5為分界值將評論分
為“有用”、“沒用”兩類;另外,Yahoo!Movies網(wǎng)
網(wǎng)站上除14個(gè)電影樣本外的其他電影評論中篩選出 500個(gè)帶有強(qiáng)烈個(gè)人色彩的主觀表達(dá)句作為電影主 觀表達(dá)信息的訓(xùn)練及測試語料.3)對于影評的正負(fù)
情感分類,由于Yahoo。停铮觯椋澹缶W(wǎng)站對于每個(gè)影評都 有正負(fù)情感傾向的打分,因此不用采用文本挖掘方
站評論中的電影正負(fù)情感評分采用A—F 5個(gè)大等 級,除F等級外,每個(gè)大等級下又分為3個(gè)小等 級,我們將13個(gè)等級合并為3類,即好評(A+
.B.)、中評(C+.C-)、差評(D+-F),對樣本中3
法對影評的正負(fù)情感傾向概率進(jìn)行計(jì)算,但影評的 正負(fù)情感混雜度仍需借助文本挖掘方法來求得,從
表2
Table 2
Descriptive statistics
類情感傾向的評論有用性評價(jià)數(shù)量及比例情況進(jìn)
行初步統(tǒng)計(jì),結(jié)果見表3.
of variables
in the
模型中各變量的描述性統(tǒng)計(jì)
model
變量 (Helpful)ix (Rating)kr (DevPos)h (AvgSub)h (DevSub)b (AvgSubExp)h (DevSubExp)kr (title_AvgSub)h (title AvgSubExp)h (title AvgPos)h (Read)h (Elapseddays)kr
有效觀測值
l 1 1
均值
0.64 9.07 O.32 0.87
O.17
標(biāo)準(zhǔn)差
O.26
最小值
0.03
最大值
1
686 686
67l
4.29
l O
13
O.50
0.17
O.17
1 1
680 680
O O 0 0
0
l
O.19 0.3l 0.19 0.22 0.47 0.44 9.41 15.62
0.57 l O.50
l
l l
668 668
686
0.45 O.3l 0.94 0.46 O.56 15.56
l l
686 686 671 686
O O O 1
l
1
l l 1
92 30
7.64
萬方數(shù)據(jù)
一84一
裹3
Table 3
管理科學(xué)學(xué)報(bào)
三類情感傾向評論的有用性評價(jià)統(tǒng)計(jì)
usefolness for three attitude
orientations reviews
2010年8月
Statistics of
評論情感傾向 總觀測樣本 差評(F—D+) 評論有用 性評價(jià) 沒用 有用 246(70.90%) 101(29.I%) 347(100%) 中評(C~C+) 118(68.6%) 54(31.4%) 172(100%)
1
好評(B—A+) 41I(35.2%) 756(64.8%) 167(100%)
1
775(46%) 911(54%) 686(100%)
總觀測樣本
注:括號中的比例值為有用或沒用的相應(yīng)評論情感傾向類的評論數(shù)量與所有這類評論情感傾向的評論數(shù)量的比值.
由表3可見,對于樣本中帶有有用性評價(jià)的
l
一1合理,即在線影評對電影情感評分越趨于正
向,越會(huì)被認(rèn)為有用. 模型結(jié)果分析
686個(gè)評論,電影好評的數(shù)量(1 167個(gè))遠(yuǎn)遠(yuǎn)超
過差評(347個(gè))和中評(172個(gè)),反映了不同情4.2
感傾向評論分布呈J形偏態(tài)結(jié)構(gòu),這與以往多數(shù) 研究的分析結(jié)果一致.其中,被評為有用的評論在 好評中所占的比例為64.8%,在差評中占比 29.1%,在中評中占比31.4%.可初步判斷,對傾
向于好評的評論更可能被評為有用.
評論內(nèi)容的平均觀點(diǎn)評價(jià)傾向(AvgSub)和 觀點(diǎn)評價(jià)混雜度(DevSub)存在較高的負(fù)相關(guān)關(guān) 系(一0.875),同時(shí)將這兩個(gè)變量放人模型中存
在多重共線性問題.采用逐步回歸法回歸模型,剔
除不顯著變量之后得到最終的在線評論有用性影 響因素模型,模型整體擬合以及標(biāo)準(zhǔn)化參數(shù)估計(jì)
結(jié)果見表4.為檢驗(yàn)本文模型的擬合效果是否有
考慮電影問的差異,對14個(gè)樣本電影分別進(jìn) 行了同樣的統(tǒng)計(jì),均得到類似結(jié)果.另外,考慮評 論有用性分類界值可能對結(jié)果存在影響,還以 0.6為分界值分類評論有用性,,同樣得到類似結(jié)
果.由此,從樣本數(shù)據(jù)初步統(tǒng)計(jì)分析來看,假設(shè)H1
表4
Table
4
所提高,采用本文使用的影評樣本數(shù)據(jù)對Ghose 和Ipeirotis‘61提出的模型進(jìn)行擬合(結(jié)果見表
4),對照比較兩者的估計(jì)結(jié)果.
results
本文模型和Ghose等研究模型的整體擬合以及標(biāo)準(zhǔn)化參數(shù)估計(jì)結(jié)果
for
the
Model fitness and standard eoe儂eients
studied model and Ghose’s model
本文模型:(F=103.193,,諺=0.001;R2=0.272,Adj.R2=0.269) Log(netpfl工1)h=口+盧1(Rating)kr+JB2(DevPos)kr+島(AvgSub)kr I風(fēng)(DevSub)kr+ 島(AugSubExp)kr+風(fēng)(DevSubExp)kr+島(title_AvgPos)kr+盧8(title AvgSub)h+ 島(title_AvgSubExp)kr+/3loLog(Elapseddays)kr+盧11Log(Read)kr+占b 標(biāo)準(zhǔn)化系數(shù) 估計(jì)值 t值
bl 0.46“ 20.622 b2 0.07“ 3.2 b3
I以
b5
b‘ 0.058’ 2.591
b7 0.089’’
4.Ol
bI
矗,
blo O.115”
611 0.122” 5.618
一I一
一l一
5.463
Ghose和ipeirotis模型:(F=20.189,s垃.=0.001;R2=0.035,adj.R2=0.033) Log(netpfut)b=const+盧12(Moderate)h+盧13(AvgSub)kr I盧14(DevSub)h+ 盧15Log(Elapseddays)kr+盧16Log(Read)kr+占h 標(biāo)準(zhǔn)化系數(shù) 估計(jì)值 t值
612 一0.130.. 一5.408 bn b¨ b坫 O.106” 4.393 bl‘ 0.090’’ 3.724
一I— 一l一
注:系數(shù)bi為原模型中晟的標(biāo)準(zhǔn)化系數(shù);’、”分別表不系數(shù)估計(jì)值在0.05、0.01水平上顯著;“l”表不其附近的兩個(gè)變量不能I司時(shí) 放入模型,需要分別代入模型進(jìn)行估計(jì);“一”對應(yīng)的變量為系數(shù)不顯著變量.
對于本文提出的假設(shè)模型,F檢驗(yàn)顯著,表 標(biāo)——校正的決定系數(shù)(A辦R2)為0.269;而 利用本文的影評樣本數(shù)據(jù)擬合Ghose等的研究
模型,其校正的決定系數(shù)仍然很低,僅為O. 種商品的模型總體擬合度分別為0.07和0.1). 對于體驗(yàn)型商品——電影的在線評論,與Ghose
明模型線性回歸關(guān)系成立,總體擬合指033(Ghose等研究中對視聽商品及數(shù)碼相機(jī)兩
萬方數(shù)據(jù)
第8期
郝媛嬡等:基于影評數(shù)據(jù)的在線評論有用性影響因素研究
一85一
等人研究模型相比,本文模型的總體擬合度提 高了23.6%,說明本模型對在線影評有用性的 總體解釋力明顯好于Ghose等的研究模型;另
外,兩個(gè)模型均顯示電影評論內(nèi)容的平均觀點(diǎn)
表5
Table
5
評價(jià)傾向概率(均值)和觀點(diǎn)評價(jià)與客觀描述兩
種體裁的混雜度(標(biāo)準(zhǔn)差)對評論有用性的影響 不顯著.本文模型的回歸結(jié)果對前述假設(shè)的支 持情況見表5.
模型估計(jì)結(jié)果對研究假設(shè)的支持情況
validation
results
Hypothesis
according
to
model
estimation
研究假設(shè) Ill:在線評論內(nèi)容的正負(fù)情感對評論有用性存在 影響 Hl—l:評論內(nèi)容的平均正向情感傾向?qū)υu論有用 性存在正向影響. H1—2:評論內(nèi)容的正負(fù)情感混雜度對評論有用性 存在正向影響 I-12:在線評論內(nèi)容中觀點(diǎn)句的主觀與客觀表達(dá)形 式對評論有用性存在影響
支持情況 、/
研究假設(shè) H3:在線評論內(nèi)容的客觀描述和觀點(diǎn)評價(jià)兩類體
支持情況
X
裁對評論有用性存在影響 H3—1:評論內(nèi)容的平均觀點(diǎn)評價(jià)傾向?qū)υu論有用
×
、/
性存在正向影響 H3—2:評論內(nèi)容中觀點(diǎn)評價(jià)與客觀描述的混雜度
×
、/
對評論有用性存在正向影響 114:評論標(biāo)題的正負(fù)情感傾向?qū)υu論有用性存在 部分支持 正向影響 H5:評論標(biāo)題的觀點(diǎn)評價(jià)傾向?qū)υu論有用性存在
× ×
、/
m—l:評論內(nèi)容中觀點(diǎn)句的平均主觀表達(dá)傾向?qū)?br />評論有用性存在負(fù)向影響 H2—2:評論內(nèi)容中觀點(diǎn)句的主客觀表達(dá)形式的混 雜度對評論有用性存在正向影響 V
正向影響 116:評論標(biāo)題的平均主觀表達(dá)傾向?qū)υu論有用性
×
存在負(fù)向影響
I-F/:評淪發(fā)布天數(shù)對評論有用性存在負(fù)向影響
X
I'18:評論平均句子長度對評論有用性存在影響
、/
注:“、/”表示假設(shè)關(guān)系顯著成立,假設(shè)成立;“×”表示假設(shè)不成立,包括假設(shè)關(guān)系不顯著或關(guān)系相反
在顯著影響在線影評有用性的因素中,評論 內(nèi)容的平均正負(fù)情感傾向打分(rating)影響最大
且為正向(100‘46=2.884),即評論對相應(yīng)電影的 打分越傾向于正面,該評論越可能被評為有用.這 一結(jié)果與初步分析中得到的統(tǒng)計(jì)結(jié)果一致.其次 是評論標(biāo)題的正面情感傾向?qū)υu論有用性存在正
電影總體或其中一些屬性的客觀評述,兩種表達(dá)
形式混雜度越高的評論有用性越高.對于模型中
控制變量,評論中平均句子長度(Read)對評論有
用性也存在正向影響(0.122),這一指標(biāo)在Ghose 等的研究中用來反映評論可讀性或認(rèn)知成本,與
有用性應(yīng)呈反向關(guān)系,但Ghose等對視聽播放器
和數(shù)碼相機(jī)的研究結(jié)果則與其理論假設(shè)相反,本 文同樣發(fā)現(xiàn)評論中平均各句長度(Read)對評論 有用性的影響為正向.這個(gè)結(jié)果雖然從認(rèn)知成本
向影響(10n嗍=1.253),即評論標(biāo)題越傾向于正
面肯定的態(tài)度,評論越可能被評為有用,評論標(biāo)題
往往反映了評論的整個(gè)內(nèi)容,因此評論標(biāo)題正負(fù)
情感的影響與評論內(nèi)容正負(fù)情感的影響保持一致 符合實(shí)際情況.再次,評論內(nèi)容的正負(fù)情感混雜度
及可讀性角度無法解釋,但該指標(biāo)同時(shí)可以反映 評論信息量的豐富性,平均各句較長的評論通常
為正負(fù)情感、觀點(diǎn)評價(jià)與客觀描述或主觀客觀表 達(dá)形式混合的評論,因此其有用性更高,從這個(gè)角
對評論有用性也存在顯著正向影響(10仉們= 1.175),即既有正面評價(jià)又有負(fù)面評價(jià),且正負(fù)
評價(jià)混雜度越高的評論越有用,這類評論往往反
度看結(jié)果合理.評論發(fā)布天數(shù)也顯著正向影響評
論有用性(0.1 15),評論發(fā)布天數(shù)越長,評論越可
映了評論者觀點(diǎn)的客觀性,因此更會(huì)被評論閱讀
者賦予更高權(quán)重.另外,評論中觀點(diǎn)句的主觀與客
能是有用的,與假設(shè)相反.這一結(jié)果的可能的解釋 是:在電影發(fā)布初期,一些電影發(fā)燒友憑借很少的 參考信息和自己的經(jīng)驗(yàn)判斷選擇觀看該電影,結(jié)
果因?yàn)橘|(zhì)量確實(shí)不好或者不符合自己的口味,很
觀表達(dá)形式的混雜度也對評論有用性存在顯著正
向影響(10n嘲=1.143),即評論內(nèi)容中觀點(diǎn)句的 表達(dá)方式既有個(gè)人主觀色彩較濃的評價(jià),又有對
萬方數(shù)據(jù)
一86一
管理科學(xué)學(xué)報(bào)
裹6
Table 6
2010年8月
預(yù)測效果評估列聯(lián)表
Forecasting
多人不滿而歸,并向他人傳播負(fù)向口碑;而后來跟 進(jìn)者往往較為理性,會(huì)根據(jù)網(wǎng)上或其他來源迅速 積累起來的豐富內(nèi)容的評論等信息來做出是否觀 看的決策,因此,后來跟進(jìn)者看電影后好評率可能 更高.對于評論發(fā)布天數(shù)與評論有用性的關(guān)系還 有待進(jìn)一步證實(shí).
5
預(yù)測為有用 的評論數(shù) 預(yù)測為無用
result evaluation
實(shí)際被評為有用 的評論數(shù)
實(shí)際被評為沒用 的評論數(shù)
403(A)
32(剮
基于影響因素模型的評論有用性 分類預(yù)測
為測試上述提出的模型對在線影評有用性的
的評論數(shù)
316(C)
57(D)
其中,有用評論的查準(zhǔn)率
PM醛加n
分類預(yù)測能力,在Yahoo!Movies網(wǎng)站上隨機(jī)選取
除14個(gè)電影樣本之外其他電影的808個(gè)在線影評
..
2丁而
^
A
有用評論的查全率
艦以b南
綜合指數(shù)
數(shù)據(jù)用于評論是否有用的預(yù)測.分類預(yù)測主要步
驟為:
首先,對待預(yù)測評論樣本的有用性進(jìn)行人工 標(biāo)注.參考Ghose和Ipeirotis【6 o的方法,我們雇用 兩名編碼員對這808個(gè)電影評論預(yù)測樣本進(jìn)行有 用/沒用的分類.然后,采用kappa統(tǒng)計(jì)指標(biāo)衡量 兩個(gè)編碼員分類結(jié)果的內(nèi)部評論者一致性
(inter-rater agreement).算得Kappa系數(shù)Ⅲ】=
,一胱∞岍2—T———T—
一
2
p—reci—sion+忑孤
為查準(zhǔn)率及查全率的調(diào)和平均數(shù). 根據(jù)以上公式計(jì)算出:有用評論的查準(zhǔn)率= 92.“%,查全率=56.05%,綜合指數(shù)= 69.84%.這3個(gè)指標(biāo)值說明,本文模型盡管對評 論有用性比例的總體擬合較低,但對在線影評是
否有用的二分類預(yù)測仍具有較強(qiáng)的判別能力.
(實(shí)際一致率一理論一致率)/(1一理論一致率)
=0.76,表明兩個(gè)編碼員對評論樣本的感知和理 解一致性良好.
其次,確定評論有用性比例與評論是否有用 的對應(yīng)關(guān)系,即需要確定一個(gè)合適的分界值按評 論有用性比例將評論分為有用/沒用兩類.結(jié)果 顯示,如果確定分界值為O.5,則分類錯(cuò)誤率最
。虼耍杏眯员壤荆剑埃档脑u論被分類為
6
結(jié)束語
互聯(lián)網(wǎng)上日益豐富的商品評論信息為人們的
決策提供了更多參考,然而其中充斥的大量良莠 不齊的評論也給消費(fèi)者帶來了困惑,降低了決策 效率和效果.評論有用性評價(jià)信息需要長期積累 才能真正發(fā)揮作用限制了其實(shí)際應(yīng)用效果,因此, 在評論發(fā)布后挖掘文本特征,并通過這些文本特
征幫助評論閱讀者及時(shí)地識別評論有用性成為迫 切需要解決的問題.而目前,旨在解決此問題的研
“有用”,而有用性<0.5的評論被分類為“無
用”.
最后,分類預(yù)測評論有用性及評估預(yù)測效果.
預(yù)測過程如下:將808個(gè)預(yù)測評論樣本利用本文
提出的模型求得評論有用性比例,并根據(jù)上面確 定的有用性分界值將預(yù)測結(jié)果分為“有用”和“沒 用”兩類,然后將模型分類預(yù)測的結(jié)果與人工分 類結(jié)果做比較.此部分的預(yù)測任務(wù)為判斷在線評 論是否有用,為二值分類,借助二維列聯(lián)表
(contingency table)計(jì)算查準(zhǔn)率、查全率及兩者
究仍很缺乏.本文以體驗(yàn)型商品——電影的在線 評論為研究對象,從消費(fèi)者角度出發(fā),以為評論閱 讀者及時(shí)提供評論有用性信息為目標(biāo),結(jié)合文本 挖掘技術(shù)與實(shí)證研究方法,建立了在線評論有用
性的影響因素模型,并用于評論有用性的分類 預(yù)測.
合成的綜合指數(shù),以此來評估模型的預(yù)測效果
(見表6).
本文將評論有用性的研究擴(kuò)展到體驗(yàn)型商
萬方數(shù)據(jù)
第8期
郝媛嬡等:基于影評數(shù)據(jù)的在線評論有用性影響因素研究
一87一
品領(lǐng)域;另外,除借鑒其他相關(guān)研究中涉及的文
本主客觀體裁等特征之外,本文還考察了評論
對在線影評是否有用具有較強(qiáng)的判別能力.從實(shí) 際應(yīng)用的角度,本研究可幫助評論網(wǎng)站設(shè)計(jì)者根 據(jù)評論文本特征對評論是否有用進(jìn)行及時(shí)和自動(dòng)
文本的平均正負(fù)情感傾向及混雜度、平均評論
文本觀點(diǎn)句中主客觀表達(dá)傾向及混雜度等文本 特征對評論有用性的影響,并區(qū)分了評論文本 中評論標(biāo)題和評論內(nèi)容對評論有用性的影響. 對體驗(yàn)型商品電影數(shù)據(jù)的實(shí)證檢驗(yàn)結(jié)果表明, 與現(xiàn)有相關(guān)研究相比,本文提出的在線評論有
的識別,將有用評論靠前放置,方便消費(fèi)者閱讀, 從而幫助其提高決策效率和效果. 本文尚有一些不足有待改進(jìn):1)由于數(shù)據(jù)收 集和處理的限制,本文僅選取了一種體驗(yàn)型商品 電影作為研究對象,文中結(jié)論對其他體驗(yàn)型商品
的適用性還有待進(jìn)一步檢驗(yàn),這將是作者未來研
用性影響因素模型總體解釋力有較大提高.本
文得到的重要結(jié)論有:對于電影,1)評論的正 負(fù)情感傾向這個(gè)文本特征對評論有用性影響較
究的重要內(nèi)容.2)對于體驗(yàn)型和搜索型兩類商 品,評論文本特征對評論有用性的影響可能存在
很大差異,進(jìn)一步研究兩者間影響的差異性,并進(jìn)
大,其中,標(biāo)題和內(nèi)容的情感傾向趨于正面的評 論的有用性更高;另外,評論內(nèi)容中既有正向評 價(jià)又有負(fù)向評價(jià),正負(fù)情感混雜度越高的評論
有用性越高.2)在線評論觀點(diǎn)句中既有主觀表 達(dá)形式又有客觀表達(dá)形式,主客觀表達(dá)形式混 雜度越高的評論有用性越高. 另外,本文還應(yīng)用所提出的在線評論有用性 影響因素模型,對在線影評有用性的分類預(yù)測能
一步擴(kuò)展兩類商品評論文本特征對消費(fèi)者認(rèn)知影 響的理論,具有更大價(jià)值;3)盡管本文模型的總 體擬合度有所提高,但仍低于0.5,說明還有一些
影響評論有用性的重要變量未納入到模型中,比 如除評論文本特征之外,反映評論者質(zhì)量的一些
特征因素可能也會(huì)影響評論有用性,需要進(jìn)一步 挖掘影響評論有用性的其他重要因素,以提高預(yù)
測的準(zhǔn)確性.
力做了進(jìn)一步的測試.結(jié)果表明,本文提出的模型
參考文獻(xiàn):
[1]Anderson [2]Katz
E
W.Customer satisfaction and word ofmouth[J].Journal ofService Research,1998,l(1):5一17. F.Lazarsfeld,Personal Influence:The Part Played by People in the Flow of Mass Communications[M].New
E,Paul
York:Free Press,1955.
[3]Arndt J.Role ofproduct—related (3):291—295. [4]Chevalier J
A,Mayzlin
conversations in
the diffusion ofa
new
product[J].Journal of
Marketing
Research,1967,4
D.The effect of word of mouth
on
sales:Online book reviews[J].Journal of Marketing Research
(JMR),2006,43(3):345—354. [5]Harrison.Walker
commitment
a8
L
J.The
measurement of
word—of-mouth communication and an investigation of service qualit),and customer
of
potential
antecedents[J].Journal
Service Research,2001,4(1):60.
[6]Ghose
A,Ipeirotis P
G.Designing Novel Review Ranking Systems:Predicting the Usefulness and Impact of Reviews[C].
on
Proceedings
of the ninth international conference
Electronic commerce,New
York,NY,USA:Association Computing Ma-
chinery(ACM)。2007:303—310. [7]張強(qiáng),李乃和.網(wǎng)絡(luò)口碑研究現(xiàn)狀及未來發(fā)展初探[J].江西農(nóng)業(yè)學(xué)報(bào),2008,20(4):147—149.
Zhang
Qiang.Li Nai-he.The
initial exploration on the present
and future of studies about online word-of-mouth[J].Journal
of Jiang Xi A咖culture,2008,20(4):147—149.(in Chinese)
[8]張瑩,孫明貴.西方網(wǎng)絡(luò)口碑傳播效應(yīng)研究進(jìn)展[J].財(cái)貿(mào)研究,2008,(05):109—115.
Zhang Ying,Sun
Ming—gni.Review
of online
word?of-mouth communication[J].Financial and Trade research,2008,19
(05):109一115.(in Chinese) [9]李實(shí),葉強(qiáng),李一軍,等.挖掘中文網(wǎng)絡(luò)客戶評論中的產(chǎn)品特征方法研究[J].管理科學(xué)學(xué)報(bào),2009,12(2):
142—152. Li Shi,Ye
Qiang,Li Yi-jun,et a1.Mining features
ofproducts from Chinese customer online
reviews[J].Journal of Man-
agement Sciences in
China,2009,12(2):142—152.(in Cllinese)
萬方數(shù)據(jù)
一88一
管理科學(xué)學(xué)報(bào)
2010年8月
[10]劉建新,陳雪陽.口碑傳播的形成機(jī)理與口碑營銷[J].財(cái)經(jīng)論叢,2007,(05):96—102.
Liu
on
Jian-xin,Chen Xue—yang.The mechanism of word?of-mouth
Finance
communication
and WOM marketing[J].Collected Essays
and Economics,2007,(05):96—102.(in Chinese)
[11]陳明亮,章晶晶.網(wǎng)絡(luò)口碑再傳播意愿影響因素的實(shí)證研究[J].浙江大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2008,38(5):
127—135.
Chen Ming—liang,Zhang Jing-jing.An experimental regeal'ch
on
the
determinants of re?diffusion iIntention of online word?of-
mouth[J].Journal ofZhejiang Univemity(Humanities
and
Social Sciences),2008,38(5):127—135.(in Chinese)
[12]李純青,趙平,馬軍平.零售業(yè)回報(bào)計(jì)劃感知價(jià)值對客戶忠誠的影響[J],管理科學(xué)學(xué)報(bào),2007,10(4):90
—97. Li
Chum-qing,Zhan
Ping,Ma
Jun-ping.Impact of the value perception of the reward programs
on
customer
loyalty[J].
Journal of Management Sciences in China,2007,10(4):90—97.(in Chinese)
[13]陳蓓蕾.基于網(wǎng)絡(luò)和信任理論的消費(fèi)者在線口碑傳播實(shí)證研究[D].杭州:浙江大學(xué),2008.
Chen Bei?lei.An Empirical Study
on
Consumer
Online Word—of-Mouth Communication based
on
Web and Trust
Theory
[D].Hangzhou:Zhejiang University,2008.(in Chinese) [14]郭國慶,楊學(xué)成,張楊.口碑傳播對消費(fèi)者態(tài)度的影響:一個(gè)理論模型[J].管理評論,2007,19(3):20—26.
Guo Guo-qing,Yang Xue?eheng,Zhang Yang.The impact of word-of-mouth
on
consumer’s attitude:A theoretical
model
[J].Management Review,2007,19(3):20一26.(in Chinese) [15]金立。W(wǎng)絡(luò)口碑信息對消費(fèi)者購買決策的影響:一個(gè)實(shí)驗(yàn)研究[J].經(jīng)濟(jì)管理,2007,29(22):36—42.
Jin
Li-yin.The
effects of online
WOM information
on
consumer purchase decision:An
experimental study[J].Economic
Management,2007,29(22):36—42.(in Chinese) [16]鄭小平.在線評論對網(wǎng)絡(luò)消費(fèi)者購買決策影響的實(shí)證研究[D].北京:中國人民大學(xué),2008. Zheng
Xiao—ping.An Empirical Study About the Effect of Online of
Reviews
on
Online Consumer Decision Making[D].Bei-
jing:Renmin University
China,2008.(in Chinese)
[17]郭小釵,陳蓓蕾.在線口碑效應(yīng)的影響因素實(shí)證研究[J].北京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2009,ll(2):31
—35. Guo
Xiac-thai,Chen Bei?lei.Determinants ofwom effects in virtual community:An empirical analysis[J].Journal of Bei-
Institute of
jing
Technology(Social Sciences Edition),2009,11(2):31—35.(in Chinese)
reviews in forecasting sales?The
case
[18]Dellarocas
F.Exploring the value of online product pictures[J].Journal of Interactive Marketing,2007,21(4):23-45.
and
C,zllang X Q,Awad N
of motion
[19]Skowronskij,Carlston D.Negativity
ical
extremity biases in impression formation:A review of explanations[J].Psycholog-
Bulletin,1989,105(I):131—142.
R,Burnkrant R E,Unnava H of Marketing
[20]Ahluwalia
R.Consumer response
to
negative
publicity:The
moderating role of commitment
[J].Journal
[21]Sen S,Leman
D.腳are
of
Research,2000,37(2):203—214.
you telling me
this?An examination into negative consumer reviews
on
the
web[J].Journal
of
Interactive Marketing,2007,21(4):76—94.
[22]Adaval
R.Sometimes it
jnst feels fight:The
differential
weighting
of
affect—consistent and affect?inconsistent product infor-
mation[J].Journal [23]Strahilevitz
trying
to
Consumer Research,2001,28(1):1—17. J G.Donations
ofConsumer
to
M,Myers
charity鷦purchase incentives:Row well they work may depend
on
what you
are
sell[J].Journal
Research,1998,24(4):434—446.
on
[24]Mort
G S,Rose of
T.The
effect of product type
value
linkages in the means?end chain:Implications for theory and method
[J].Journal [25]Duhan
D
Consumer Behaviour,2004,3(3):221—234.
on
F,Johnson S D,Wilcox J B,et a1.influences
consumer
use
of
word—of-mouth recommendation 80nrce8[J].
Journal of the Academy of Marketing Science,1997,25(4):283—295.
[26]Pang
B,Lee L.A
Sentimental Education:Sentiment Analysis Using Subjectivity Summarization Based
of
Oil
Minimum Cuts
[c].Proceedings
the 42nd Annual Meeting of the Association for Computational Linguistics(ACL),Morristown,NJ, Linguistics,2004,271—278.
USA:Association for Computational
[27]Nelson P.Advertising
as
information[J].Journal ofPolitical Economy,1974,82(4):729—754. (下轉(zhuǎn)第96頁)
萬方數(shù)據(jù)
一96一
[9]Armington P.A theory of
159—178. demand for products
管理科學(xué)學(xué)報(bào)
2010年8月
distinguished by place of production[J].IMF Staff Paper,1969,(16):
[10]Krugman
P.Increasing
returns
and economic geography[J].Journal of Political Economics,1991,(99):483—499.
returns to
[1 1]Ethier W.National
and international
scale in
the modem theory of international trade[J].American Economic
Review,1982,(72):950—959.
Analysis of economic development trend of labor interregional migration
YANG Zhong—zhi,YAO Lin—m,LI Li
Antai School of Economics and Management,Shanghai Jiaotong University,Shanghai 200052,China
Abstract:With yearly large—scale labor interregional migration,the regional disparity between the coastal area
and hinterland is enlarging in China.In order to analyze this phenomenon,this paper analyzes the effect of la- bor
interregional
migration by applying
a
general model based
on
discussion of the mechanism of industry ag-
glomeration.The results of model simulation show that,when considering the friction factors of labor interre- gional migration,both the industrial agglomeration effect and labor interregional migration increasing. Key words:labor migration;industrial agglomeration tion
regional
disparity would enlarge with the rate of
effect;regional disparity;equilibrium
model;simula—
(上接第88頁) [28]SAS
Institute Inc.sAs/STAT
Software:Changes and Enhancements.Through Release 6.11[C].North Carolina:SAS In.
stitute
Inc,1996,221—230.
Research
on
online impact factors of customer reviews usefulness based
on
movie reviews data
HAO Yuan—yuan,YE
Qiang,LI甄乒n
School of Management,Harbin Institute of Technology,Harbin 150001,China
Abstract:Taking movie’S online customer reviews
as
the
subject,using
text
mining and empirical research
a
methods,from the viewpoint of text features of online reviews,this paper establishes
model of the online
re一
、riews impact factors and forecast reviews usefulness using this model.Compared with related researches.the
explanation
power of
our
model increases significantly,and we find
that,positive
attitude,high mixture of
positive and negative attitudes,high mixture of
tences
our
subjective
and
objective
expression forms and
average
sen—
length have
a
significantly positive
impact
on
reviews usefulness.Finally,our forecasting result shows that
model has
strong power to discriminate usefulness of online movie reviews. reviews;usefulness;text features;positive expression;text mining
key
words:word—of-mouth;online tude;subjective
and
and
negative sentimental atti-
objective
萬方數(shù)據(jù)
本文關(guān)鍵詞:基于影評數(shù)據(jù)的在線評論有用性影響因素研究,由筆耕文化傳播整理發(fā)布。
本文編號:205516
本文鏈接:http://sikaile.net/jingjilunwen/xxjj/205516.html