基于影評(píng)數(shù)據(jù)的在線評(píng)論有用性影響因素研究
本文關(guān)鍵詞:基于影評(píng)數(shù)據(jù)的在線評(píng)論有用性影響因素研究,由筆耕文化傳播整理發(fā)布。
第13卷第8期 2010年8月
管理科學(xué)學(xué)報(bào)
JOURNAL OF MANAGEMENT SCIENCES IN CmNA
V01.13 No.8 Aug.2010
基于影評(píng)數(shù)據(jù)的在線評(píng)論有用性影響因素研究①
郝媛媛,葉強(qiáng),李一軍
(哈爾濱工業(yè)大學(xué)管理學(xué)院,哈爾濱150001)
摘要:面對(duì)互聯(lián)網(wǎng)上海量的在線客戶評(píng)論,如何能快速有效地進(jìn)行識(shí)別和選擇從而發(fā)現(xiàn)和利 用其中有用的評(píng)論,已經(jīng)成為人們關(guān)注的重要問(wèn)題.以體驗(yàn)型商品電影的在線評(píng)論為研究對(duì) 象,結(jié)合文本挖掘技術(shù)和實(shí)證研究方法,從文本特征出發(fā)探索影響在線評(píng)論有用性的因素,建 立在線評(píng)論有用性影響因素模型,并利用該模型對(duì)評(píng)論有用性進(jìn)行分類預(yù)測(cè).與現(xiàn)有相關(guān)研究 相比,提出的模型總體擬合效果顯著提高,并發(fā)現(xiàn)在線影評(píng)中積極的情感傾向、較高的正負(fù)情 感混雜度、較高的主客觀表達(dá)混雜度以及較長(zhǎng)的平均各句長(zhǎng)度,對(duì)評(píng)論的有用性具有顯著的正 面影響.最后預(yù)測(cè)結(jié)果表明,該模型對(duì)在線影評(píng)的有用性具有較強(qiáng)的判別能力. 關(guān)鍵詞:口碑;在線評(píng)論;有用性;文本特征;正負(fù)情感;主客觀表達(dá)形式;文本挖掘
中圖分類號(hào):F713.55 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007—9807(2010)08—0078一ll
0
引
言
息搜索成本.盡管如此,評(píng)論文本信息仍然是人們 決策的重要參考源,很多評(píng)論閱讀者仍需通過(guò)查 看評(píng)論文本來(lái)了解產(chǎn)品好壞的具體方面,如對(duì)
Yahoo。停铮觯椋澹缶W(wǎng)站(movies.yahoo.eom)上影評(píng)
口碑(word-of-mouth)是個(gè)體間關(guān)于產(chǎn)品或服 務(wù)看法的非正式傳播方式….消費(fèi)者行為及營(yíng)銷 領(lǐng)域的眾多研究u一1均表明,口碑傳播對(duì)消除購(gòu) 買(mǎi)者的不確定性,輔助其做出有效決策具有重要 作用(特別是在體驗(yàn)型商品購(gòu)買(mǎi)決策過(guò)程中).現(xiàn) 今,互聯(lián)網(wǎng)強(qiáng)大的信息存儲(chǔ)和搜索功能為口碑的 交流提供了極大的方便,更多人在網(wǎng)上論壇、聊天 室、博客和專門(mén)的商品評(píng)論網(wǎng)站等網(wǎng)絡(luò)空間發(fā)表 和共享有關(guān)商品的評(píng)論,為消費(fèi)者提供了豐富的 決策參考信息(特別是專門(mén)的商品評(píng)論網(wǎng)站上展
示了更為集中和全面的商品評(píng)論,本文的研究即
有用性評(píng)價(jià)信息的統(tǒng)計(jì)結(jié)果顯示:對(duì)于多數(shù)電影, 其所有評(píng)論中平均至少有52%的評(píng)論的文本被 閱讀過(guò).在線評(píng)論的文本內(nèi)容可長(zhǎng)期存儲(chǔ)并累積 下來(lái),可為人們提供海量的信息資源,但并非所有 評(píng)論都有價(jià)值,由于網(wǎng)絡(luò)的匿名性、非面對(duì)面地接 觸、溝通成本低廉等特征¨J,評(píng)論的質(zhì)量往往良 莠不齊,一些評(píng)論者會(huì)不負(fù)責(zé)地隨意發(fā)表評(píng)論.評(píng) 論信息的過(guò)載及其質(zhì)量的參差不齊嚴(yán)重干擾了評(píng) 論閱讀者對(duì)商品質(zhì)量的有效判斷,增加了信息搜 索成本,降低了決策效率.因此,及時(shí)有效地識(shí)別 在線評(píng)論文本中有價(jià)值的信息對(duì)提高消費(fèi)者的決 策效率和效果至關(guān)重要.目前,一些網(wǎng)站提供評(píng)論 的有用性評(píng)價(jià)信息來(lái)幫助評(píng)論閱讀者識(shí)別評(píng)論的 價(jià)值.但該指標(biāo)需要長(zhǎng)時(shí)間累積,無(wú)法及時(shí)提供最 新發(fā)布的評(píng)論的有用性信息,應(yīng)用效果欠佳[6].
主要針對(duì)這類在線評(píng)論).但與此同時(shí),也帶來(lái)了 信息大爆炸時(shí)代的普遍問(wèn)題:面對(duì)海量評(píng)論,評(píng)論 閱讀者可能“迷失”其中,無(wú)法有效識(shí)別和利用其 中有價(jià)值的信息來(lái)判斷商品的真實(shí)質(zhì)量.
針對(duì)這個(gè)問(wèn)題,一些評(píng)論網(wǎng)站提供評(píng)論者對(duì)
商品總體評(píng)分的信息,以幫助人們無(wú)需閱讀評(píng)論 文本即可了解評(píng)論者對(duì)商品的總體評(píng)價(jià),降低信
①收稿日期:2008—10—13;修訂日期:2009—07—15.
基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(70771032;70890080—70890082)
作者簡(jiǎn)介:郝媛媛(198l一),女,黑龍江哈爾濱人,博士生.Email:haoyy0112@163.咖
萬(wàn)方數(shù)據(jù)
第8期
郝媛嬡等:基于影評(píng)數(shù)據(jù)的在線評(píng)論有用性影響因素研究
一79一
因此,有必要從評(píng)論的文本特征出發(fā),挖掘影響在
指出,人們更傾向于發(fā)表或關(guān)注極端評(píng)論而不是 中間評(píng)論,因?yàn)閷?duì)產(chǎn)品極端正向或負(fù)向的體驗(yàn)更 容易引發(fā)口碑交流行為.Ghose和Ipeirotis¨1在研
究中設(shè)置了啞變量來(lái)考察極端評(píng)論與中間評(píng)論對(duì) 評(píng)論有用性影響的差異,結(jié)果發(fā)現(xiàn)極端評(píng)論的有 用性評(píng)價(jià)高于中間評(píng)論.另外一些學(xué)者進(jìn)一步認(rèn) 為極端評(píng)論中正向評(píng)論與負(fù)向評(píng)論的影響亦存在
線評(píng)論有用性的重要特征,以實(shí)現(xiàn)在評(píng)論發(fā)布后 即能自動(dòng)識(shí)別評(píng)論有用性.
目前,盡管文本挖掘技術(shù)的重大進(jìn)展使文本
中情感特征的自動(dòng)識(shí)別成為可能,但將文本挖掘 技術(shù)和基于理論的實(shí)證研究相結(jié)合,從文本特征 角度探索在線評(píng)論有用性影響因素的研究較為缺 乏.國(guó)內(nèi)研究的重點(diǎn)主要集中在對(duì)網(wǎng)絡(luò)口碑的研 究現(xiàn)狀進(jìn)行綜述(如文獻(xiàn)[7—8]),或研究網(wǎng)絡(luò)口 碑文本挖掘技術(shù)(如文獻(xiàn)[9]),或探討口碑傳播 的內(nèi)在機(jī)制及傳播意愿(如文獻(xiàn)[10—13]),或從
商家視角探索網(wǎng)絡(luò)口碑與口碑效應(yīng)或購(gòu)買(mǎi)意愿的
差異.在傳統(tǒng)口碑傳播的研究中,很多學(xué)者曾指出
負(fù)向口碑比正向口碑更影響人們的決策,并運(yùn)用
不同理論解釋人們更關(guān)注負(fù)向口碑的原因:如心 理學(xué)領(lǐng)域有關(guān)印象形成的研究¨列發(fā)現(xiàn),人們?cè)趯?duì)
某一對(duì)象進(jìn)行評(píng)價(jià)的心理過(guò)程中,會(huì)對(duì)有關(guān)被評(píng)
關(guān)系(如文獻(xiàn)[14—17]),而從客戶角度探討什么 樣的評(píng)論對(duì)消費(fèi)者決策更有幫助的研究基本空白.
而國(guó)外這類研究剛剛起步,Ghose和Ipeirotis【6J初探 性的研究主要針對(duì)搜索型商品(如視聽(tīng)播放器、
價(jià)對(duì)象的負(fù)面信息賦予高于正面信息的權(quán)重,這 是因?yàn)槿藗冊(cè)诿鎸?duì)正面和負(fù)面消息或事件時(shí)的反
應(yīng)強(qiáng)度是不同的,負(fù)面消息給人們的心理喚醒、注
意、情緒、評(píng)價(jià)、歸因以及社會(huì)行動(dòng)等反應(yīng)所造成 的刺激都要強(qiáng)于正面信息.在營(yíng)銷領(lǐng)域,Ahluwalia 等啪1發(fā)現(xiàn),消費(fèi)者通常會(huì)認(rèn)為負(fù)面信息比正面 信息更具診斷價(jià)值,因而在購(gòu)買(mǎi)決策時(shí)更多地依 賴負(fù)面信息.而近年,比較不同類別商品正負(fù)面口
碑影響的一些研究則得出相反的結(jié)論,如Sen和
數(shù)碼相機(jī)等),分析評(píng)論的主客觀傾向及主客觀 混雜度對(duì)商品評(píng)論有用性的影響.盡管Ghose等 做出了有益嘗試,但仍存在以下問(wèn)題:1)仍有影 響評(píng)論有用性的重要因素未納入到模型中,這影 響了模型預(yù)測(cè)力的提高.2)模型中僅將評(píng)論正負(fù) 情感傾向分為極端評(píng)論與中間評(píng)論兩類進(jìn)行考 察,而未進(jìn)一步分離并考察極端評(píng)論中正面和負(fù) 面情感對(duì)評(píng)論有用性的影響是否存在差異.3)僅
研究了搜索型商品在線評(píng)論的有用性,研究成果
Lerman¨川對(duì)體驗(yàn)享樂(lè)型和實(shí)用性兩類商品的實(shí) 證結(jié)果表明在線評(píng)論的不同情感傾向?qū)υu(píng)論有用
性的影響確實(shí)存在差異,不過(guò)是正向評(píng)論的影響
更大,且對(duì)于體驗(yàn)享樂(lè)型商品,其負(fù)向評(píng)論的有用 性要低于實(shí)用型商品.一些理論支持了體驗(yàn)型商
品負(fù)向評(píng)論影響不大的結(jié)論:如Adaval瞄。提出了
是否可推廣至體驗(yàn)型商品有待驗(yàn)證.
因此,基于現(xiàn)實(shí)中對(duì)及時(shí)有效地識(shí)別在線評(píng)
論有用性的迫切需要,在Ghose等已有研究基礎(chǔ) 上,本文以體驗(yàn)型商品——電影為研究對(duì)象,進(jìn)一 步考察正面和負(fù)面情感對(duì)評(píng)論有用性影響的差 異,并發(fā)掘影響評(píng)論有用性的其他重要文本特征 因素,建立擬合度更高的評(píng)論有用性影響因素模
型,幫助消費(fèi)者更準(zhǔn)確及時(shí)地識(shí)別評(píng)論有用性,提
情感一致性理論,他發(fā)現(xiàn),當(dāng)潛在消費(fèi)者評(píng)判商品 的體驗(yàn)屬性時(shí),往往對(duì)與自己心情一致的屬性信
息給予更大權(quán)重.當(dāng)消費(fèi)者閱讀體驗(yàn)型商品的評(píng)
論時(shí)往往懷著正向的預(yù)期和心情(希望選擇一種 使其心情愉悅的商品),而負(fù)向評(píng)論與消費(fèi)者當(dāng)
時(shí)正向的心理預(yù)期恰恰相反,因此負(fù)向信息對(duì)消
高決策效率和效果.
費(fèi)者決策的影響被降低.另一種從決策過(guò)程角度
出發(fā)的解釋是,實(shí)用型商品購(gòu)買(mǎi)的主要目標(biāo)是效
理論基礎(chǔ)及假設(shè)的提出
1.1評(píng)論的正負(fù)情感與評(píng)論有用性 一些學(xué)者的研究表明評(píng)論的正負(fù)情感影響著
用最大化舊J,而用于效用判斷的商品屬性標(biāo)準(zhǔn)都
是明確、可感知、客觀的,因此人們可以依賴已消
費(fèi)者的口碑反饋來(lái)了解商品的這些屬性;而對(duì)體 驗(yàn)型商品的評(píng)價(jià)則復(fù)雜得多,消費(fèi)者追求的目標(biāo) 是對(duì)獲得某種更高層次價(jià)值的預(yù)期的最大化ⅢJ, 實(shí)現(xiàn)何種價(jià)值以及對(duì)價(jià)值的預(yù)期在個(gè)體消費(fèi)者之 間存在重大差異,很難有公認(rèn)的判別標(biāo)準(zhǔn).既然一
消費(fèi)者對(duì)評(píng)論價(jià)值的感知,不同正負(fù)情感的評(píng)論 發(fā)表的比例和受關(guān)注的程度均可能存在差異,從
而導(dǎo)致評(píng)論有用性存在差異.如Dellarocas等…1
萬(wàn)方數(shù)據(jù)
一80一
管理科學(xué)學(xué)報(bào)
2010年8月
些人對(duì)體驗(yàn)型商品的負(fù)向評(píng)價(jià)不一定被其他閱讀 者認(rèn)可,而評(píng)論閱讀者對(duì)這類商品的預(yù)期往往又 傾向于正面,因此,對(duì)于體驗(yàn)型商品,負(fù)向評(píng)論對(duì) 人們決策的參考價(jià)值被減弱.Sen和Lerman悼刈基
于歸因理論(attribution theory),從評(píng)論者發(fā)表評(píng)
Duhan等的定義,將評(píng)論的觀點(diǎn)句中客觀表達(dá)形 式的句子(簡(jiǎn)稱objective expression)定義為:一般 以陳述的語(yǔ)句,采用第3人稱語(yǔ)氣,客觀地評(píng)述商 品總體或其各屬性特征,這類評(píng)論句的表達(dá)通常 與影評(píng)專家影評(píng)的表達(dá)形式相近,例如,“The
animation has improved quite lady realistic to
were
a
論的動(dòng)機(jī)的角度解釋和驗(yàn)證了關(guān)于體驗(yàn)型商品的 負(fù)向評(píng)論影響減弱的原因:對(duì)于體驗(yàn)型商品,消費(fèi) 者更傾向于把評(píng)論者發(fā)表負(fù)向評(píng)論的動(dòng)機(jī)歸因于 與個(gè)人相關(guān)而非與商品本質(zhì)相關(guān),因而認(rèn)為負(fù)向 評(píng)論缺乏可信性.借鑒Ghose和Ipeirotis舊。對(duì)所研 究的評(píng)論文本特征選擇了平均值(反映特征傾向 的集中趨勢(shì))和標(biāo)準(zhǔn)差(反映特征的混雜程度)兩 個(gè)指標(biāo),本文也同時(shí)考察各文本特征的均值及標(biāo) 準(zhǔn)差對(duì)有用性的影響,其中,評(píng)論正負(fù)情感混雜度 可能正向反映評(píng)論的客觀性,因此預(yù)期該指標(biāo)對(duì) 評(píng)論有用性的影響為正.綜合以上理論闡述,提出
假設(shè)H1.
lot and is spectacu—
watch.The
music and sound effects
also buzzing with delightful
energy.”.而評(píng)論
的觀點(diǎn)句中主觀形式表達(dá)的句子(簡(jiǎn)稱subjective expression)定義為:除客觀表達(dá)形式之外的通常 采用第1人稱語(yǔ)氣,帶有很強(qiáng)個(gè)人主觀色彩的觀 點(diǎn)評(píng)述,例如“For
We
children with
no
US,ICE AGE2 is
a
greatest film.
love Sid with big eyes!”。“terrible.even small understanding of what poor acting is if poorly
will think this movie
acted.”.如前所述,
特別是對(duì)于體驗(yàn)型商品,每個(gè)人的觀點(diǎn)可能千差 萬(wàn)別,個(gè)人觀點(diǎn)不一定被其他評(píng)論閱讀者接受.而 如果以較為中立的口氣來(lái)客觀評(píng)述電影各個(gè)方面
的好壞,要比試圖將主觀情感好惡強(qiáng)加于人要更
H1在線評(píng)論內(nèi)容的正負(fù)情感對(duì)評(píng)論有用 性存在影響.其中: H1—1評(píng)論內(nèi)容的平均正向情感傾向?qū)υu(píng) 論有用性存在正向影響.(即評(píng)論的正向情感傾 向越大,評(píng)論的有用性越高). HI一2評(píng)論內(nèi)容的正負(fù)情感混雜度對(duì)評(píng)論 有用性存在正向影響.
1.2評(píng)論中觀點(diǎn)的表達(dá)形式與評(píng)論有用性 對(duì)采集的在線影評(píng)數(shù)據(jù)的文本特征進(jìn)一步分 析發(fā)現(xiàn),在評(píng)論中,觀點(diǎn)評(píng)價(jià)的內(nèi)容在表達(dá)形式上
具有說(shuō)服力.另外,評(píng)論表達(dá)形式的混雜度同樣可 能正向反映評(píng)論的客觀性.因此,本文提出以下假 設(shè)H2.
H2在線評(píng)論內(nèi)容中觀點(diǎn)句的主觀與客觀
表達(dá)形式對(duì)評(píng)論有用性存在影響.其中: 112—1評(píng)論內(nèi)容中觀點(diǎn)句的平均主觀表達(dá) 傾向?qū)υu(píng)論有用性存在負(fù)向影響.(即評(píng)論主觀 表達(dá)的傾向越大,評(píng)論有用性越低). H2-2評(píng)論內(nèi)容中觀點(diǎn)句的主客觀表達(dá)形 式的混雜度對(duì)評(píng)論有用性存在正向影響.
1.3評(píng)論的體裁與評(píng)論有用性
也存在很大差別,有用性較高的評(píng)論中采用客觀 形式表達(dá)的句子更多,觀點(diǎn)句的主觀與客觀表達(dá) 形式對(duì)評(píng)論的有用性的影響可能存在差異.營(yíng)銷 領(lǐng)域中,Duhan等Ⅲ1曾對(duì)口碑的主客觀表達(dá)形式 相關(guān)概念做過(guò)相應(yīng)的界定,他們將口碑分為“小
fective
在機(jī)器語(yǔ)言學(xué)習(xí)研究領(lǐng)域,Pang和LeeⅢo從 評(píng)論文本體裁的角度將文本內(nèi)容分為客觀 (objectivity)和主觀(subjectivity)兩類,并提出了 識(shí)別這兩類文本內(nèi)容的機(jī)器自動(dòng)分類技術(shù).其中, 客觀的文本內(nèi)容被定義為:評(píng)論者對(duì)商品特征或 屬性做出的與商家描述一致或不一致的描述;而 主觀的文本內(nèi)容被定義為:評(píng)論者對(duì)商品的主觀 態(tài)度或情感的表達(dá),這類文本內(nèi)容不會(huì)出現(xiàn)在商 家的商品描述信息中.為與前面提出的主客觀表 達(dá)形式文本特征相區(qū)別,對(duì)從文本體裁角度將文 本內(nèi)容分成的兩類內(nèi)容稱為“觀點(diǎn)評(píng)價(jià)”和“客觀 描述”.Ghose和Ipeirotis∞o進(jìn)一步研究了這兩類
cues”和“instrumental cues”兩類內(nèi)容,其中
“affective
cues”定義為基于購(gòu)買(mǎi)者內(nèi)在主觀標(biāo)準(zhǔn)
(如美感、藝術(shù)效果等)的評(píng)價(jià);“instrumental
cues”定義為基于產(chǎn)品屬性的客觀評(píng)述.Duhan等
揭示了主客觀表達(dá)形式的重要區(qū)別,即客觀表達(dá) 形式的口碑中包含更多的評(píng)述產(chǎn)品屬性的內(nèi)容. 而在分析中發(fā)現(xiàn),文本評(píng)論的表達(dá)方式(如語(yǔ)氣 和用詞等)都會(huì)影響評(píng)論者的主客觀表達(dá)效果.
如評(píng)論“a
see
must
see
film.”在表達(dá)上要比“you
must
it!”更客觀,更容易讓人接受.因此,借鑒
萬(wàn)方數(shù)據(jù)
第8期
郝媛媛等:基于影評(píng)數(shù)據(jù)的在線評(píng)論有用性影響因素研究
一81一
文本體裁對(duì)視聽(tīng)產(chǎn)品和數(shù)碼相機(jī)兩種商品在線評(píng)
論有用性的影響,結(jié)果發(fā)現(xiàn)這些商品評(píng)論中平均
有用性存在正向影響. H5在線評(píng)論標(biāo)題的觀點(diǎn)評(píng)價(jià)傾向?qū)υu(píng)論
有用性存在正向影響.
觀點(diǎn)評(píng)價(jià)傾向越大(即觀點(diǎn)評(píng)價(jià)的內(nèi)容越多),評(píng) 論有用性越低,而既有觀點(diǎn)評(píng)價(jià)又有對(duì)商品的客 觀描述,兩類信息越混雜,評(píng)論的有用性越高.對(duì) 于體驗(yàn)型商品來(lái)說(shuō),Nelson曙¨指出這類商品的主 要屬性通常不易判斷,需要通過(guò)體驗(yàn)才能獲知.這 樣,對(duì)于體驗(yàn)型商品,商品客觀描述不足以幫助人 們判斷其真實(shí)質(zhì)量,而其他用戶的主觀感受和評(píng) 價(jià)對(duì)其決策的影響增大.另外,無(wú)論對(duì)于什么類型 的商品,既包含觀點(diǎn)評(píng)價(jià)又包含客觀描述的評(píng)論 更全面地反映了商品的質(zhì)量,對(duì)消費(fèi)者決策的影 響更大.因此,本文提出假設(shè)H3.
I-13在線評(píng)論內(nèi)容中客觀描述和觀點(diǎn)評(píng)價(jià)
H6在線評(píng)論標(biāo)題中觀點(diǎn)句的主觀表達(dá)傾 向?qū)υu(píng)論有用性存在負(fù)向影響.
1.5其他控制變量與評(píng)論有用性
Ghose和Ipeirotisl61在其研究中加入了評(píng)論
發(fā)布天數(shù)和評(píng)論可讀性兩個(gè)控制變量.實(shí)際上,評(píng) 論發(fā)布天數(shù)越長(zhǎng),對(duì)電影關(guān)注的熱度可能會(huì)逐漸 減弱,因此電影的評(píng)論被關(guān)注并被評(píng)價(jià)的可能性
就會(huì)降低,因此本文初步認(rèn)為評(píng)論發(fā)布天數(shù)對(duì)評(píng) 論有用性存在負(fù)向影響.對(duì)于評(píng)論可讀性,Ghose 等認(rèn)為閱讀評(píng)論的認(rèn)知成本(評(píng)論的可讀性)會(huì) 影響評(píng)論有用性,并以評(píng)論中平均每句長(zhǎng)度作為 可讀性代理指標(biāo),結(jié)果發(fā)現(xiàn)評(píng)論可讀性對(duì)評(píng)論有 用性存在正向影響,與其初始理論解釋相反,兩者 的關(guān)系有待進(jìn)一步檢驗(yàn).因此,本文提出假設(shè)H7
和H8.
兩類體裁對(duì)評(píng)論有用性存在影響.其中:
H3-1
評(píng)論內(nèi)容的平均觀點(diǎn)評(píng)價(jià)傾向?qū)υu(píng)
論有用性存在正向影響(即評(píng)論的觀點(diǎn)評(píng)價(jià)傾向 越大,評(píng)論有用性越高).
H3-2評(píng)論內(nèi)容中觀點(diǎn)評(píng)價(jià)與客觀描述的
I'I'/在線評(píng)論發(fā)布天數(shù)對(duì)評(píng)論有用性存在 負(fù)向影響.
H8在線評(píng)論內(nèi)容中平均句子長(zhǎng)度對(duì)評(píng)論 有用性存在影響.
混雜度對(duì)評(píng)論有用性存在正向影響.
1.4評(píng)論標(biāo)題與評(píng)論有用性
對(duì)于在線評(píng)論,文本內(nèi)容可細(xì)分為評(píng)論標(biāo)題 和評(píng)論內(nèi)容(即正文)兩部分.在Ghose和Ipeirotis
的研究№1中,評(píng)論標(biāo)題并未被列為評(píng)論文本來(lái)加
2在線評(píng)論有用性影響因素模型
基于以上理論假設(shè),建立在線評(píng)論有用性影
響因素模型(見(jiàn)公式(1)).以在線評(píng)論的文本特
以考察.而評(píng)論標(biāo)題也可能對(duì)評(píng)論總體有用性存 在影響,因?yàn)椋壕W(wǎng)上評(píng)論與網(wǎng)下口碑傳播的顯著差 異是網(wǎng)下口碑往往是被動(dòng)接受,而網(wǎng)上評(píng)論必須 經(jīng)過(guò)消費(fèi)者主動(dòng)搜索才能獲得,這種主動(dòng)獲取信
息的方式使消費(fèi)者可以自主挑選感興趣的評(píng)論而
征——評(píng)論內(nèi)容的正向情感傾向、觀點(diǎn)評(píng)價(jià)傾向 概率及觀點(diǎn)句中主觀表達(dá)傾向概率的平均值和標(biāo) 準(zhǔn)差,以及評(píng)論標(biāo)題的正向情感傾向概率、觀點(diǎn)評(píng) 價(jià)傾向概率、主觀表達(dá)傾向概率的平均值作為自 變量,對(duì)評(píng)論有用性進(jìn)行回歸.其中,采用網(wǎng)站上
提供的認(rèn)為該評(píng)論有用的投票數(shù)和總投票數(shù)相除
有選擇地進(jìn)行閱讀.幫助其初步判斷評(píng)論是否值
得進(jìn)一步閱讀的重要工具就是評(píng)論的標(biāo)題,標(biāo)題
是正文內(nèi)容的概括和宣傳廣告,評(píng)論標(biāo)題具有吸 引力,才有可能進(jìn)一步引發(fā)消費(fèi)者閱讀評(píng)論內(nèi)容 的行為.基于以上經(jīng)驗(yàn)總結(jié),本文認(rèn)為,不被關(guān)注
即無(wú)法產(chǎn)生影響,評(píng)論標(biāo)題影響著評(píng)論內(nèi)容被閱 讀并產(chǎn)生影響的可能性,因而影響著消費(fèi)者對(duì)評(píng)
得到的比例值作為評(píng)論有用性的代理指標(biāo).而對(duì) 于評(píng)論對(duì)特定商品的正向情感傾向,采用網(wǎng)站上 該條評(píng)論對(duì)商品的打分作為代理指標(biāo),而不采用
機(jī)器挖掘方法得到的概率值,主要考慮是:評(píng)論者
論有用性的評(píng)價(jià).對(duì)于標(biāo)題文本特征的影響方向, 我們預(yù)期與評(píng)論正文文本特征的影響方向一致.
因此,提出假設(shè)H4一H6.(評(píng)論標(biāo)題通常較短,僅
打分是最為原始的數(shù)據(jù),比由機(jī)器學(xué)習(xí)估算出的
概率更準(zhǔn)確客觀.參考Ghose和Ipeirotis的研 究[6 J,評(píng)論有用性、評(píng)論發(fā)布天數(shù)以及可讀性均
有一句的標(biāo)題占多數(shù),故不考慮混雜度指標(biāo).) H4在線評(píng)論標(biāo)題的正負(fù)情感傾向?qū)υu(píng)論
采用常用對(duì)數(shù)形式.各變量的符號(hào)及解釋見(jiàn)表1.
萬(wàn)方數(shù)據(jù)
一82一
管理科學(xué)學(xué)報(bào)
2010年8月
Log(Helpful)kr=a+口l(Rating)kr+島(DevPos)kr+盧3(AvgSub)h+角(DevSub)h+ 盧5(AugSubExp)h+盧6(DevSubExp)kr+JB7(title_AvgP05)kr+盧8(title_AvgSub)h+ 島(title_AvgSubExp)h+盧10Log(Elapseddays)kr+盧11Log(Read)h+占kr
表1
Table
1
(1)
模型中各變量代表符號(hào)及解釋
Explanations
for variables in the model
變量
解釋 評(píng)論有用性比例(有用的投票數(shù)/總投票數(shù))(常 用對(duì)數(shù)形式)
變量
解釋
LoS(Hetpfq)h
(DevSubgxp)h
商品k評(píng)論r觀點(diǎn)句中主觀表達(dá)傾向概率的
標(biāo)準(zhǔn)差
(Rating)h (DevPos)h (AvgSub)h (DevSub)h
商品k評(píng)論r內(nèi)容的正負(fù)情感傾向打分 商品k評(píng)論r內(nèi)容的正向情感傾向概率的標(biāo)準(zhǔn)差 商品&評(píng)論r內(nèi)容的觀點(diǎn)評(píng)價(jià)傾向概率 商品k評(píng)論r內(nèi)容的觀點(diǎn)評(píng)價(jià)傾向概率的標(biāo)準(zhǔn)差 商品k評(píng)論r平均句子長(zhǎng)度(評(píng)論中單詞總數(shù)/句
(AvgSubExp)kr (title_AvgPos)h (tige.AvgSub)kr (title_,4vgSubExp)h Log(Elapseddays)kr
商品k評(píng)論r觀點(diǎn)句中主觀表達(dá)傾向概率
商品k評(píng)論r標(biāo)題的正向情感傾向概率
商品k評(píng)論r標(biāo)題的觀點(diǎn)評(píng)價(jià)傾向概率
商品k評(píng)論r標(biāo)胚的主觀表達(dá)傾向概率 商品k評(píng)論r發(fā)表時(shí)間距商品發(fā)布日的天數(shù) (常用對(duì)數(shù)形式)
Log(Read)h
子個(gè)數(shù))(常用對(duì)數(shù)形式)
表電影從其發(fā)布至影院放映結(jié)束這段時(shí)間的影評(píng) 3
3.1
研究數(shù)據(jù)及文本特征識(shí)別方法
研究對(duì)象
數(shù)據(jù),包括各個(gè)評(píng)論的正負(fù)情感傾向打分、發(fā)布時(shí) 間、有用性評(píng)價(jià)、標(biāo)題、正文內(nèi)容.其中,評(píng)論的有 用性評(píng)價(jià)指由一些消費(fèi)者在閱讀評(píng)論后對(duì)該評(píng)論
是否有用做出投票,然后評(píng)論網(wǎng)站將累計(jì)的有用
通過(guò)對(duì)本校市場(chǎng)營(yíng)銷學(xué)科教授的訪談,形成 包括小說(shuō)、音箱、化妝品、電影等8種體驗(yàn)型商品
的候選商品列表.然后,根據(jù)Nelson的量表舊7 o設(shè)
性評(píng)價(jià)信息以投票總?cè)藬?shù)中多少人認(rèn)為有用的形
式呈現(xiàn)給后來(lái)的評(píng)論閱讀者.
計(jì)了一道反映商品體驗(yàn)性需求的測(cè)項(xiàng)(“您認(rèn)為 在購(gòu)買(mǎi)前無(wú)需試體驗(yàn),僅根據(jù)網(wǎng)上對(duì)該商品的描 述性信息(非買(mǎi)家評(píng)論)容易評(píng)估其品質(zhì)嗎?l非 常容易……5非常難),并隨機(jī)邀請(qǐng)本校的10名 在校大學(xué)生對(duì)列表中所有候選商品進(jìn)行打分.結(jié) 果顯示,被試者對(duì)化妝品及電影的體驗(yàn)性需求最 強(qiáng).最后,選取電影作為體驗(yàn)型商品進(jìn)行下一步的
實(shí)證分析,主要原因是:電影是人們公認(rèn)的受口碑
通常情況下,電影發(fā)布后1個(gè)月內(nèi)影評(píng)發(fā)布 密集,人們對(duì)評(píng)論的關(guān)注度和評(píng)價(jià)也較為集中.鑒 于后期的一些評(píng)論未被評(píng)價(jià)可能是由電影受關(guān)注 程度降低導(dǎo)致的,后期有用性評(píng)價(jià)的數(shù)據(jù)實(shí)際上 無(wú)法客觀地反映評(píng)論本身的質(zhì)量,本文主要考察 14個(gè)樣本電影發(fā)布后1個(gè)月內(nèi)的評(píng)論.另外,一些 評(píng)論的有用性評(píng)價(jià)總票數(shù)為1(即僅有1人評(píng) 價(jià)),考慮到這些評(píng)論的評(píng)價(jià)人數(shù)過(guò)少,得到的有 用性評(píng)價(jià)指標(biāo)值的代表性差,因此,剔除有用性評(píng) 價(jià)總票數(shù)為l的評(píng)論.最后,共得到1 686個(gè)影評(píng)
樣本用于模型檢驗(yàn).
3.3
影響較大的商品;另外,電影是典型的體驗(yàn)型商 品,目前研究體驗(yàn)型商品的文獻(xiàn)大多選取電影為 研究對(duì)象,本文以同一種商品進(jìn)行研究,有利于研
究結(jié)果的比較和驗(yàn)證. 3.2研究數(shù)據(jù)
文本特征識(shí)別方法
模型中,多數(shù)評(píng)論文本特征的識(shí)別均采用機(jī) 器文本挖掘分類工具LingPipe(可在WWW.alias。i. com/lingpipe下載)來(lái)實(shí)現(xiàn),應(yīng)用步驟如下:利用 Java編程使用其動(dòng)態(tài)語(yǔ)言模型構(gòu)造相應(yīng)的分類 器,用人工標(biāo)注好類別的文本語(yǔ)料進(jìn)行訓(xùn)練,然后 選用其他測(cè)試樣本對(duì)分類效果進(jìn)行評(píng)估,最后利 用訓(xùn)練好的分類器對(duì)未知類別的文本進(jìn)行情感分 類和傾向概率的計(jì)算.
本研究所需的數(shù)據(jù)均通過(guò)Java程序自動(dòng)抓 取和解析網(wǎng)頁(yè)獲得.在線影評(píng)數(shù)據(jù)來(lái)自美國(guó)著名
的Yahoo。停铮觯椋澹笥霸u(píng)網(wǎng)站(movies.yahoo.
eom):首先在2006年度票房排行前500名電影 中,對(duì)動(dòng)畫(huà)、喜劇、恐怖、驚悚、戰(zhàn)爭(zhēng)、冒險(xiǎn)、科幻7 類主要題材分別隨機(jī)抽取了2部電影作為代表電 影,然后在Yahoo。停铮觯椋澹缶W(wǎng)站上抓取這14個(gè)代
萬(wàn)方數(shù)據(jù)
第8期
郝嬡嬡等:基于影評(píng)數(shù)據(jù)的在線評(píng)論有用性影響因素研究
一83一
本文中文本特征識(shí)別所需的訓(xùn)練及測(cè)試樣 本主要有兩個(gè)來(lái)源:一是研究者提供的語(yǔ)料庫(kù),
Yahoo!Movies網(wǎng)站上除用于14個(gè)電影樣本外的其
他電影評(píng)論中,選取正向和負(fù)向評(píng)價(jià)語(yǔ)句各400個(gè)作 為正負(fù)情感的訓(xùn)練及測(cè)試語(yǔ)料.
基于相應(yīng)的訓(xùn)練語(yǔ)料,對(duì)本研究構(gòu)造的觀點(diǎn)
二是Yahoo!Movies網(wǎng)站上除14個(gè)電影樣本外
其他電影的評(píng)論數(shù)據(jù).具體的選取過(guò)程如下:1) 對(duì)于評(píng)論文本觀點(diǎn)評(píng)價(jià)/客觀描述的分類,根據(jù) 前述的定義,采用Pang和Lee提供的電影劇情
評(píng)價(jià)/客觀描述、正負(fù)向情感、觀點(diǎn)句中主客觀表
達(dá)3個(gè)分類器分別進(jìn)行訓(xùn)練,然后利用相應(yīng)測(cè)試
描述訓(xùn)練語(yǔ)料庫(kù)(http://www.cs.cornell. edu/people/pabo/movie—review-data/)中800個(gè)
電影劇情介紹文本作為本研究中電影評(píng)論客觀描述
語(yǔ)料評(píng)估分類器的分類準(zhǔn)確率,所得準(zhǔn)確率分別 為:85.15%,83.34%,78.71%,說(shuō)明3個(gè)分類器 的分類效果良好.
4
信息的訓(xùn)練及測(cè)試語(yǔ)料(其中2/3的數(shù)據(jù)用作訓(xùn)練, 其余1/3用作測(cè)試,以下其他文本特征的訓(xùn)練樣本和 測(cè)試樣本的分配與此相同);從Yahoo!Movies網(wǎng)站 上除14個(gè)電影樣本外的其他電影評(píng)論中,剔除其中 劇情描述及主客觀模糊的句子,篩選出765個(gè)觀點(diǎn)評(píng) 價(jià)句作為電影觀點(diǎn)評(píng)價(jià)信息的訓(xùn)練及測(cè)試語(yǔ)料.2) 對(duì)于評(píng)論觀點(diǎn)句的主客觀表達(dá)形式的分類,根據(jù)前
述的定義,從Yahoo。停铮觯椋澹缶W(wǎng)站提供的大型影評(píng)機(jī) 構(gòu)的影評(píng)中,隨機(jī)選。担埃皞(gè)專家評(píng)論文本作為影評(píng) 客觀表達(dá)信息的訓(xùn)練及測(cè)試語(yǔ)料;從Yahoo。停铮觯椋澹 4.1初步統(tǒng)計(jì)分析 模型中各變量基本均可被視為連續(xù)變量,描 述性統(tǒng)計(jì)分析結(jié)果見(jiàn)表2.
模型結(jié)果分析
為在初步分析中更為清晰地呈現(xiàn)評(píng)論情感傾 向與評(píng)論有用性的關(guān)系,將連續(xù)變量——評(píng)論有 用性評(píng)價(jià)指標(biāo)及電影正負(fù)情感打分進(jìn)行離散化分 類:對(duì)評(píng)論有用性評(píng)價(jià)以0.5為分界值將評(píng)論分
為“有用”、“沒(méi)用”兩類;另外,Yahoo。停铮觯椋澹缶W(wǎng)
網(wǎng)站上除14個(gè)電影樣本外的其他電影評(píng)論中篩選出 500個(gè)帶有強(qiáng)烈個(gè)人色彩的主觀表達(dá)句作為電影主 觀表達(dá)信息的訓(xùn)練及測(cè)試語(yǔ)料.3)對(duì)于影評(píng)的正負(fù)
情感分類,由于Yahoo。停铮觯椋澹缶W(wǎng)站對(duì)于每個(gè)影評(píng)都 有正負(fù)情感傾向的打分,因此不用采用文本挖掘方
站評(píng)論中的電影正負(fù)情感評(píng)分采用A—F 5個(gè)大等 級(jí),除F等級(jí)外,每個(gè)大等級(jí)下又分為3個(gè)小等 級(jí),我們將13個(gè)等級(jí)合并為3類,即好評(píng)(A+
.B.)、中評(píng)(C+.C-)、差評(píng)(D+-F),對(duì)樣本中3
法對(duì)影評(píng)的正負(fù)情感傾向概率進(jìn)行計(jì)算,但影評(píng)的 正負(fù)情感混雜度仍需借助文本挖掘方法來(lái)求得,從
表2
Table 2
Descriptive statistics
類情感傾向的評(píng)論有用性評(píng)價(jià)數(shù)量及比例情況進(jìn)
行初步統(tǒng)計(jì),結(jié)果見(jiàn)表3.
of variables
in the
模型中各變量的描述性統(tǒng)計(jì)
model
變量 (Helpful)ix (Rating)kr (DevPos)h (AvgSub)h (DevSub)b (AvgSubExp)h (DevSubExp)kr (title_AvgSub)h (title AvgSubExp)h (title AvgPos)h (Read)h (Elapseddays)kr
有效觀測(cè)值
l 1 1
均值
0.64 9.07 O.32 0.87
O.17
標(biāo)準(zhǔn)差
O.26
最小值
0.03
最大值
1
686 686
67l
4.29
l O
13
O.50
0.17
O.17
1 1
680 680
O O 0 0
0
l
O.19 0.3l 0.19 0.22 0.47 0.44 9.41 15.62
0.57 l O.50
l
l l
668 668
686
0.45 O.3l 0.94 0.46 O.56 15.56
l l
686 686 671 686
O O O 1
l
1
l l 1
92 30
7.64
萬(wàn)方數(shù)據(jù)
一84一
裹3
Table 3
管理科學(xué)學(xué)報(bào)
三類情感傾向評(píng)論的有用性評(píng)價(jià)統(tǒng)計(jì)
usefolness for three attitude
orientations reviews
2010年8月
Statistics of
評(píng)論情感傾向 總觀測(cè)樣本 差評(píng)(F—D+) 評(píng)論有用 性評(píng)價(jià) 沒(méi)用 有用 246(70.90%) 101(29.I%) 347(100%) 中評(píng)(C~C+) 118(68.6%) 54(31.4%) 172(100%)
1
好評(píng)(B—A+) 41I(35.2%) 756(64.8%) 167(100%)
1
775(46%) 911(54%) 686(100%)
總觀測(cè)樣本
注:括號(hào)中的比例值為有用或沒(méi)用的相應(yīng)評(píng)論情感傾向類的評(píng)論數(shù)量與所有這類評(píng)論情感傾向的評(píng)論數(shù)量的比值.
由表3可見(jiàn),對(duì)于樣本中帶有有用性評(píng)價(jià)的
l
一1合理,即在線影評(píng)對(duì)電影情感評(píng)分越趨于正
向,越會(huì)被認(rèn)為有用. 模型結(jié)果分析
686個(gè)評(píng)論,電影好評(píng)的數(shù)量(1 167個(gè))遠(yuǎn)遠(yuǎn)超
過(guò)差評(píng)(347個(gè))和中評(píng)(172個(gè)),反映了不同情4.2
感傾向評(píng)論分布呈J形偏態(tài)結(jié)構(gòu),這與以往多數(shù) 研究的分析結(jié)果一致.其中,被評(píng)為有用的評(píng)論在 好評(píng)中所占的比例為64.8%,在差評(píng)中占比 29.1%,在中評(píng)中占比31.4%.可初步判斷,對(duì)傾
向于好評(píng)的評(píng)論更可能被評(píng)為有用.
評(píng)論內(nèi)容的平均觀點(diǎn)評(píng)價(jià)傾向(AvgSub)和 觀點(diǎn)評(píng)價(jià)混雜度(DevSub)存在較高的負(fù)相關(guān)關(guān) 系(一0.875),同時(shí)將這兩個(gè)變量放人模型中存
在多重共線性問(wèn)題.采用逐步回歸法回歸模型,剔
除不顯著變量之后得到最終的在線評(píng)論有用性影 響因素模型,模型整體擬合以及標(biāo)準(zhǔn)化參數(shù)估計(jì)
結(jié)果見(jiàn)表4.為檢驗(yàn)本文模型的擬合效果是否有
考慮電影問(wèn)的差異,對(duì)14個(gè)樣本電影分別進(jìn) 行了同樣的統(tǒng)計(jì),均得到類似結(jié)果.另外,考慮評(píng) 論有用性分類界值可能對(duì)結(jié)果存在影響,還以 0.6為分界值分類評(píng)論有用性,,同樣得到類似結(jié)
果.由此,從樣本數(shù)據(jù)初步統(tǒng)計(jì)分析來(lái)看,假設(shè)H1
表4
Table
4
所提高,采用本文使用的影評(píng)樣本數(shù)據(jù)對(duì)Ghose 和Ipeirotis‘61提出的模型進(jìn)行擬合(結(jié)果見(jiàn)表
4),對(duì)照比較兩者的估計(jì)結(jié)果.
results
本文模型和Ghose等研究模型的整體擬合以及標(biāo)準(zhǔn)化參數(shù)估計(jì)結(jié)果
for
the
Model fitness and standard eoe儂eients
studied model and Ghose’s model
本文模型:(F=103.193,,諺=0.001;R2=0.272,Adj.R2=0.269) Log(netpfl工1)h=口+盧1(Rating)kr+JB2(DevPos)kr+島(AvgSub)kr I風(fēng)(DevSub)kr+ 島(AugSubExp)kr+風(fēng)(DevSubExp)kr+島(title_AvgPos)kr+盧8(title AvgSub)h+ 島(title_AvgSubExp)kr+/3loLog(Elapseddays)kr+盧11Log(Read)kr+占b 標(biāo)準(zhǔn)化系數(shù) 估計(jì)值 t值
bl 0.46“ 20.622 b2 0.07“ 3.2 b3
I以
b5
b‘ 0.058’ 2.591
b7 0.089’’
4.Ol
bI
矗,
blo O.115”
611 0.122” 5.618
一I一
一l一
5.463
Ghose和ipeirotis模型:(F=20.189,s垃.=0.001;R2=0.035,adj.R2=0.033) Log(netpfut)b=const+盧12(Moderate)h+盧13(AvgSub)kr I盧14(DevSub)h+ 盧15Log(Elapseddays)kr+盧16Log(Read)kr+占h 標(biāo)準(zhǔn)化系數(shù) 估計(jì)值 t值
612 一0.130.. 一5.408 bn b¨ b坫 O.106” 4.393 bl‘ 0.090’’ 3.724
一I— 一l一
注:系數(shù)bi為原模型中晟的標(biāo)準(zhǔn)化系數(shù);’、”分別表不系數(shù)估計(jì)值在0.05、0.01水平上顯著;“l”表不其附近的兩個(gè)變量不能I司時(shí) 放入模型,需要分別代入模型進(jìn)行估計(jì);“一”對(duì)應(yīng)的變量為系數(shù)不顯著變量.
對(duì)于本文提出的假設(shè)模型,F檢驗(yàn)顯著,表 標(biāo)——校正的決定系數(shù)(A辦R2)為0.269;而 利用本文的影評(píng)樣本數(shù)據(jù)擬合Ghose等的研究
模型,其校正的決定系數(shù)仍然很低,僅為O. 種商品的模型總體擬合度分別為0.07和0.1). 對(duì)于體驗(yàn)型商品——電影的在線評(píng)論,與Ghose
明模型線性回歸關(guān)系成立,總體擬合指033(Ghose等研究中對(duì)視聽(tīng)商品及數(shù)碼相機(jī)兩
萬(wàn)方數(shù)據(jù)
第8期
郝媛嬡等:基于影評(píng)數(shù)據(jù)的在線評(píng)論有用性影響因素研究
一85一
等人研究模型相比,本文模型的總體擬合度提 高了23.6%,說(shuō)明本模型對(duì)在線影評(píng)有用性的 總體解釋力明顯好于Ghose等的研究模型;另
外,兩個(gè)模型均顯示電影評(píng)論內(nèi)容的平均觀點(diǎn)
表5
Table
5
評(píng)價(jià)傾向概率(均值)和觀點(diǎn)評(píng)價(jià)與客觀描述兩
種體裁的混雜度(標(biāo)準(zhǔn)差)對(duì)評(píng)論有用性的影響 不顯著.本文模型的回歸結(jié)果對(duì)前述假設(shè)的支 持情況見(jiàn)表5.
模型估計(jì)結(jié)果對(duì)研究假設(shè)的支持情況
validation
results
Hypothesis
according
to
model
estimation
研究假設(shè) Ill:在線評(píng)論內(nèi)容的正負(fù)情感對(duì)評(píng)論有用性存在 影響 Hl—l:評(píng)論內(nèi)容的平均正向情感傾向?qū)υu(píng)論有用 性存在正向影響. H1—2:評(píng)論內(nèi)容的正負(fù)情感混雜度對(duì)評(píng)論有用性 存在正向影響 I-12:在線評(píng)論內(nèi)容中觀點(diǎn)句的主觀與客觀表達(dá)形 式對(duì)評(píng)論有用性存在影響
支持情況 、/
研究假設(shè) H3:在線評(píng)論內(nèi)容的客觀描述和觀點(diǎn)評(píng)價(jià)兩類體
支持情況
X
裁對(duì)評(píng)論有用性存在影響 H3—1:評(píng)論內(nèi)容的平均觀點(diǎn)評(píng)價(jià)傾向?qū)υu(píng)論有用
×
、/
性存在正向影響 H3—2:評(píng)論內(nèi)容中觀點(diǎn)評(píng)價(jià)與客觀描述的混雜度
×
、/
對(duì)評(píng)論有用性存在正向影響 114:評(píng)論標(biāo)題的正負(fù)情感傾向?qū)υu(píng)論有用性存在 部分支持 正向影響 H5:評(píng)論標(biāo)題的觀點(diǎn)評(píng)價(jià)傾向?qū)υu(píng)論有用性存在
× ×
、/
m—l:評(píng)論內(nèi)容中觀點(diǎn)句的平均主觀表達(dá)傾向?qū)?br />評(píng)論有用性存在負(fù)向影響 H2—2:評(píng)論內(nèi)容中觀點(diǎn)句的主客觀表達(dá)形式的混 雜度對(duì)評(píng)論有用性存在正向影響 V
正向影響 116:評(píng)論標(biāo)題的平均主觀表達(dá)傾向?qū)υu(píng)論有用性
×
存在負(fù)向影響
I-F/:評(píng)淪發(fā)布天數(shù)對(duì)評(píng)論有用性存在負(fù)向影響
X
I'18:評(píng)論平均句子長(zhǎng)度對(duì)評(píng)論有用性存在影響
、/
注:“、/”表示假設(shè)關(guān)系顯著成立,假設(shè)成立;“×”表示假設(shè)不成立,包括假設(shè)關(guān)系不顯著或關(guān)系相反
在顯著影響在線影評(píng)有用性的因素中,評(píng)論 內(nèi)容的平均正負(fù)情感傾向打分(rating)影響最大
且為正向(100‘46=2.884),即評(píng)論對(duì)相應(yīng)電影的 打分越傾向于正面,該評(píng)論越可能被評(píng)為有用.這 一結(jié)果與初步分析中得到的統(tǒng)計(jì)結(jié)果一致.其次 是評(píng)論標(biāo)題的正面情感傾向?qū)υu(píng)論有用性存在正
電影總體或其中一些屬性的客觀評(píng)述,兩種表達(dá)
形式混雜度越高的評(píng)論有用性越高.對(duì)于模型中
控制變量,評(píng)論中平均句子長(zhǎng)度(Read)對(duì)評(píng)論有
用性也存在正向影響(0.122),這一指標(biāo)在Ghose 等的研究中用來(lái)反映評(píng)論可讀性或認(rèn)知成本,與
有用性應(yīng)呈反向關(guān)系,但Ghose等對(duì)視聽(tīng)播放器
和數(shù)碼相機(jī)的研究結(jié)果則與其理論假設(shè)相反,本 文同樣發(fā)現(xiàn)評(píng)論中平均各句長(zhǎng)度(Read)對(duì)評(píng)論 有用性的影響為正向.這個(gè)結(jié)果雖然從認(rèn)知成本
向影響(10n嗍=1.253),即評(píng)論標(biāo)題越傾向于正
面肯定的態(tài)度,評(píng)論越可能被評(píng)為有用,評(píng)論標(biāo)題
往往反映了評(píng)論的整個(gè)內(nèi)容,因此評(píng)論標(biāo)題正負(fù)
情感的影響與評(píng)論內(nèi)容正負(fù)情感的影響保持一致 符合實(shí)際情況.再次,評(píng)論內(nèi)容的正負(fù)情感混雜度
及可讀性角度無(wú)法解釋,但該指標(biāo)同時(shí)可以反映 評(píng)論信息量的豐富性,平均各句較長(zhǎng)的評(píng)論通常
為正負(fù)情感、觀點(diǎn)評(píng)價(jià)與客觀描述或主觀客觀表 達(dá)形式混合的評(píng)論,因此其有用性更高,從這個(gè)角
對(duì)評(píng)論有用性也存在顯著正向影響(10仉們= 1.175),即既有正面評(píng)價(jià)又有負(fù)面評(píng)價(jià),且正負(fù)
評(píng)價(jià)混雜度越高的評(píng)論越有用,這類評(píng)論往往反
度看結(jié)果合理.評(píng)論發(fā)布天數(shù)也顯著正向影響評(píng)
論有用性(0.1 15),評(píng)論發(fā)布天數(shù)越長(zhǎng),評(píng)論越可
映了評(píng)論者觀點(diǎn)的客觀性,因此更會(huì)被評(píng)論閱讀
者賦予更高權(quán)重.另外,評(píng)論中觀點(diǎn)句的主觀與客
能是有用的,與假設(shè)相反.這一結(jié)果的可能的解釋 是:在電影發(fā)布初期,一些電影發(fā)燒友憑借很少的 參考信息和自己的經(jīng)驗(yàn)判斷選擇觀看該電影,結(jié)
果因?yàn)橘|(zhì)量確實(shí)不好或者不符合自己的口味,很
觀表達(dá)形式的混雜度也對(duì)評(píng)論有用性存在顯著正
向影響(10n嘲=1.143),即評(píng)論內(nèi)容中觀點(diǎn)句的 表達(dá)方式既有個(gè)人主觀色彩較濃的評(píng)價(jià),又有對(duì)
萬(wàn)方數(shù)據(jù)
一86一
管理科學(xué)學(xué)報(bào)
裹6
Table 6
2010年8月
預(yù)測(cè)效果評(píng)估列聯(lián)表
Forecasting
多人不滿而歸,并向他人傳播負(fù)向口碑;而后來(lái)跟 進(jìn)者往往較為理性,會(huì)根據(jù)網(wǎng)上或其他來(lái)源迅速 積累起來(lái)的豐富內(nèi)容的評(píng)論等信息來(lái)做出是否觀 看的決策,因此,后來(lái)跟進(jìn)者看電影后好評(píng)率可能 更高.對(duì)于評(píng)論發(fā)布天數(shù)與評(píng)論有用性的關(guān)系還 有待進(jìn)一步證實(shí).
5
預(yù)測(cè)為有用 的評(píng)論數(shù) 預(yù)測(cè)為無(wú)用
result evaluation
實(shí)際被評(píng)為有用 的評(píng)論數(shù)
實(shí)際被評(píng)為沒(méi)用 的評(píng)論數(shù)
403(A)
32(剮
基于影響因素模型的評(píng)論有用性 分類預(yù)測(cè)
為測(cè)試上述提出的模型對(duì)在線影評(píng)有用性的
的評(píng)論數(shù)
316(C)
57(D)
其中,有用評(píng)論的查準(zhǔn)率
PM醛加n
分類預(yù)測(cè)能力,在Yahoo!Movies網(wǎng)站上隨機(jī)選取
除14個(gè)電影樣本之外其他電影的808?jìng)(gè)在線影評(píng)
..
2丁而
^
A
有用評(píng)論的查全率
艦以b南
綜合指數(shù)
數(shù)據(jù)用于評(píng)論是否有用的預(yù)測(cè).分類預(yù)測(cè)主要步
驟為:
首先,對(duì)待預(yù)測(cè)評(píng)論樣本的有用性進(jìn)行人工 標(biāo)注.參考Ghose和Ipeirotis【6 o的方法,我們雇用 兩名編碼員對(duì)這808?jìng)(gè)電影評(píng)論預(yù)測(cè)樣本進(jìn)行有 用/沒(méi)用的分類.然后,采用kappa統(tǒng)計(jì)指標(biāo)衡量 兩個(gè)編碼員分類結(jié)果的內(nèi)部評(píng)論者一致性
(inter-rater agreement).算得Kappa系數(shù)Ⅲ】=
,一胱∞岍2—T———T—
一
2
p—reci—sion+忑孤
為查準(zhǔn)率及查全率的調(diào)和平均數(shù). 根據(jù)以上公式計(jì)算出:有用評(píng)論的查準(zhǔn)率= 92.“%,查全率=56.05%,綜合指數(shù)= 69.84%.這3個(gè)指標(biāo)值說(shuō)明,本文模型盡管對(duì)評(píng) 論有用性比例的總體擬合較低,但對(duì)在線影評(píng)是
否有用的二分類預(yù)測(cè)仍具有較強(qiáng)的判別能力.
(實(shí)際一致率一理論一致率)/(1一理論一致率)
=0.76,表明兩個(gè)編碼員對(duì)評(píng)論樣本的感知和理 解一致性良好.
其次,確定評(píng)論有用性比例與評(píng)論是否有用 的對(duì)應(yīng)關(guān)系,即需要確定一個(gè)合適的分界值按評(píng) 論有用性比例將評(píng)論分為有用/沒(méi)用兩類.結(jié)果 顯示,如果確定分界值為O.5,則分類錯(cuò)誤率最
。虼,有用性比例>=0.5的評(píng)論被分類為
6
結(jié)束語(yǔ)
互聯(lián)網(wǎng)上日益豐富的商品評(píng)論信息為人們的
決策提供了更多參考,然而其中充斥的大量良莠 不齊的評(píng)論也給消費(fèi)者帶來(lái)了困惑,降低了決策 效率和效果.評(píng)論有用性評(píng)價(jià)信息需要長(zhǎng)期積累 才能真正發(fā)揮作用限制了其實(shí)際應(yīng)用效果,因此, 在評(píng)論發(fā)布后挖掘文本特征,并通過(guò)這些文本特
征幫助評(píng)論閱讀者及時(shí)地識(shí)別評(píng)論有用性成為迫 切需要解決的問(wèn)題.而目前,旨在解決此問(wèn)題的研
“有用”,而有用性<0.5的評(píng)論被分類為“無(wú)
用”.
最后,分類預(yù)測(cè)評(píng)論有用性及評(píng)估預(yù)測(cè)效果.
預(yù)測(cè)過(guò)程如下:將808?jìng)(gè)預(yù)測(cè)評(píng)論樣本利用本文
提出的模型求得評(píng)論有用性比例,并根據(jù)上面確 定的有用性分界值將預(yù)測(cè)結(jié)果分為“有用”和“沒(méi) 用”兩類,然后將模型分類預(yù)測(cè)的結(jié)果與人工分 類結(jié)果做比較.此部分的預(yù)測(cè)任務(wù)為判斷在線評(píng) 論是否有用,為二值分類,借助二維列聯(lián)表
(contingency table)計(jì)算查準(zhǔn)率、查全率及兩者
究仍很缺乏.本文以體驗(yàn)型商品——電影的在線 評(píng)論為研究對(duì)象,從消費(fèi)者角度出發(fā),以為評(píng)論閱 讀者及時(shí)提供評(píng)論有用性信息為目標(biāo),結(jié)合文本 挖掘技術(shù)與實(shí)證研究方法,建立了在線評(píng)論有用
性的影響因素模型,并用于評(píng)論有用性的分類 預(yù)測(cè).
合成的綜合指數(shù),以此來(lái)評(píng)估模型的預(yù)測(cè)效果
(見(jiàn)表6).
本文將評(píng)論有用性的研究擴(kuò)展到體驗(yàn)型商
萬(wàn)方數(shù)據(jù)
第8期
郝媛嬡等:基于影評(píng)數(shù)據(jù)的在線評(píng)論有用性影響因素研究
一87一
品領(lǐng)域;另外,除借鑒其他相關(guān)研究中涉及的文
本主客觀體裁等特征之外,本文還考察了評(píng)論
對(duì)在線影評(píng)是否有用具有較強(qiáng)的判別能力.從實(shí) 際應(yīng)用的角度,本研究可幫助評(píng)論網(wǎng)站設(shè)計(jì)者根 據(jù)評(píng)論文本特征對(duì)評(píng)論是否有用進(jìn)行及時(shí)和自動(dòng)
文本的平均正負(fù)情感傾向及混雜度、平均評(píng)論
文本觀點(diǎn)句中主客觀表達(dá)傾向及混雜度等文本 特征對(duì)評(píng)論有用性的影響,并區(qū)分了評(píng)論文本 中評(píng)論標(biāo)題和評(píng)論內(nèi)容對(duì)評(píng)論有用性的影響. 對(duì)體驗(yàn)型商品電影數(shù)據(jù)的實(shí)證檢驗(yàn)結(jié)果表明, 與現(xiàn)有相關(guān)研究相比,本文提出的在線評(píng)論有
的識(shí)別,將有用評(píng)論靠前放置,方便消費(fèi)者閱讀, 從而幫助其提高決策效率和效果. 本文尚有一些不足有待改進(jìn):1)由于數(shù)據(jù)收 集和處理的限制,本文僅選取了一種體驗(yàn)型商品 電影作為研究對(duì)象,文中結(jié)論對(duì)其他體驗(yàn)型商品
的適用性還有待進(jìn)一步檢驗(yàn),這將是作者未來(lái)研
用性影響因素模型總體解釋力有較大提高.本
文得到的重要結(jié)論有:對(duì)于電影,1)評(píng)論的正 負(fù)情感傾向這個(gè)文本特征對(duì)評(píng)論有用性影響較
究的重要內(nèi)容.2)對(duì)于體驗(yàn)型和搜索型兩類商 品,評(píng)論文本特征對(duì)評(píng)論有用性的影響可能存在
很大差異,進(jìn)一步研究?jī)烧唛g影響的差異性,并進(jìn)
大,其中,標(biāo)題和內(nèi)容的情感傾向趨于正面的評(píng) 論的有用性更高;另外,評(píng)論內(nèi)容中既有正向評(píng) 價(jià)又有負(fù)向評(píng)價(jià),正負(fù)情感混雜度越高的評(píng)論
有用性越高.2)在線評(píng)論觀點(diǎn)句中既有主觀表 達(dá)形式又有客觀表達(dá)形式,主客觀表達(dá)形式混 雜度越高的評(píng)論有用性越高. 另外,本文還應(yīng)用所提出的在線評(píng)論有用性 影響因素模型,對(duì)在線影評(píng)有用性的分類預(yù)測(cè)能
一步擴(kuò)展兩類商品評(píng)論文本特征對(duì)消費(fèi)者認(rèn)知影 響的理論,具有更大價(jià)值;3)盡管本文模型的總 體擬合度有所提高,但仍低于0.5,說(shuō)明還有一些
影響評(píng)論有用性的重要變量未納入到模型中,比 如除評(píng)論文本特征之外,反映評(píng)論者質(zhì)量的一些
特征因素可能也會(huì)影響評(píng)論有用性,需要進(jìn)一步 挖掘影響評(píng)論有用性的其他重要因素,以提高預(yù)
測(cè)的準(zhǔn)確性.
力做了進(jìn)一步的測(cè)試.結(jié)果表明,本文提出的模型
參考文獻(xiàn):
[1]Anderson [2]Katz
E
W.Customer satisfaction and word ofmouth[J].Journal ofService Research,1998,l(1):5一17. F.Lazarsfeld,Personal Influence:The Part Played by People in the Flow of Mass Communications[M].New
E,Paul
York:Free Press,1955.
[3]Arndt J.Role ofproduct—related (3):291—295. [4]Chevalier J
A,Mayzlin
conversations in
the diffusion ofa
new
product[J].Journal of
Marketing
Research,1967,4
D.The effect of word of mouth
on
sales:Online book reviews[J].Journal of Marketing Research
(JMR),2006,43(3):345—354. [5]Harrison.Walker
commitment
a8
L
J.The
measurement of
word—of-mouth communication and an investigation of service qualit),and customer
of
potential
antecedents[J].Journal
Service Research,2001,4(1):60.
[6]Ghose
A,Ipeirotis P
G.Designing Novel Review Ranking Systems:Predicting the Usefulness and Impact of Reviews[C].
on
Proceedings
of the ninth international conference
Electronic commerce,New
York,NY,USA:Association Computing Ma-
chinery(ACM)。2007:303—310. [7]張強(qiáng),李乃和.網(wǎng)絡(luò)口碑研究現(xiàn)狀及未來(lái)發(fā)展初探[J].江西農(nóng)業(yè)學(xué)報(bào),2008,20(4):147—149.
Zhang
Qiang.Li Nai-he.The
initial exploration on the present
and future of studies about online word-of-mouth[J].Journal
of Jiang Xi A咖culture,2008,20(4):147—149.(in Chinese)
[8]張瑩,孫明貴.西方網(wǎng)絡(luò)口碑傳播效應(yīng)研究進(jìn)展[J].財(cái)貿(mào)研究,2008,(05):109—115.
Zhang Ying,Sun
Ming—gni.Review
of online
word?of-mouth communication[J].Financial and Trade research,2008,19
(05):109一115.(in Chinese) [9]李實(shí),葉強(qiáng),李一軍,等.挖掘中文網(wǎng)絡(luò)客戶評(píng)論中的產(chǎn)品特征方法研究[J].管理科學(xué)學(xué)報(bào),2009,12(2):
142—152. Li Shi,Ye
Qiang,Li Yi-jun,et a1.Mining features
ofproducts from Chinese customer online
reviews[J].Journal of Man-
agement Sciences in
China,2009,12(2):142—152.(in Cllinese)
萬(wàn)方數(shù)據(jù)
一88一
管理科學(xué)學(xué)報(bào)
2010年8月
[10]劉建新,陳雪陽(yáng).口碑傳播的形成機(jī)理與口碑營(yíng)銷[J].財(cái)經(jīng)論叢,2007,(05):96—102.
Liu
on
Jian-xin,Chen Xue—yang.The mechanism of word?of-mouth
Finance
communication
and WOM marketing[J].Collected Essays
and Economics,2007,(05):96—102.(in Chinese)
[11]陳明亮,章晶晶.網(wǎng)絡(luò)口碑再傳播意愿影響因素的實(shí)證研究[J].浙江大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2008,38(5):
127—135.
Chen Ming—liang,Zhang Jing-jing.An experimental regeal'ch
on
the
determinants of re?diffusion iIntention of online word?of-
mouth[J].Journal ofZhejiang Univemity(Humanities
and
Social Sciences),2008,38(5):127—135.(in Chinese)
[12]李純青,趙平,馬軍平.零售業(yè)回報(bào)計(jì)劃感知價(jià)值對(duì)客戶忠誠(chéng)的影響[J],管理科學(xué)學(xué)報(bào),2007,10(4):90
—97. Li
Chum-qing,Zhan
Ping,Ma
Jun-ping.Impact of the value perception of the reward programs
on
customer
loyalty[J].
Journal of Management Sciences in China,2007,10(4):90—97.(in Chinese)
[13]陳蓓蕾.基于網(wǎng)絡(luò)和信任理論的消費(fèi)者在線口碑傳播實(shí)證研究[D].杭州:浙江大學(xué),2008.
Chen Bei?lei.An Empirical Study
on
Consumer
Online Word—of-Mouth Communication based
on
Web and Trust
Theory
[D].Hangzhou:Zhejiang University,2008.(in Chinese) [14]郭國(guó)慶,楊學(xué)成,張楊.口碑傳播對(duì)消費(fèi)者態(tài)度的影響:一個(gè)理論模型[J].管理評(píng)論,2007,19(3):20—26.
Guo Guo-qing,Yang Xue?eheng,Zhang Yang.The impact of word-of-mouth
on
consumer’s attitude:A theoretical
model
[J].Management Review,2007,19(3):20一26.(in Chinese) [15]金立印.網(wǎng)絡(luò)口碑信息對(duì)消費(fèi)者購(gòu)買(mǎi)決策的影響:一個(gè)實(shí)驗(yàn)研究[J].經(jīng)濟(jì)管理,2007,29(22):36—42.
Jin
Li-yin.The
effects of online
WOM information
on
consumer purchase decision:An
experimental study[J].Economic
Management,2007,29(22):36—42.(in Chinese) [16]鄭小平.在線評(píng)論對(duì)網(wǎng)絡(luò)消費(fèi)者購(gòu)買(mǎi)決策影響的實(shí)證研究[D].北京:中國(guó)人民大學(xué),2008. Zheng
Xiao—ping.An Empirical Study About the Effect of Online of
Reviews
on
Online Consumer Decision Making[D].Bei-
jing:Renmin University
China,2008.(in Chinese)
[17]郭小釵,陳蓓蕾.在線口碑效應(yīng)的影響因素實(shí)證研究[J].北京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2009,ll(2):31
—35. Guo
Xiac-thai,Chen Bei?lei.Determinants ofwom effects in virtual community:An empirical analysis[J].Journal of Bei-
Institute of
jing
Technology(Social Sciences Edition),2009,11(2):31—35.(in Chinese)
reviews in forecasting sales?The
case
[18]Dellarocas
F.Exploring the value of online product pictures[J].Journal of Interactive Marketing,2007,21(4):23-45.
and
C,zllang X Q,Awad N
of motion
[19]Skowronskij,Carlston D.Negativity
ical
extremity biases in impression formation:A review of explanations[J].Psycholog-
Bulletin,1989,105(I):131—142.
R,Burnkrant R E,Unnava H of Marketing
[20]Ahluwalia
R.Consumer response
to
negative
publicity:The
moderating role of commitment
[J].Journal
[21]Sen S,Leman
D.腳are
of
Research,2000,37(2):203—214.
you telling me
this?An examination into negative consumer reviews
on
the
web[J].Journal
of
Interactive Marketing,2007,21(4):76—94.
[22]Adaval
R.Sometimes it
jnst feels fight:The
differential
weighting
of
affect—consistent and affect?inconsistent product infor-
mation[J].Journal [23]Strahilevitz
trying
to
Consumer Research,2001,28(1):1—17. J G.Donations
ofConsumer
to
M,Myers
charity鷦purchase incentives:Row well they work may depend
on
what you
are
sell[J].Journal
Research,1998,24(4):434—446.
on
[24]Mort
G S,Rose of
T.The
effect of product type
value
linkages in the means?end chain:Implications for theory and method
[J].Journal [25]Duhan
D
Consumer Behaviour,2004,3(3):221—234.
on
F,Johnson S D,Wilcox J B,et a1.influences
consumer
use
of
word—of-mouth recommendation 80nrce8[J].
Journal of the Academy of Marketing Science,1997,25(4):283—295.
[26]Pang
B,Lee L.A
Sentimental Education:Sentiment Analysis Using Subjectivity Summarization Based
of
Oil
Minimum Cuts
[c].Proceedings
the 42nd Annual Meeting of the Association for Computational Linguistics(ACL),Morristown,NJ, Linguistics,2004,271—278.
USA:Association for Computational
[27]Nelson P.Advertising
as
information[J].Journal ofPolitical Economy,1974,82(4):729—754. (下轉(zhuǎn)第96頁(yè))
萬(wàn)方數(shù)據(jù)
一96一
[9]Armington P.A theory of
159—178. demand for products
管理科學(xué)學(xué)報(bào)
2010年8月
distinguished by place of production[J].IMF Staff Paper,1969,(16):
[10]Krugman
P.Increasing
returns
and economic geography[J].Journal of Political Economics,1991,(99):483—499.
returns to
[1 1]Ethier W.National
and international
scale in
the modem theory of international trade[J].American Economic
Review,1982,(72):950—959.
Analysis of economic development trend of labor interregional migration
YANG Zhong—zhi,YAO Lin—m,LI Li
Antai School of Economics and Management,Shanghai Jiaotong University,Shanghai 200052,China
Abstract:With yearly large—scale labor interregional migration,the regional disparity between the coastal area
and hinterland is enlarging in China.In order to analyze this phenomenon,this paper analyzes the effect of la- bor
interregional
migration by applying
a
general model based
on
discussion of the mechanism of industry ag-
glomeration.The results of model simulation show that,when considering the friction factors of labor interre- gional migration,both the industrial agglomeration effect and labor interregional migration increasing. Key words:labor migration;industrial agglomeration tion
regional
disparity would enlarge with the rate of
effect;regional disparity;equilibrium
model;simula—
(上接第88頁(yè)) [28]SAS
Institute Inc.sAs/STAT
Software:Changes and Enhancements.Through Release 6.11[C].North Carolina:SAS In.
stitute
Inc,1996,221—230.
Research
on
online impact factors of customer reviews usefulness based
on
movie reviews data
HAO Yuan—yuan,YE
Qiang,LI甄乒n
School of Management,Harbin Institute of Technology,Harbin 150001,China
Abstract:Taking movie’S online customer reviews
as
the
subject,using
text
mining and empirical research
a
methods,from the viewpoint of text features of online reviews,this paper establishes
model of the online
re一
、riews impact factors and forecast reviews usefulness using this model.Compared with related researches.the
explanation
power of
our
model increases significantly,and we find
that,positive
attitude,high mixture of
positive and negative attitudes,high mixture of
tences
our
subjective
and
objective
expression forms and
average
sen—
length have
a
significantly positive
impact
on
reviews usefulness.Finally,our forecasting result shows that
model has
strong power to discriminate usefulness of online movie reviews. reviews;usefulness;text features;positive expression;text mining
key
words:word—of-mouth;online tude;subjective
and
and
negative sentimental atti-
objective
萬(wàn)方數(shù)據(jù)
本文關(guān)鍵詞:基于影評(píng)數(shù)據(jù)的在線評(píng)論有用性影響因素研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):205516
本文鏈接:http://sikaile.net/jingjilunwen/xxjj/205516.html