天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于信息抽取技術(shù)的房屋租賃信息平臺的設(shè)計與實現(xiàn)

發(fā)布時間:2020-05-09 09:16
【摘要】:快速發(fā)展的“互聯(lián)網(wǎng)+”極大程度上便利了人們的生活,同時也深刻變革了很多行業(yè)。以“互聯(lián)網(wǎng)+租房”為例,目前市面上就存在著諸如安居客、搜房網(wǎng)等多種線上房屋租賃信息平臺。租客在租賃房屋時,多數(shù)用戶會優(yōu)先通過互聯(lián)網(wǎng)方式來租賃房屋。然而大量網(wǎng)絡(luò)上的租賃信息存在很多缺點,例如有的對信息本身的篩查把關(guān)不夠嚴格,大多會出現(xiàn)夸大或隱瞞的情況;有的會收取一定數(shù)額的中介費用,這對希望可以直接聯(lián)系房東并節(jié)省中介費的租客來說可以是一筆可控支出。當下租賃房屋已成為很多人的熱點需求,對于如何在網(wǎng)頁上撥開繁雜的大量無用信息準確快速地找到精準信息,并剔除中介高效地聯(lián)系出租者或求租者,則變得很有意義。本文針對希望在互聯(lián)網(wǎng)上得到比較真實的房源,并尋求經(jīng)濟的租客而言,構(gòu)建了一個基于信息抽取技術(shù)的房屋租賃信息平臺。該平臺致力于搜集網(wǎng)頁上海量的出租和求租信息,對于目標群體傾向于信息真實,乃至經(jīng)濟的特點,設(shè)計開發(fā)了此房屋租賃信息平臺。平臺主要搜集顯示了網(wǎng)頁上個人發(fā)布的非中介房源信息,對于出租者用戶和求租者用戶都有較好的信息體驗。在信息的收集上,本文主要搜集來自豆瓣租房小組和各大校園BBS等社區(qū)網(wǎng)站,提取房源的詳細信息。用戶可根據(jù)關(guān)鍵地理位置和期望價格篩選目標信息,本平臺提供的信息源基于爬蟲技術(shù)以及規(guī)則和深度學習的信息抽取技術(shù)。本平臺基于的信息抽取,主要是對中文命名實體進行識別抽取。目前針對序列標注領(lǐng)域的命名實體識別問題,主流的解決模型是將神經(jīng)網(wǎng)絡(luò)與CRF(條件隨機場)模型相結(jié)合的RNN-CRF(循環(huán)神經(jīng)網(wǎng)絡(luò)-條件隨機場)模型,但RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))在處理長文本時存在梯度彌散的不足,常用LSTM(長短時記憶模型)來代替,所以本信息抽取模型選取了 BiLSTM-CRF(雙向長短時記憶模型-條件隨機場)模型實現(xiàn)對房源具體信息中地理位置和機構(gòu)名的識別抽取工作;而對于房源具體信息中的價格以及供需關(guān)系,則采用基于規(guī)則的信息抽取模型。
【圖文】:

循環(huán)神經(jīng)網(wǎng)絡(luò)


處理任務(wù)按照序列化機制,某一結(jié)點的輸出要依賴前面結(jié)點的計算結(jié)果輸入,因逡逑此可以認為RNN具有記憶能力可以處理前后關(guān)聯(lián)的數(shù)據(jù)。從理論上來講RNN可逡逑以長時間序列化數(shù)據(jù),但在實際效果中其往往只能向前查看幾步,其結(jié)構(gòu)如圖2-1逡逑所示:逡逑在很多自然語言處理方面的問題上RNN己經(jīng)取得了十分顯著的效果:像詞逡逑性標注,語句檢查等。目前長短時記憶模型LSTM邋(Long邋Short-Term邋Memory)逡逑是應(yīng)用最為廣泛的RNN模型,這種模型在處理長期依賴時的效果要遠遠優(yōu)于其逡逑他模型'逡逑0utput邋Layer邐’逡逑HiddenLayer邋ck逡逑input邋Layer邐^逡逑圖2-1循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)-圖逡逑2.3.3長短時記憶模型逡逑長短時記憶模型(LSTM,邋Long邋Short-邋Term邋Memory),是屬于RNN結(jié)構(gòu)模逡逑型中的一種具體模型,LSTM可以解決標準循環(huán)神經(jīng)網(wǎng)絡(luò)產(chǎn)生的長距離依賴問題逡逑的缺陷,長時間傳遞梯度來使信息保持持久。其目的是使用過去的序列信息來推逡逑測當前的序列信息。逡逑14逡逑

結(jié)構(gòu)圖,結(jié)構(gòu)圖,節(jié)點,權(quán)值


Zfx逡逑圖2-2LSTM結(jié)構(gòu)圖逡逑如圖2-2所示,LSTM結(jié)構(gòu)中的基本節(jié)點稱為“cell”,輸入及輸出分別由輸逡逑入門(Input邋Gate)、輸出門(Output邋Gate)與cell交互,模型中同時加入遺忘門逡逑(ForgetGate)用以將不再需要的伯息丟棄,以達到一定程度上的記憶效果[2G]。逡逑通過遺忘門決定從cell狀態(tài)中丟棄信息的程度,由s^moid函數(shù)將權(quán)值設(shè)為0逡逑到1之間的值:逡逑ft邋=邋sigmoid{UfXt邋+邋Wfht_x邋+邋bf)邐(2-1邋)逡逑式(2-1)中,xt是當前時刻的輸入向量,心^是前一步隱藏層輸出的向量,^逡逑表示輸入信息的權(quán)值參數(shù),Wf表示遺忘門循環(huán)的權(quán)值參數(shù),嶺是偏置項。逡逑在決定細胞的狀態(tài)需要更新的信息時,,首先需要輸入門確定更新的值,通過逡逑s^moid函數(shù)獲得一個0到1之間的值,再通過tan/i函數(shù)獲得新的候選細胞狀態(tài)逡逑向量:逡逑it邋=邋sigmoid{JUiXt邋+邋Wih^邋+邋bi)邐(2-2邋)逡逑c't邋=邋tanh(Ucxt邋+邋Wcht^-i邋+邋bc)邐(2-3邋)逡逑式(2-2邋)中
【學位授予單位】:華中師范大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP391.1;TP393.09

【相似文獻】

相關(guān)期刊論文 前10條

1 孫師堯;;信息抽取技術(shù)在軍事標圖系統(tǒng)中的應(yīng)用[J];電子科技;2013年12期

2 鄭彥寧;鄧擘;;信息抽取技術(shù)在情報學中的應(yīng)用分析[J];情報理論與實踐;2008年05期

3 趙國榮;;數(shù)字圖書館信息抽取技術(shù)及應(yīng)用[J];晉圖學刊;2007年05期

4 張亞學;榮志光;曹林華;;淺談信息抽取技術(shù)的“四種形式”和“四種功能”[J];國防技術(shù)基礎(chǔ);2006年10期

5 李芳,盛煥燁,姚天f ;信息檢索與信息抽取技術(shù)的研究[J];計算機應(yīng)用研究;2002年01期

6 崔繼馨,孔維平;Web信息抽取技術(shù)的研究[J];信息技術(shù)教育;2004年10期

7 胡立諾;胡立巖;;技術(shù)檢測中的信息抽取技術(shù)的應(yīng)用分析[J];價值工程;2014年21期

8 李昕;王紅梅;;信息抽取技術(shù)探析[J];通化師范學院學報;2008年04期

9 李中言;李普躍;;信息抽取技術(shù)在數(shù)字圖書館中的應(yīng)用[J];現(xiàn)代情報;2007年10期

10 郭興;柯鵬;徐媛;李宗榮;;論垂直搜索引擎中的信息抽取技術(shù)的選用[J];醫(yī)學信息;2006年12期

相關(guān)會議論文 前8條

1 肖詩斌;孫麗華;王弘尉;施水才;;指標信息抽取技術(shù)的研究[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年

2 陳靜;朱巧明;貢正仙;李培鋒;;特定本體指導的信息抽取技術(shù)研究[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年

3 李昕;朱永盛 ;武港山;;論壇消息語義結(jié)構(gòu)的提取與分析[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2004年

4 袁鴻雁;;Web表格信息抽取技術(shù)的研究[A];2008'中國信息技術(shù)與應(yīng)用學術(shù)論壇論文集(一)[C];2008年

5 張霄軍;;Web漢英平行新聞?wù)Z料獲取的困難及對策[A];第十屆全國少數(shù)民族語言文字信息處理學術(shù)研討會論文集[C];2005年

6 李紀華;夏薇;;基于XML的web信息提取方法研究[A];全國高校社科信息資料研究會第六次會員代表大會暨第13次學術(shù)研討會論文集[C];2010年

7 吳平博;陳群秀;馬亮;;基于時空分析的線索性事件的抽取與集成系統(tǒng)研究[A];全國第八屆計算語言學聯(lián)合學術(shù)會議(JSCL-2005)論文集[C];2005年

8 付瑞吉;秦兵;劉挺;;面向音樂領(lǐng)域的文本檢索與挖掘系統(tǒng)[A];第五屆全國青年計算語言學研討會論文集[C];2010年

相關(guān)重要報紙文章 前2條

1 史小敏;前景廣闊的信息抽取技術(shù)[N];解放軍報;2004年

2 本報記者 張佳星;靠這個“譜”讓機器會思考[N];科技日報;2018年

相關(guān)碩士學位論文 前10條

1 李長遠;面向運營商資費知識圖譜的信息抽取技術(shù)研究與應(yīng)用[D];北京郵電大學;2019年

2 余鵬;基于信息抽取技術(shù)的房屋租賃信息平臺的設(shè)計與實現(xiàn)[D];華中師范大學;2018年

3 段紹楊;事件抽取關(guān)鍵技術(shù)研究[D];天津大學;2018年

4 吳蘭蘭;基于本體的文本信息抽取技術(shù)及實現(xiàn)[D];東北師范大學;2011年

5 周峰;基于信息抽取技術(shù)的復雜網(wǎng)絡(luò)自動構(gòu)建的研究與實現(xiàn)[D];北京郵電大學;2009年

6 石宇;基于XML的Web信息抽取與集成技術(shù)的研究[D];大連海事大學;2006年

7 秦磊;基于XML的信息抽取和集成模型的研究與設(shè)計[D];南昌大學;2007年

8 程書紅;基于XML的Web信息抽取設(shè)計與實現(xiàn)[D];重慶大學;2007年

9 李知穎;基于包裝器模型的信息抽取算法研究[D];東北師范大學;2009年

10 任仲晟;基于樹形結(jié)構(gòu)的Web信息抽取技術(shù)研究[D];廈門大學;2007年



本文編號:2655920

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2655920.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8b562***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
亚洲午夜精品视频观看| 国产精品二区三区免费播放心 | 国产欧美一区二区久久| 黄片三级免费在线观看| 久久中文字人妻熟女小妇| 亚洲国产丝袜一区二区三区四| 久久本道综合色狠狠五月| 欧美尤物在线视频91| 91免费精品国自产拍偷拍| 国产精品欧美一区二区三区不卡 | 偷拍洗澡一区二区三区| 精品日韩国产高清毛片| 久久精品少妇内射毛片| 欧美一区二区三区喷汁尤物 | 又黄又硬又爽又色的视频| 免费在线播放一区二区| 欧美日韩精品一区免费| 欧美日韩一级aa大片| 欧美午夜不卡在线观看| 亚洲专区中文字幕在线| 欧美一区二区口爆吞精| 国产成人人人97超碰熟女| 成人综合网视频在线观看| 久久中文字人妻熟女小妇| 欧美午夜视频免费观看| 91熟女大屁股偷偷对白| 亚洲乱妇熟女爽的高潮片| 日本婷婷色大香蕉视频在线观看| 亚洲av秘片一区二区三区| 亚洲一区二区欧美激情| 国产精品夜色一区二区三区不卡| 国内外激情免费在线视频| 九九热九九热九九热九九热| 观看日韩精品在线视频| 国产欧美亚洲精品自拍| 字幕日本欧美一区二区| 欧美成人黄色一区二区三区| 国产亚洲精品一二三区| 黄色三级日本在线观看| 国产亚洲系列91精品| 麻豆精品视频一二三区|