房地產(chǎn)交易信息搜索和匹配技術(shù)的研究與實(shí)現(xiàn)
本文關(guān)鍵詞:房地產(chǎn)交易信息搜索和匹配技術(shù)的研究與實(shí)現(xiàn) 出處:《杭州電子科技大學(xué)》2013年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 主題爬蟲 向量空間模型 URL知識(shí)庫(kù) 蟻群算法 遺傳算法
【摘要】:目前,隨著國(guó)民經(jīng)濟(jì)的快速發(fā)展,房地產(chǎn)市場(chǎng)交易日趨活躍。信息技術(shù)的快速發(fā)展,帶動(dòng)了房地產(chǎn)行業(yè)的信息化進(jìn)程。房產(chǎn)門戶網(wǎng)站在市場(chǎng)交易中的影響愈來(lái)愈深刻,如58同城,21世紀(jì)不動(dòng)產(chǎn),新浪樂(lè)居等,從房產(chǎn)門戶網(wǎng)站獲取房屋信息進(jìn)行比較選擇是愈來(lái)愈多購(gòu)房者的首選。而對(duì)于政府部門來(lái)說(shuō),建立一個(gè)覆蓋面廣、信息準(zhǔn)確的基礎(chǔ)房產(chǎn)信息數(shù)據(jù)庫(kù)有著重大意義,可以有效提高稅收工作的效率,防止偷稅漏稅、陰陽(yáng)合同等現(xiàn)象出現(xiàn)。 本文通過(guò)對(duì)房地產(chǎn)信息特點(diǎn)的分析和互聯(lián)網(wǎng)信息搜索與匹配技術(shù)的研究,實(shí)現(xiàn)了一個(gè)基于主題爬蟲技術(shù)的房地產(chǎn)交易信息系統(tǒng)。首先,研究并提出了一種基于URL知識(shí)庫(kù)的主題爬蟲方案。該爬蟲通過(guò)收集父網(wǎng)頁(yè)內(nèi)容、錨信息、URL內(nèi)容計(jì)算得到目標(biāo)網(wǎng)頁(yè)與主題的相關(guān)度,在此基礎(chǔ)上提取URL的特征并將其表示成一個(gè)帶權(quán)重的向量來(lái)構(gòu)建一個(gè)URL知識(shí)庫(kù),并對(duì)URL不斷學(xué)習(xí)來(lái)動(dòng)態(tài)更新URL知識(shí)庫(kù),以提高網(wǎng)頁(yè)主題的匹配度。然后,研究并設(shè)計(jì)了基于遺傳蟻群算法(GA-ACA)的信息搜索策略。GA-ACA算法主體過(guò)程運(yùn)用遺傳算法,利用遺傳算法的隨機(jī)性、快速性、全局收斂性,并結(jié)合蟻群算法的并行性、正反饋機(jī)制以及高效率的求解過(guò)程。一方面通過(guò)蟻群算法的信息素來(lái)指導(dǎo)遺傳選擇,,另一方面遺傳算法的選擇結(jié)果引起信息素的更新,并用于指導(dǎo)下一次的遺傳選擇,使兩種算法優(yōu)勢(shì)互補(bǔ)。最后,實(shí)驗(yàn)表明以上方法的應(yīng)用在爬蟲系統(tǒng)的查準(zhǔn)率、查全率上較Shark-Search算法提高了5%,比Best-First-Search算法提高了20%左右。
[Abstract]:At present , with the rapid development of national economy , the real estate market transaction is becoming more and more active . The rapid development of information technology drives the information process of real estate industry . Based on the analysis of real estate information and the research of Internet information search and matching technology , a real estate transaction information system based on URL knowledge base is implemented . First , the paper studies and proposes a kind of information search strategy based on URL knowledge base .
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:TP391.3;TP18
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 鄭源;任海英;;時(shí)態(tài)GIS在房屋全生命周期管理信息平臺(tái)中的設(shè)計(jì)與應(yīng)用[J];北京測(cè)繪;2012年03期
2 蔣玲艷;張軍;鐘樹鴻;;蟻群算法的參數(shù)分析[J];計(jì)算機(jī)工程與應(yīng)用;2007年20期
3 朱煒;王超;李俊;潘金貴;;Web超鏈分析算法研究[J];計(jì)算機(jī)科學(xué);2003年09期
4 周德懋;李舟軍;;高性能網(wǎng)絡(luò)爬蟲:研究綜述[J];計(jì)算機(jī)科學(xué);2009年08期
5 肖美華,薛錦云;遺傳算法機(jī)理的研究及應(yīng)用[J];計(jì)算機(jī)工程;2003年20期
6 歐陽(yáng)柳波,李學(xué)勇,李國(guó)徽,王鑫;專業(yè)搜索引擎搜索策略綜述[J];計(jì)算機(jī)工程;2004年13期
7 伍愛(ài)華;李智勇;;蟻群遺傳算法的多目標(biāo)優(yōu)化[J];計(jì)算機(jī)工程;2008年08期
8 徐照財(cái);程顯毅;;基于多Agent系統(tǒng)的定題爬蟲算法[J];計(jì)算機(jī)工程;2008年16期
9 曾廣樸;范會(huì)聯(lián);;基于遺傳算法的聚焦爬蟲搜索策略[J];計(jì)算機(jī)工程;2010年11期
10 李勇;韓亮;;主題搜索引擎中網(wǎng)絡(luò)爬蟲的搜索策略研究[J];計(jì)算機(jī)工程與科學(xué);2008年03期
相關(guān)博士學(xué)位論文 前3條
1 陳霄;DNA遺傳算法及應(yīng)用研究[D];浙江大學(xué);2010年
2 楊劍峰;蟻群算法及其應(yīng)用研究[D];浙江大學(xué);2007年
3 劉波;蟻群算法改進(jìn)及應(yīng)用研究[D];燕山大學(xué);2010年
相關(guān)碩士學(xué)位論文 前5條
1 彭正非;面向汽車行業(yè)的主題爬蟲研究與實(shí)現(xiàn)[D];華中科技大學(xué);2011年
2 劉強(qiáng)國(guó);主題搜索引擎設(shè)計(jì)與研究[D];電子科技大學(xué);2007年
3 葉勤勇;基于URL規(guī)則的聚焦爬蟲及其應(yīng)用[D];浙江大學(xué);2007年
4 崔金國(guó);基于蟻群算法的主題爬蟲技術(shù)研究與實(shí)現(xiàn)[D];成都理工大學(xué);2010年
5 馮思平;Web招標(biāo)信息搜索及管理系統(tǒng)的設(shè)計(jì)[D];電子科技大學(xué);2009年
本文編號(hào):1436845
本文鏈接:http://sikaile.net/jingjilunwen/fangdichanjingjilunwen/1436845.html