基于用戶生成內(nèi)容的位置推斷方法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評論(0)
隨著在線社交媒體的快速發(fā)展和可定位設(shè)備的大量普及,地理位置作為社交媒體大數(shù)據(jù)中一種質(zhì)量極高的信息資源,開始在疾病控制、人口流動性分析和廣告精準(zhǔn)投放等方面得到廣泛應(yīng)用.但是,由于大量用戶沒有指定或者不能準(zhǔn)確指定位置,社交媒體上的地理位置數(shù)據(jù)十分稀疏.針對此數(shù)據(jù)稀疏性問題,提出一種基于用戶生成內(nèi)容的位置推斷方法UGC-Ll(user generate content driven location inference method),實(shí)現(xiàn)對社交媒體用戶和生成文本位置的推斷,為基于位置的個(gè)性化信息服務(wù)提供數(shù)據(jù)支撐.通過抽取用戶生成文本中的本地詞語,構(gòu)建一個(gè)基于詞匯地理分布差異和用戶社交圖譜的概率模型,在多層次的地理范圍內(nèi)推斷用戶位置.同時(shí),提出一個(gè)基于位置的參數(shù)化語言模型,計(jì)算用戶生成文本發(fā)出的城市.在真實(shí)數(shù)據(jù)集上進(jìn)行的評估實(shí)驗(yàn)表明:UGC-LI方法能夠在15km偏移距離準(zhǔn)確定位64.2%的用戶對用戶所在城市的推斷準(zhǔn)確率達(dá)到81.3%:同時(shí),可正確定位32.7%的用戶生成文本發(fā)出的城市,與現(xiàn)有方法相比有明顯的提高.
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于用戶生成內(nèi)容的位置推斷方法下載
相關(guān)電子資料下載
- 數(shù)據(jù)分析工具有哪幾種模式 83
- 中交興路入選2024北京“數(shù)據(jù)要素×”典型案例集 886
- 中國鐵塔與??低曔_(dá)成戰(zhàn)略合作 217
- spark運(yùn)行的基本流程 92
- 季豐電子與孤波科技攜手合作為車規(guī)量產(chǎn)提供大數(shù)據(jù)支持 740
- 智慧園區(qū)綜合安防系統(tǒng)解決方案 83
- 大數(shù)據(jù)采集系統(tǒng)分為幾類 269
- 如何在數(shù)字化時(shí)代實(shí)現(xiàn)精益生產(chǎn)的創(chuàng)新發(fā)展? 117
- 智慧水文監(jiān)測系統(tǒng) 87
- 大數(shù)據(jù)分析平臺網(wǎng)站 96