基于同義實體識別的Web信息集成
發(fā)布時間:2024-01-29 11:08
準確有效地集成海量Web信息,是Web信息動態(tài)聚合、市場情報分析、輿情分析、商業(yè)智能等分析型應用的重要基礎.針對數(shù)據集成過程中不同實體指代同一實體的問題,利用搜索引擎返回的頁面摘要信息,設計并實現(xiàn)了一種基于搜索引擎的同義實體識別算法FSE,并提出了一種基于同義實體識別的Web信息集成框架.在醫(yī)院信息集成測試數(shù)據集上的實驗結果表明,FSE算法效果優(yōu)于基于Varient Dice、Varient Cosine、Varient Jaccard、Varient Overlap相似度計算的同義實體識別算法.
【文章頁數(shù)】:8 頁
【文章目錄】:
1 引言
2 基于搜索引擎的同義實體識別
2.1 基于搜索引擎的相似度計算
2.2 基于搜索引擎的同義實體發(fā)現(xiàn)
3 基于同義實體識別的Web信息集成系統(tǒng)
3.1 設計架構
3.2 資源層:
3.3 融合層
3.4 服務層
4 實驗與評估
4.1 實驗數(shù)據集
4.2 評價標準
4.3 實驗結果
4.4 討論
5 總結與展望
本文編號:3888070
【文章頁數(shù)】:8 頁
【文章目錄】:
1 引言
2 基于搜索引擎的同義實體識別
2.1 基于搜索引擎的相似度計算
2.2 基于搜索引擎的同義實體發(fā)現(xiàn)
3 基于同義實體識別的Web信息集成系統(tǒng)
3.1 設計架構
3.2 資源層:
3.3 融合層
3.4 服務層
4 實驗與評估
4.1 實驗數(shù)據集
4.2 評價標準
4.3 實驗結果
4.4 討論
5 總結與展望
本文編號:3888070
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3888070.html
教材專著