项目名称: 内容和结构化数据多维分析关键技术研究

项目编号: No.61003051

项目类型: 青年科学基金项目

立项/批准年度: 2011

项目学科: 轻工业、手工业

项目作者: 彭朝晖

作者单位: 山东大学

项目金额: 7万元

中文摘要: 本项目研究内容和结构化数据多维分析的关键技术,旨在实现内容数据和结构化数据的深度集成分析,为用户全面洞察数据蕴藏的规律提供有力支持。主要研究内容和成果包括:(1)非结构化数据处理方面,提出一种基于SVM和扩展条件随机场的Web实体活动抽取方法,能够从Web上准确的抽取实体的活动信息,提出一种基于Markov逻辑网的两阶段数据冲突解决方法,考虑不同属性间冲突解决的相互影响,从而提高数据冲突解决的准确率。(2)结构化、非结构化数据关联方面,提出一种基于两层条件随机场的评论与数据库实体匹配方法,将相关评论信息与已集成的数据库实体相匹配,为用户提供更为全面的实体全景视图。(3)文本数据OLAP建模方法方面,提出了一种新的框架来将文本分析和OLAP进行结合,利用信息抽取和文本挖掘的方法来进行非结构化数据的多维分析,另外提出一种社会信息网络的多维数据分析方法,有效分析信息网络的信息。本项目已发表论文10篇,全部为EI收录,其中2篇论文分别发表在计算机学报和软件学报,项目成果预期将在商业智能、企业资源管理、情报分析等系统中得到广泛应用。

中文关键词: 内容数据;结构化数据;多维分析

英文摘要: The project examines the key technologies of multidimensional analysis of the content and structured data,so as to achieve the deep integration and analysis of the data, which strongly supports the user to insight into the hidden patterns in the data.The main research points include:(1)In the area of unstructured data processing, the project presents a method based on support vector machine (SVM) and extended condition random fields (ECRFs) to extract Web entity activities accurately, and a 2-stage approach for resolving data conflict based on Markov Logic Networks is proposed, in which mutual influence of different attributes are considered, so that the approach can resolve the integrated data conflict effectively and more accurately.(2)About the technology of semantic association between the content and structured data, a method based on 2-layer Conditional Random Fields(CRF) to match relevant reviews to integrated database objects is proposed, providing users the more complete holistic views of entities.(3)In the area of OLAP modeling on text data, a new framework combining text analysis and OLAP is proposed, which is based on information extraction and text mining and gives multidimensional anaylsis results well on unstructured data and social information network.Many important resuls have been obtained on theory and technology, 10 papers have been published and indexed by EI. It is expected that the achievements of the project are widely used in business intelligence, enterprise resource planning, and intelligence analysis.

英文关键词: content data; structured data; multidimensional analysis

成为VIP会员查看完整内容
0

相关内容

专知会员服务
43+阅读 · 2021年10月20日
算法分析导论, 593页pdf
专知会员服务
147+阅读 · 2021年8月30日
专知会员服务
35+阅读 · 2021年3月21日
【斯坦福CS224W】知识图谱推理,84页ppt
专知会员服务
119+阅读 · 2021年2月19日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
专知会员服务
193+阅读 · 2020年10月14日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
专知会员服务
129+阅读 · 2020年7月10日
【图神经网络(GNN)结构化数据分析】
专知会员服务
115+阅读 · 2020年3月22日
CIKM'21 | 基于图的异构数据集成系统HAO Unity
图与推荐
0+阅读 · 2021年10月28日
【图谱构建】图谱构建之知识抽取
AINLP
20+阅读 · 2020年5月5日
【北大】知识图谱的关键技术及其智能应用
专知
112+阅读 · 2019年9月19日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
Twitter情感分析及其可视化
数据挖掘入门与实战
21+阅读 · 2018年3月20日
文本聚类:从非结构化数据快速获取见解
Datartisan数据工匠
15+阅读 · 2017年10月12日
【知识图谱】CCKS-2017 行业知识图谱构建与应用-下篇
报名 | 知识图谱前沿技术课程(暨学术交流)
PaperWeekly
17+阅读 · 2017年7月10日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月14日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
小贴士
相关VIP内容
专知会员服务
43+阅读 · 2021年10月20日
算法分析导论, 593页pdf
专知会员服务
147+阅读 · 2021年8月30日
专知会员服务
35+阅读 · 2021年3月21日
【斯坦福CS224W】知识图谱推理,84页ppt
专知会员服务
119+阅读 · 2021年2月19日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
专知会员服务
193+阅读 · 2020年10月14日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
专知会员服务
129+阅读 · 2020年7月10日
【图神经网络(GNN)结构化数据分析】
专知会员服务
115+阅读 · 2020年3月22日
相关资讯
CIKM'21 | 基于图的异构数据集成系统HAO Unity
图与推荐
0+阅读 · 2021年10月28日
【图谱构建】图谱构建之知识抽取
AINLP
20+阅读 · 2020年5月5日
【北大】知识图谱的关键技术及其智能应用
专知
112+阅读 · 2019年9月19日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
Twitter情感分析及其可视化
数据挖掘入门与实战
21+阅读 · 2018年3月20日
文本聚类:从非结构化数据快速获取见解
Datartisan数据工匠
15+阅读 · 2017年10月12日
【知识图谱】CCKS-2017 行业知识图谱构建与应用-下篇
报名 | 知识图谱前沿技术课程(暨学术交流)
PaperWeekly
17+阅读 · 2017年7月10日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
微信扫码咨询专知VIP会员