项目名称: 基于熵的公共卫生大数据信息挖掘方法研究

项目编号: No.81402763

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 医药、卫生

项目作者: 张汝阳

作者单位: 南京医科大学

项目金额: 23万元

中文摘要: 大数据是针对特定目标多种数据的集合,特征为:体量巨大、形式多样、快速更新、价值隐藏。目前大数据分析的应用、方法仍存在缺陷。研究者往往局限于分析单一数据,基于多源数据分析的研究缺乏。常见机器学习算法并非专门为多维变量间交互作用而设计,容易遗漏高价值的交互信息。此外,现有方法效率低,很难短时间内实现大数据更新、分析结果同步的目标。信息熵因其速度优势,在数据挖掘领域具有重要地位。但是,其相关方法仍有不足,表现为:要求变量相互独立、统计分析过于耗时、无法控制混杂因素、等。公共卫生领域的大数据隐藏着高价值的信息,却缺乏高效、合理的方法。本研究的思路是:(1) 站在公共卫生大数据的层面,从多种来源、动态更新的数据中挖掘信息,建立更加准确的肿瘤风险预测模型。(2) 利用信息熵的优点,针对现有方法的不足,探索计算速度快、统计性能好的分析方法和挖掘策略。(3) 编制CPU、GPU并行计算程序,提供实用工具。

中文关键词: 信息熵;交互作用;降维策略;软件开发;风险预测

英文摘要: Big data is a combination of a series of datasets for a specified research purpose, characterized with volume, variety, velocity and veracity. However, the application or the method of public health big data analysis still needs improvement. Researchers a

英文关键词: Information entropy;Interaction;Dimensionality reduction strategy;Software development;Risk prediction

成为VIP会员查看完整内容
1

相关内容

信息理论的鼻祖之一Claude E. Shannon把信息(熵)定义为离散随机事件的出现概率。所谓信息熵,是一个数学上颇为抽象的概念,在这里不妨把信息熵理解成某种特定信息的出现概率。而信息熵和热力学熵是紧密相关的。
【干货书】R语言探索性数据分析,218页pdf
专知会员服务
61+阅读 · 2021年9月14日
专知会员服务
70+阅读 · 2021年3月27日
【干货书】利用 Python 进行数据分析,470页pdf
专知会员服务
112+阅读 · 2021年3月13日
专知会员服务
46+阅读 · 2020年12月20日
专知会员服务
45+阅读 · 2020年11月13日
Python地理数据处理,362页pdf,Geoprocessing with Python
专知会员服务
113+阅读 · 2020年5月24日
PyGOD: Python 图数据异常检测开源工具库
图与推荐
6+阅读 · 2022年4月11日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
主成分分析用于可视化(附链接)
大数据文摘
1+阅读 · 2022年3月14日
医学图像数据读取及预处理方法总结
极市平台
22+阅读 · 2022年1月4日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
论文浅尝 | 基于深度序列模型的知识图谱补全
开放知识图谱
29+阅读 · 2019年5月19日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
12+阅读 · 2017年9月22日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Automated Data Augmentations for Graph Classification
小贴士
相关VIP内容
【干货书】R语言探索性数据分析,218页pdf
专知会员服务
61+阅读 · 2021年9月14日
专知会员服务
70+阅读 · 2021年3月27日
【干货书】利用 Python 进行数据分析,470页pdf
专知会员服务
112+阅读 · 2021年3月13日
专知会员服务
46+阅读 · 2020年12月20日
专知会员服务
45+阅读 · 2020年11月13日
Python地理数据处理,362页pdf,Geoprocessing with Python
专知会员服务
113+阅读 · 2020年5月24日
相关资讯
PyGOD: Python 图数据异常检测开源工具库
图与推荐
6+阅读 · 2022年4月11日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
主成分分析用于可视化(附链接)
大数据文摘
1+阅读 · 2022年3月14日
医学图像数据读取及预处理方法总结
极市平台
22+阅读 · 2022年1月4日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
论文浅尝 | 基于深度序列模型的知识图谱补全
开放知识图谱
29+阅读 · 2019年5月19日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
12+阅读 · 2017年9月22日
相关基金
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员