首页 > 研究项目先进云分析系统 xData

研究目标
研究适应于云计算环境的海量复杂数据处理新方法与新技术,设计适用高效的数据处理云计算平台框架,开发新颖的并行数据处理算法库,提供高性能数据处理云计算服务,支持云数据系统的海量数据分析应用。在弹性、多用户、新的物理和逻辑存储、处理架构环境下,针对云数据流动性、动态性的基本特征,跟踪和分析其动态变化规律,建立其行为模型,提出海量数据行为的预测方法,形成海量数据智能调度软件,实现资源按需分配和智能调度。针对数据处理过程固有的复杂迭代和领域知识驱动的特性,研究新型交互式数据处理可视化分析技术和方法,开发新一代海量复杂数据处理动态交互式可视分析软件。



研究内容
(1) 海量数据分析平台架构
针对数据规模的量级,数据分析的实时性要求,数据的结构特征,数据分析的算法复杂度等数据特点,设计符合业务需求的云计算数据分析平台架构,为实现高效、实时、准确的数据分析提供云平台支撑。
(2) 海量数据挖掘与算法设计
研发云计算海量数据处理算法,针对海量、超高维、多模态、多类型数据的特点,研究基于多层次子空间的聚类、分类和预测算法,解决海量复杂数据的分析和处理问题。在MapReduce及其扩展模型下实现数据处理常用算法,研发的面向超高维复杂数据的新算法,构建高效能云计算海量数据处理算法库。
(3) 实时性交互与可视化分析
研究海量复杂数据的实时性交互和可视化方法。在实时性方面,针对云计算工程中涉及的体系结构、数据查找和预取、任务调度及算法执行等问题,从全局角度进行动态优化,实现高效的资源调度和实时性优化。
海量复杂数据可视化方法设计新颖的海量数据交互式可视化模型,以将海量数据蕴含的复杂信息以最直接的方式展示给用户。充分考虑海量数据处理流程的复杂、不确定性,稀疏数据时的计算需求、参数设置及调整需求以及模型评估需求,研发海量数据处理模型交互式、动态及柔性构造技术。
(4) 数据安全及隐私保护
研究关联分类方法系统技术、缺失数据分类集成学习方法、恶意软件文件特征及分类方法等重点技术,发展下一代密码和密钥管理技术,为超大规模的云计算用户提供安全支持。