大数据流式计算:关键技术及系统实例 |
| |
引用本文: | 孙大为,张广艳,郑纬民.大数据流式计算:关键技术及系统实例[J].软件学报,2014,25(4):839-862. |
| |
作者姓名: | 孙大为 张广艳 郑纬民 |
| |
作者单位: | 清华大学 计算机科学与技术系, 北京 100084;清华大学 计算机科学与技术系, 北京 100084;符号计算与知识工程教育部重点实验室(吉林大学), 吉林 长春 130012;清华大学 计算机科学与技术系, 北京 100084 |
| |
基金项目: | 国家自然科学基金(61170008,61272055);国家重点基础研究发展计划(973)(2014CB340402);吉林大学符号计算与知识工程教育部重点实验室资助项目(93K172012K12) |
| |
摘 要: | 大数据计算主要有批量计算和流式计算两种形态,目前,关于大数据批量计算系统的研究和讨论相对充分,而如何构建低延迟、高吞吐且持续可靠运行的大数据流式计算系统是当前亟待解决的问题且研究成果和实践经验相对较少.总结了典型应用领域中流式大数据所呈现出的实时性、易失性、突发性、无序性、无限性等特征,给出了理想的大数据流式计算系统在系统结构、数据传输、应用接口、高可用技术等方面应该具有的关键技术特征,论述并对比了已有的大数据流式计算系统的典型实例,最后阐述了大数据流式计算系统在可伸缩性、系统容错、状态一致性、负载均衡、数据吞吐量等方面所面临的技术挑战.
|
关 键 词: | 大数据计算 流式计算 流式大数据 内存计算 系统实例 |
收稿时间: | 9/7/2013 12:00:00 AM |
本文献已被 CNKI 等数据库收录! |
|
|