时间:2015年6月21日(周日)上午9:30-11:00
地点:旗山校区软件学院507报告厅
主讲:台湾淡江大学统计学系 陈景祥博士、副教授
主办:软件学院
报告摘要:近年来,大数据(Big Data)分析已成为热度很高的资料分析趋势,除大型商业软件公司所推出的大数据解决方案外,也有几个其他开放源码的软件可供选用,其中之一就是已经在国际间广被采用的R语言(或称R软件)。虽然R语言已有不少大数据分析所需的分类(classification)、分群(clustering)、关联规则分析(association analysis)等套件可供分析运用,但R语言在一般安装模式下,受到计算机内存(memory)硬体的限制,仅能处理小于记忆体大小的资料量。本报告将介绍R语言解决大量数据运算的相关套件,例如 ff、bigmemory、PivotalR、H2O,以及RHadoop、hive、RHive 与 Hadoop串接的套件,以提供大数据分析应用的可行解决方案。本报告将引用与分享R软件对大数据分析在两岸最新的实务案例应用。