加入VIP全站无限制下载,淘宝开通地址:
http://www.hegouvip.com/taobao.html
前言
你是否需要有一个随时可以指导你的导师?
你是否希望能在闲暇时间,低成本为自己充电?
你是否希望结识一群有同技术爱好的朋友们?
低成本、零风险、优质课程、专属导师、学习时间不用太多、结识圈内朋友不会太少,这样的学习机会,你需要么?眼下就有这样的培训,详细阅读下文吧,别错过咯!
逆向式学习课程五大特点:
【原创优质课件】视频均为老师精心录制,绝对原创
【学习时间自由】资料均可下载到本地,学习时间由你做主
【互动交流丰富】学员QQ群及论坛,随时与老师及同学互动讨论
【作业促进学习】每周完成作业,在交作业及批改作业中,完成学员与老师的直线沟通
【学费几乎免费】每周认真完成作业并通过结业测验,逆向式挑战学费全退
一、课程由来
近年来,由于存储设备的单位成本以惊人的速度下降(1G 硬盘空间的成本现在只需要几美分,这在过去难以想象),我们可以轻而易举地积累起大量的数 据。电信 运营商,可以记录用户通话、短消息、无线上网产生的每一条信令,省级运营商一小时写入存储设备的数据量可以达到几百G。电子商务网站,可以记录用户的每一 次交易,甚至每一次点击,可以复原用户的完整访问路径找出用户的兴趣点。城市监控体系,在各个重要路口,高速公路上的摄像头,每秒钟都在产生海量的视频数 据。在生命科学领域,对人体的DNA分析,一个个体就能产生几个G数据,可以想象如果一个生物信息数据库里包含了成千万的个体数据,信息量将会是怎样一个 规模,如此等等,不胜枚举。我们毫无疑问,正处于一个信息爆炸的时代。
很不幸的是,我们得到了大量的数据,而这些数据中的绝大部分,在它 的生命周期里基本上都被闲置着,从来没有考虑过产生任何的价值,唯一的用途就是“保存备 查”。尽管“啤酒与尿布”的故事,已经写入教科书有10多年了,几乎每一个接受过专业教育的同仁都知道数据挖掘能产生的价值,但是直到今天,我们对数据的 处理依然停留在按预定指标进行统计这种很低的水平上。造成这种情况的原因有很多。一方面,由于业务人员和IT人员的工作鸿沟,使到即使能提出数据分析的需 求都成了一个很大的困难。在各公司里保管数据的大多是IT人员,他们对业务的了解可能并非很深入,而业务人员也鲜有对数据有深入认识者,他们通常都缺乏必 要的数学素质和知识基础去进行建模和深入的分析工作。另一方面,数据分析专家具有深厚的数学处理能力,善于建模和构筑算法,但是由于无法得到合适的需求, 他们的能力也无从施展。另外数学家、统计学家们很多并不熟悉现代的IT软硬件设备的特性,对于集群、分布式系统、大规模存储、云计算、数据库等认识几乎为 零,对于算法的实现可能还停留在对着PC写C语言程序的水平上,对于海量数据,无法利用现代化设备的能力,使到算法是否能真正实现变成生产力存有很大的疑 问。
现 在这门《数据分析系列网络课程》正是要打破这种鸿沟。用新兴的互联网教育模式,把各应用领域的业务专家、数据分析专家、IT专家推荐给学习者,向有志于学 习数据分析知识发挥数据价值的朋友能得到低成本交流的机会。我们的目标是在中国传播“技术成就梦想,数据产生价值”的观念,使学习者能快速提升其个人能 力,在新的挑战面前获取更多个人机会,企业能在保存的海量数据中炼出黄金。
什么是SPSS?
SPSS 是Statistical Product andService solutions(统计产品与服务解决方案)的简称,是成立于1975年的美国SPSS公司的软件产品,是专门为广大非统计专业人士设计提供的统计分析 软件包,目前广泛应用于教育、心理、市场调查与分析、医疗、生物、金融等领域和行业。SPSS统计分析软件以其强大的统计分析功能、方便易用的用户操作方 式、灵活的表格式分析报告和精美的图形展现形式,赢得了各领域广大数据分析人员的喜爱,SPSS是获得全世界认可的通用统计工具软件。IBM公司2009 年用12亿美元收购了分析软件提供商SPSS。如今SPSS已出至版本20.0,而且更名为IBM SPSS。
SPSS 在全球约有25万家产品用户,它们分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计 软件。SPSS最突出的特点就是操作界面极为友好,输出结果美观漂亮,它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示 出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。
1999 年SPSS公司收购了ISL公司,对Clementine产品进行重新整合和开发,现在Clementine已经成为SPSS公司的又一亮点。 作为一个 数据挖掘平台, Clementine结合商业技术可以快速建立预测性模型,进而应用到商业活动中,帮助人们改进决策过程。强大的数据挖掘功能和显著的投资回报率使得 Clementine在业界久负盛誉。同那些仅仅着重于模型的外在表现而忽略了数据挖掘在整个业务流程中的应用价值的其它数据挖掘工具相比, Clementine其功能强大的数据挖掘算法,使数据挖掘贯穿业务流程的始终,在缩短投资回报周期的同时极大提高了投资回报率。
二、课程简述
开课时间:课程持续时间大约为12周。本期开课时间 待定
授课对象:这是一门数学+IT的课程,适合已经有一定的IT基础,但对数据分析行业尚不了解的朋友进修学习。
授课讲师:吕 威 博士,北京师范大学珠海分校副教授,硕士导师。中山大学海量数据与云计算中心成员。多年数据挖掘专业课程授课经验,主要的兴趣包括数据挖掘算法与应用、云 计算安全、隐私保护的数据挖掘与数据发布、机器学习和数据质量优化等。有20多篇研究论文发表在国内外核心刊物上。最近主持国家自然科学基金关于云计算安 全的研究项目。作为主要成员参与了多个电子商务、电信运营商数据挖掘项目,对将数据挖掘理论如何应用于实际行业有深刻的理解。
学习收获预期:算法有一定的了解,有一定的使用SPSS解决问题的能力
课程内容:
1 基础数据分析知识,包括一些概率统计里的概念、术语,和基本统计量的计算方法等。
2 一些常用的数据分析和数据挖掘算法,以及有关的各种领域里的实际应用案例分析
3 流行数据分析软件SPSS操作和使用方法
课程安排:
第一周 SPSS概览, SPSS安装与进入,数据文件的管理, 建立与保存数据文件-File,能够编辑数据文件,从原有变量计算新变量
第 二周 Descriptive Statistics菜单, Frequencies,Explore,Crosstabs过程,Compare Means菜单, Means过程,One-Samples T Test过程,Independent-Samples TTest过程
第三周 Compare Means菜单, General Linear Model菜单,两因素方差分析,univarate协方差分析,其他较简单的方差分析问题
第四周 General Linear Model菜单,多元方差分析,重复测量的方差分析 , Correlate菜单
第五周 Regression菜单,Linear过程 ,Binary Logistic过程,NonparametricTests菜单
第六周 SPSS结果窗口用法,结果浏览窗口,掌握WORD等软件中使用输出结果,进行图片编辑, SPSS统计绘图功能, 常用统计图 ,因素分析
第七周 SPSS Clementine软件功能演练,熟悉SPSS Clementine软件功能,了解SPSS Clementine 软件的各选项面板和操作方法。
第八周 SPSS Clementine 数据可视化,熟悉SPSS Clementine 绘图,了解SPSSClementine 图形选项面板各节点的使用方法;熟练掌握SPSS Clementine 数据可视化流程。
第九周 决策树C5.0 建模(结合案例),熟悉SPSS Clementine 软件建模方法和技术,掌握SPSS Clementine分布图、散点图、网络图的创建方法,掌握决策树C5.0 建模方法。
第十周 关联规则挖掘(超市购物篮分析),熟悉C5.0 规则归纳、掌握购物篮分析的方法。
第十一周 欺诈屏蔽/异常检测/神经网络,熟悉各种聚类分析方法;了解神经网络分析方法与过程;掌握异常检测的方法。
第十二周 分类和回归树节点(C&RT),掌握C&RT分类算法,掌握决策树的建立和修剪,了解C&RT分类算法在管理决策中的应用。
综合实验:熟悉Clementine软件从数据导入到结果输出的全过程。应用各种数据挖掘算法解决实际问题
下载地址本帖隐藏的内容:
链接: http://pan.baidu.com/s/1kTA6Nsz 密码: 27q2
解压密码:www.hegouvip.com
|
|