数据科学课程

必修课程的硕士科学学位的数据。

数据科学课程

一年保修期:第一学期

  • 5300帽 - 数据科学统计我推断:概率的快速回顾,然后介绍了河包括统计推断的基础和最大似然参数估计,假设检验,回归和线性模型侧重于大型数据集工作。介绍重采样和非参数方法。
  • 5322个帽 - 数据库数据的科学:传统的数据库设计和管理基础。数据仓库,提取和结构化和非结构化数据的变换。并发性,稳定性和效率的数据存储检索。介绍在他们的管理(MapReduce的,Hadoop的,等等)用于大规模并行数据结构和软件工具。
  • 5328帽 - 算法 和优化:算法和性能的措施基础。在python教导的,过程包括高效的算法用于分类和检索数据的探索。材料覆盖在这学期的课程包括图形算法和组合优化,动态规划,随机算法和近似算法。
  • 5320帽 - 数据改写(munging)和探索性数据分析:在知识发现的背景下,包括使用数据可视化软件的探索性数据分析。推论,预测和因果关系。多变量模型和独立性。重采样侧重于应用到实际数据的方法和非参数统计。

一年:第二学期

  • 5302帽 - 数据科学II统计推断:非参数和多元推断方法。线性和用于降维非线性方法;介绍贝叶斯方法;图形模型和因果推理。
  • 5738帽 - 数据可视化,演示,报告和可重复的研究:以项目为中心的介绍,对发现的定量信息和知识成果的两个通信的可视化显示。在咨询的情况下可重复研究的基础。
  • 章5327 - 分布式计算数据科学:网投app下载设计基础和大规模并行数据集的维护。他们的管理和非关系数据库。算法并行架构和相关的软件工具,包括MapReduce的/ Hadoop框架和Bigtable的。
  • 5610帽 - 优化和机器学习:监督和无监督学习用与真实数据的工作重点的基础。介绍贝叶斯分析。实施具体的学习范例包括回归,聚类,随机森林,支持向量机,神经网络和内核方法。结构的混合分类器。

第二年:第三学期

  • 5323帽 - 实际数据的科学:工业产品数据的数据和创建的分析。在小团体工作,培养学生分析一个行业提交的数据集从探索性分析,通过建设和假设检验,对产品数据的结构和呈现通知以工业带动的决定。
  • 5931个帽 - 主题在计算数据的科学 - 深度学习设备先进的计算和数据涉及科学。主题有所不同,可能包括图像处理,文本挖掘,非关系数据库中及其管理和软件工程的大规模并行结构。
  • 5303盖帽 - 在数据科学统计推断主题:时间序列预测:先进材料涉及统计推断和大规模的数据集。主题有所不同,可能包括生存分析,时间序列和预测,风险分析,决策理论,社会网络理论,统计推断和机器学习先进的主题分布式软件。

第二年:第四学期:

  • 5940帽 - 实习:在放置一个完整学期的工作和行业数据的科学团队的一部分,而监督下,每周提交报告,以数据科学教师。