首发于猴子数据分析

慕课中国课程热度分析

慕课中国课程热度分析

目录

分析背景及目的

分析思路及过程

一、提出问题

关键指标：课程热度、课程数量、完课率

该网站作为一个收录其他慕课平台课程的导航网站，仅仅爬取其课程列表缺少用户端的信息，所以对于该数据集仅能对课程的构成、分布、热度进行分析。

业务指标分析思路

二、理解数据

采用后裔采集器爬取了慕课中国网站的课程列表，该数据集共11个字段（标题、标题链接、机构、难度、学时、热度、语言、开课时间、副标题、学科、平台），1609条记录。

文件地址：课程-MOOC中国-后羿采集器.csv 提取码：m3ov

原始数据集为 csv 格式，将其另存为 xlsx 格式，使用 Excel2016 进行分析。如图：

三、数据清洗

1、选择子集

部分课程每年多次开课或者自主学习，所以开课时间字段缺失值较多，并且与研究目标关系不大；

学时字段单位不统一，通过查询平台网站以月、周为单位的课程仅给出了推荐学时范围而且差异较大，无法总体对比，所以将这两个字段隐藏，不作为本次分析的对象。

2、字段重命名

为方便理解，收集数据时已经将字段名称进行了修改。

3、删除重复项

标题链接字段为该数据集中每条记录的唯一标识，对其进行重复项检查及删除。

删除重复项

采集数据时已做了一定处理，课程没有重复项。

4、缺失值处理

经过检查，只有副标题字段有缺失值且缺失值较多。该字段是各课程平台提供认证证书或者就业推荐的职业技能课程（肯定是收费课程了），如网易云课堂的微专业、Coursera的专项课程、Udacity的纳米学位等，将其统一修改为”认证课程“，而缺失值填入“其他课程”作为标记。

填补缺失值

5、一致化处理

将热度中的数值提取出来便于统计

语言字段中，部分国外平台的课程有多种语言的字幕，使用函数截取其第一语言作为分析对象。

截取语言字段

6、异常值处理通过筛选发现平台字段中有一条“中国MOOC平台”的记录，经确认之后将其修改为“中国大学MOOC”。

四、建立模型、得出结论

构建数据透视表，通过变换行列标签对课程数、课程热度进行对比分析。

1、该网站收录自哪些平台、机构的课程的较多？

各平台、机构提供课程数量对比

分别将平台和机构作为行标签，对标题链接的计数项倒序排列，可以看出来慕课中国所收录的课程相对集中在Coursera、中国大学MOOC和edX，而Coursera的课程数量相当夸张，占到了总数的44.19%，处于绝对的领先位置；教育机构中清华大学的课程则是最多的，不过领先优势相对较小。

2、课程难度高低的分布情况如何？

所有课程的难度分为简单（初级）、普通（中级）、难（高级）和极难（专业级）四个层级，上图为各难度层级中课程的数量，很明显简单（初级）的数量远远大于其他难度更高的课程。这也比较符合慕课平台的特点，如果课程难度过大，在线学习可能会有很多疑问难以解答，学习就很难坚持下去，所以多数课程主要时教授基础知识或者某一项技能。

3、受欢迎的课程有哪些特点？

前5%的课程共81个，该图截取了前29个

将热度字段倒序排序，截取热度前5%（81条记录）的课程数据（如图），对比不同难度、学科、平台、机构、语言及副标题的情况下课程数量的多少。经对比分析：

语言：只有中文和英文，毕竟是慕课中国，中文肯定最容易接受。

难度：依然是以简单（初级）为主，超过六成。

平台：来自Coursera的课程超过半数，不过相对于该平台高达711的课程总数，入选前5%的课程仅有5.3%，远低于网易云课堂的19.8%，可能这就是地头蛇吧。

学科：计算机学科独占鳌头，接近六成的占比。

机构：相对分散，共有43个机构，最多的北京大学9.88%。

由于机构较多，该图截取了排名靠前的部分

副标题：加了头衔的“认证课程”占据62.96%，这部分课程多为收费课程，并且给予认证甚至对接就业，目的性较强学习时间安排也比较紧凑，所以更受欢迎。

综上，慕课中国网站收录的1609个课程中，难度不要太大、计算机学科的、来自网易云课堂或者Coursera的中文课程（起码有中文字幕），可能会比较受欢迎。

分析结论及建议

编辑于 2019-03-31 07:48

文章被以下专栏收录

猴子数据分析

人人都需要的通用能力数据分析，公号(猴子数据分析)

玻璃钢生产厂家聊城玻璃钢家具制作哈密不锈钢雕塑厂合肥玻璃钢雕塑制造四川玻璃钢座椅多少钱焦作玻璃钢茶几厂家乌海玻璃钢机械外壳厂家黄山玻璃钢花盆制造周口玻璃钢沙发公司九江玻璃钢花箱公司运城玻璃钢茶几批发绍兴玻璃钢家具生产厂家玉溪玻璃钢设备外壳厂家绵阳玻璃钢垃圾桶厂家宜宾玻璃钢花瓶定制怀化玻璃钢花盆定制唐山玻璃钢种植池定制雅安玻璃钢制品生产厂家鄂州玻璃钢垃圾桶批发济南商场美陈制作合肥玻璃钢休闲椅生产厂家徐州玻璃钢茶几加工台州玻璃钢装饰工程批发呼和浩特玻璃钢沙发定做镇江不锈钢雕塑哪家好滁州玻璃钢摆件公司枣庄不锈钢家具厂昭通玻璃钢外壳制作南通商场美陈定做临沧玻璃钢制品价格大庆玻璃钢座椅厂香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户 315晚会后胖东来又人满为患了高校汽车撞人致3死16伤司机系学生张家界的山上“长”满了韩国人？张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲 “重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后原水城县长再被查凯特王妃现身！外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人多人受伤

玻璃钢生产厂家 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化