位置: IT常识 - 正文

【机器学习】python实现吴恩达机器学习作业合集(含数据集)

编辑:rootadmin
【机器学习】python实现吴恩达机器学习作业合集(含数据集)

推荐整理分享【机器学习】python实现吴恩达机器学习作业合集(含数据集),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

学习感言:

从3.7第一天开始,到今天4.4,一个多月的时间,陆续完成了听课,代码实现和总结博客,过程些许艰难,作为一个刚入门的学习者,收获了很多。总结一下这一段时间的学习过程吧。后面的学习方向还在思考。

目录

1.0 线性回归预测

2.0 线性可分logistic逻辑回归

2.1 线性不可分logistic逻辑回归

3.0 logistic逻辑回归手写多分类问题

3.1 神经网络正向传播

4.0 神经网络反向传播(BP算法)

5.0 方差与偏差

6.0 SVM支持向量机

7.0 kmeans聚类

7.1 PCA主成分分析

8.0 异常检测

8.1 推荐系统(协同过滤算法)


作业涉及到的数据集:

之前的数据集过期了,重新更新

链接:https://pan.baidu.com/s/14gmrdWvIYopPWK_qsJHq5w?pwd=ifuf  提取码:ifuf

Ng课程大纲总结 

无监督学习

线性规划,逻辑回归,神经网络,SVM

无监督学习

K-means , PCA , 异常检测

应用【机器学习】python实现吴恩达机器学习作业合集(含数据集)

推荐系统,

大规模机器学习

映射化简和数据并行:

将我们的数据集分配给不多台 计算机,让每一台计算机处理数据集的一个子集,然后我们将计所的结果汇总在求和。这样 的方法叫做映射简化。如果任何学习算法能够表达为,对训练集的函数的求和,那么便能将这个任 务分配给多台计算机(或者同一台计算机的不同 CPU 核心),以达到加速处理的目的。

构建机器学习系统tips

方差/偏差 ,正则化

决定下一步做什么:

算法评估,学习曲线(判断高偏差/高方差问题),误差分析

上限分析:机器学习的应用中,我们通常需要通过几个步骤才能进行最终的预测,我们如何能够 知道哪一部分最值得我们花时间和精力去改善呢?这个问题可以通过上限分析来回答。

问题描述和流程图滑动窗口分类算法(CV)获取大量数据和人工数据以下是零碎:

现有的机器学习种类繁多,我们一般可以进行如下的分类标准:

是否在人类监督下学习(监督学习、非监督学习、半监督学习和强化学习)是否可以动态的增量学习(在线学习和批量学习)是简单的将新的数据点和已知的数据点进行匹配,还是像科学家那样对训练数据进行模型检测,然后建立一个预测模型(基于实例的学习和基于模型的学习) 一 、监督学习与无监督学习 监督学习(Supervised Learning):对于数据集中每一个样本都有对应的标签,包括回归(regression)和分类(classification);K近邻算法线性回归logistic回归支持向量机(SVM)决策树和随机森林神经网络无监督学习(Unsupervised Learning):数据集中没有任何的标签,包括聚类(clustering),著名的一个例子是鸡尾酒晚会。实现公式:[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x’);聚类算法

K均值算法(K-means)基于密度的聚类方法(DBSCAN)最大期望算法可视化和降维

主成分分析(PCA)核主成分分析关联规则学习

AprioriEclat 异常检测半监督学习 有些算法可以处理部分标记的训练数据,通常是大量未标记的数据和少量标记的数据,这种成为半监督学习。

如照片识别就是很好的例子。在线相册可以指定识别同一个人的照片(无监督学习),当你把这些同一个人增加一个标签的后,新的有同一个人的照片就自动帮你加上标签了。

强化学习

强化学习,它的学习系统能够观测环境,做出选择,执行操作并获得回报,或者是以负面回报的形式获得惩罚。它必须自行学习什么是最好的策略,从而随着时间推移获得最大的回 

二、在线学习 

    如果你有一个由连续的用户流引发的连续的数据流,进入你的网站,你能做的是使用一个在线学习机制,从数据流中学习 用户的偏好,然后使用这些信息来优化一些关于网站的决策。

    在线学习算法指的是对数据流而非离线的静态数据集的学习。许多在线网站都有持续不断的用户流,对于每一个用户,网站希望能在不将数据存储到数据库中便顺利地进行算法学习。

在线学习:产品搜索界面   产品推荐 三、模型训练及选择(model selection)

可以依据训练误差和测试误差来评估假设hθ(x); 一般来说,我们将数据集划分成训练集(60%)、验证集(20%)和测试集(20%);

训练集

训练集用来训练模型,学习参数θ :minJ(θ);即确定模型的权重和偏置这些参数,通常我们称这些参数为学习参数。

验证集

验证集用于模型的选择,更具体地来说,验证集并不参与学习参数的确定,也就是验证集并没有参与梯度下降的过程。用训练集对模型训练完毕后,再用验证集对模型测试,测试模型是否准确而不是训练模型的参数。

测试集

测试集只使用一次,即在训练完成后评价最终的模型时使用。它既不参与学习参数过程,也不参数超参数选择过程,而仅仅使用于模型的评价。 不能在训练过程中使用测试集,而后再用相同的测试集去测试模型。这样做其实是一个cheat,使得模型测试时准确率很高。

四、模型优化

欠拟合,高偏差:说明没有很好的拟合训练数据 

过拟合,高方差:拟合训练数据过于完美,J(θ)≈0,导致模型的泛化能力很差,对于新样本不能准确预测

五、机器学习系统设计不对称分类的误差评估(skewed classes)

错误率:有多少比例的西瓜被判断错误;

查准率(precision):算法挑出来的西瓜中有多少比例是好西瓜;

查全率(recall):所有的好西瓜中有多少比例被算法跳了出来。

如果我们想要比较确信为正例时才判定为正例,那么提高阈值,模型会对应高查准率,低召回率;如果希望避免假阴性,那么降低阈值,模型会对应低查准率,高召回率六、高级优化算法:共轭梯度算法BFGSL-BFGS

        优点:无需人工选择参数α;运算速度比梯度下降更快 

        缺点:更加复杂

最后:放一下Ng的结语,激励自己继续前进吧~  感谢老师

本文链接地址:https://www.jiuchutong.com/zhishi/299421.html 转载请保留说明!

上一篇:朴素贝叶斯(Naive Bayes)详解(朴素贝叶斯算法)

下一篇:CV攻城狮入门VIT(vision transformer)之旅——VIT原理详解篇

  • 传统行业与互联网行业之间的盲区(传统行业与互联网行业的优点和缺点)

    传统行业与互联网行业之间的盲区(传统行业与互联网行业的优点和缺点)

  • 爱奇艺怎么截取视频片段(爱奇艺怎么截取片段保存到相册)

    爱奇艺怎么截取视频片段(爱奇艺怎么截取片段保存到相册)

  • 哔哩哔哩一个硬币相当于多少元(哔哩哔哩一个硬币等于多少经验)

    哔哩哔哩一个硬币相当于多少元(哔哩哔哩一个硬币等于多少经验)

  • 红米手机接电话黑屏能怎么调整呢(红米手机接电话就没网络怎么解决)

    红米手机接电话黑屏能怎么调整呢(红米手机接电话就没网络怎么解决)

  • 通常说的cpu是什么

    通常说的cpu是什么

  • 苹果11怎么锁屏不翻转(苹果11怎么锁屏录像)

    苹果11怎么锁屏不翻转(苹果11怎么锁屏录像)

  • 手机号可以注销掉吗(手机号可以注销重新办新卡吗)

    手机号可以注销掉吗(手机号可以注销重新办新卡吗)

  • 允许不受信任的快捷指令之前(允许不受信任的快捷指令打不开怎么弄)

    允许不受信任的快捷指令之前(允许不受信任的快捷指令打不开怎么弄)

  • oppor11相机声音怎么关(oppo 相机声音)

    oppor11相机声音怎么关(oppo 相机声音)

  • 刚开通黄钻可以取消吗(黄钻开通后可以马上取消么)

    刚开通黄钻可以取消吗(黄钻开通后可以马上取消么)

  • 如何设置竖排文本框(如何设置竖排文本框艺术字)

    如何设置竖排文本框(如何设置竖排文本框艺术字)

  • ios13.3哪些机型可以更新(ios13的手机有哪些)

    ios13.3哪些机型可以更新(ios13的手机有哪些)

  • 基准键分别是哪些键(基准键分别是哪歇间)

    基准键分别是哪些键(基准键分别是哪歇间)

  • 小爱音箱可以连接手机热点么(小爱音箱可以连接酷狗音乐吗)

    小爱音箱可以连接手机热点么(小爱音箱可以连接酷狗音乐吗)

  • i7级志强和i7有什么区别吗(至强i7级和酷睿i5)

    i7级志强和i7有什么区别吗(至强i7级和酷睿i5)

  • 华为怎么解除应用截屏限制(华为怎么解除应用截屏限制 智能截屏也不行)

    华为怎么解除应用截屏限制(华为怎么解除应用截屏限制 智能截屏也不行)

  • Reno Ace怎么恢复微信聊天记录(oppo ace如何恢复出厂设置)

    Reno Ace怎么恢复微信聊天记录(oppo ace如何恢复出厂设置)

  • web安全与网络安全的区别(web安全与网络安全哪个好)

    web安全与网络安全的区别(web安全与网络安全哪个好)

  • 局域网硬件组成部分(局域网硬件组成一般有)

    局域网硬件组成部分(局域网硬件组成一般有)

  • 不属于结构化程序的方法是(不属于结构化程度的是)

    不属于结构化程序的方法是(不属于结构化程度的是)

  • 什么是数据安全的第一道保障(什么是数据安全的特征)

    什么是数据安全的第一道保障(什么是数据安全的特征)

  • 淘宝会员v2什么意思(淘宝v2会员从哪里看)

    淘宝会员v2什么意思(淘宝v2会员从哪里看)

  • 手机下载管理器在哪里打开(手机自带浏览器下载安装)

    手机下载管理器在哪里打开(手机自带浏览器下载安装)

  • 安卓隔空投送在哪打开(隔空投送到安卓)

    安卓隔空投送在哪打开(隔空投送到安卓)

  • 数据湖和数据仓库的差别(数据湖和数据仓库hudi)

    数据湖和数据仓库的差别(数据湖和数据仓库hudi)

  • pr如何提取纯净人声(pr如何提取纯净人声视频教程)

    pr如何提取纯净人声(pr如何提取纯净人声视频教程)

  • xr可以指纹解锁吗(xr指纹解锁怎么设置)

    xr可以指纹解锁吗(xr指纹解锁怎么设置)

  • 苹果手机接不到电话怎么回事(苹果手机接不到微信语音通话)

    苹果手机接不到电话怎么回事(苹果手机接不到微信语音通话)

  • 如何理解递延所得税费用的计算公式
  • 金税盘如何交服务费
  • 纳税调整项目包括哪些?请简单列举
  • 所得税费用包括递延所得税吗
  • 涉及免所得税及减半所得税的业务如何做账
  • 设立登记核准通知书未签名不能办理其他业务
  • 非营利组织支付给他人劳务费
  • 公司购车需要公章吗
  • 工业总产值收入法
  • 房地产涉及的税种和税率
  • 房地产公司销售商品房属于增值税征收范围吗
  • 通行费进项抵扣条件
  • 增值税税控系统技术维护费计入什么科目
  • 允许列支的捐赠比例
  • 支付宝对公账户还款清零要多久
  • 烟丝消费税组成计税价格
  • 免抵退系统应调整免抵退额吗?
  • 怎么进行现金流量分析
  • 冲红发票开错了怎么办
  • 总公司和分公司的合作协议
  • 注册表修改系统安装日期
  • 网页浏览器字体颜色怎么改
  • 国家统计局一套表平台网址
  • 企业支出的辞退补偿金
  • 行纪人的权利
  • 贸易公司出口是什么意思
  • 销售折扣的会计分录处理
  • 同城票据清算会怎么样
  • 员工交通补贴需要发票吗
  • 泰姬陵 (© Michele Falzone/plainpicture)
  • 应收账款和应付账款怎么对冲
  • 什么是增值税普票和专票
  • javascript背景图片怎么导入
  • 计提坏账的比例是多少
  • 蓝桥杯大赛2021
  • gdal官方文档
  • php 截取字符
  • 公司银行取款流程
  • 小微企业增值税免税政策2023年
  • 外贸出口企业的税务风险
  • 在php中声明变量时,变量名称以什么符号开头
  • cms是前端还是后端
  • 土地补偿款有哪些款项
  • 两处取得收入,如何进行个税的申报?
  • 新事业单位会计制度下固定资产的核算
  • 出口货物赠品如何申报
  • 2021年股权变更要怎么办理?
  • 固定资产每月计提还是每年计提
  • 小规模纳税人每月不超过10万
  • 报销差旅费如何做记账凭证
  • 主营业务成本包括工资吗
  • 国有独资企业董事会成员组成规定
  • 建筑安装结转成本分录
  • 个税手续费返还政策文件
  • 车辆使用费包括油费吗
  • 公司活动费用分录
  • 算账的意思是什么?
  • 最基本的长度单位是什么
  • fedora os
  • Fedora Core 5.0 安装教程,菜鸟图文教程(linux text)
  • win8桌面右键无法使用
  • mysql如何添加外键
  • qq仿ios
  • css滤镜特效属于css样式定义分类中的
  • android指南针源码
  • linux shell if -e
  • 自动搜索工具
  • Android Http访问网络 学习(慕课网学习)
  • js中的set
  • 清除安卓系统垃圾
  • jquery弹出框样式大全
  • android:imeOptions属性
  • 3.5车船税2400还是3000
  • 浙江国税电子税务局
  • 国家税务总局公告2013年第12号
  • 新疆地方税务局
  • 诚信励志语录经典短句
  • 图书行业税率多少
  • steam充值码生成
  • 亿企代账和云账房哪个好用?
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设