位置: IT常识 - 正文

机器学习中的数学——距离定义(八):余弦距离(Cosine Distance)

编辑:rootadmin
机器学习中的数学——距离定义(八):余弦距离(Cosine Distance)

推荐整理分享机器学习中的数学——距离定义(八):余弦距离(Cosine Distance),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

机器学习中的数学——距离定义(八):余弦距离(Cosine Distance)

分类目录:《机器学习中的数学》总目录 相关文章: · 距离定义:基础知识 · 距离定义(一):欧几里得距离(Euclidean Distance) · 距离定义(二):曼哈顿距离(Manhattan Distance) · 距离定义(三):闵可夫斯基距离(Minkowski Distance) · 距离定义(四):切比雪夫距离(Chebyshev Distance) · 距离定义(五):标准化的欧几里得距离(Standardized Euclidean Distance) · 距离定义(六):马氏距离(Mahalanobis Distance) · 距离定义(七):兰氏距离(Lance and Williams Distance)/堪培拉距离(Canberra Distance) · 距离定义(八):余弦距离(Cosine Distance) · 距离定义(九):测地距离(Geodesic Distance) · 距离定义(十): 布雷柯蒂斯距离(Bray Curtis Distance) · 距离定义(十一):汉明距离(Hamming Distance) · 距离定义(十二):编辑距离(Edit Distance,Levenshtein Distance) · 距离定义(十三):杰卡德距离(Jaccard Distance)和杰卡德相似系数(Jaccard Similarity Coefficient) · 距离定义(十四):Ochiia系数(Ochiia Coefficient) · 距离定义(十五):Dice系数(Dice Coefficient) · 距离定义(十六):豪斯多夫距离(Hausdorff Distance) · 距离定义(十七):皮尔逊相关系数(Pearson Correlation) · 距离定义(十八):卡方距离(Chi-square Measure) · 距离定义(十九):交叉熵(Cross Entropy) · 距离定义(二十):相对熵(Relative Entropy)/KL散度(Kullback-Leibler Divergence) · 距离定义(二十一):JS散度(Jensen–Shannon Divergence) · 距离定义(二十二):海林格距离(Hellinger Distance) · 距离定义(二十三):α-散度(α-Divergence) · 距离定义(二十四):F-散度(F-Divergence) · 距离定义(二十五):布雷格曼散度(Bregman Divergence) · 距离定义(二十六):Wasserstein距离(Wasserstei Distance)/EM距离(Earth-Mover Distance) · 距离定义(二十七):巴氏距离(Bhattacharyya Distance) · 距离定义(二十八):最大均值差异(Maximum Mean Discrepancy, MMD) · 距离定义(二十九):点间互信息(Pointwise Mutual Information, PMI)

余弦距离(Cosine Distance)也可以叫余弦相似度。 几何中夹角余弦可用来衡量两个向量方向的差异,机器学习中借用这一概念来衡量样本向量之间的差异。相比距离度量,余弦相似度更加注重两个向量在方向上的差异,而非距离或长度上。nnn维空间中的余弦距离为: cos⁡(x,y)=x⋅y∣x∣⋅∣y∣=∑i=1nxiyi∑i=1nxi2∑i=1nyi2\cos(x, y)=\frac{x\cdot y}{|x|\cdot|y|}=\frac{\sum_{i=1}^nx_iy_i}{\sqrt{\sum_{i=1}^nx_i^2}\sqrt{\sum_{i=1}^ny_i^2}}cos(x,y)=∣x∣⋅∣y∣x⋅y​=∑i=1n​xi2​​∑i=1n​yi2​​∑i=1n​xi​yi​​

余弦取值范围为[−1,1][-1,1][−1,1],求得两个向量的夹角,并得出夹角对应的余弦值,此余弦值就可以用来表示这两个向量的相似性。夹角越小,趋近于0度,余弦值越接近于1,它们的方向更加吻合,则越相似;当两个向量的方向完全相反夹角余弦取最小值-1;当余弦值为0时,两向量正交,夹角为90度。因此可以看出,余弦相似度与向量的幅值无关,只与向量的方向相关。

下面我们来看一下余弦距离的Python实现:

def CosineDistance(x, y): import numpy as np x = np.array(x) y = np.array(y) return np.dot(x,y)/(np.linalg.norm(x)*np.linalg.norm(y))
本文链接地址:https://www.jiuchutong.com/zhishi/300822.html 转载请保留说明!

上一篇:神经网络的学习率如何选择?(神经网络浅讲)

下一篇:js 箭头函数详解(jquery箭头函数)

  • 什么叫汇总征税
  • 三证合一后税务登记办理流程
  • 加油卡充值可以退吗
  • 小微企业所得税减免政策
  • 2019发票认证期限新规
  • 转回存货跌价准备对递延所得税资产的影响
  • 资产减值损失跟信用减值损失能合并
  • 出售简易征收的固定资产的增值税怎么计算
  • 企业的银行存款
  • 研究开发费用的加计扣除100%
  • 股权变更怎么缴税
  • 出口企业是外贸企业吗
  • 关于固定资产的企业案例
  • 年终奖第二年才发怎么计算个税在个税app
  • 营改增后甲供材税前扣除还是税后扣除?
  • 跨行发报
  • 租房修缮费扣除
  • 银行承兑汇票贴现
  • 企业所得税税率表2023年最新
  • 物物交换增值税处理
  • 清算资本公积中的股本溢价应该怎么处理
  • win10任务栏不显示最近
  • 长期股权投资评估报告模板
  • 备孕男的要吃叶酸吗? 已解决
  • 委托加工物资企业原材料都是自己采购
  • 有进项没销项怎么处理,可以结转成本吗
  • 废旧物资销售收入
  • php修改sql语句
  • 酒店如何核算成本
  • 建筑业会计需要做到哪些
  • jquery 批量删除
  • php访问数据库的一般步骤
  • css选择器使用
  • ai绘画图片
  • 2022年最新公务接待标准
  • 《开具红字增值税专用发票信息表》纸质
  • dedecms使用教程
  • sql server 2008数据库
  • centos7源码包安装
  • 什么是代缴代扣
  • 弃置费用的现值计入固定资产
  • 生产企业出口自产应税消费品实行什么方法
  • 水电费进项税额转出情形
  • 员工探亲路费报销入哪个科目
  • 一般纳税人之外还有什么
  • 安全生产费如何计量
  • 购买的车位如何做账
  • 年底做账流程
  • 一般纳税人转小规模最新政策
  • 小规模纳税人进项票可以抵扣吗
  • 利息保障倍数为0说明什么
  • 社保金额不对到不了账
  • 车辆保险证明怎么开
  • phpstorm配置php环境 mac os
  • mysql 5.6 5.7 性能
  • mysql5.7.21安装
  • windows update client
  • 文件历史版本功能
  • mac取消开机启动项
  • centos5.4 安装
  • xp系统开机出现英文怎么办
  • kdeskcore.exe是什么
  • win10快速隐藏窗口
  • win10重启更新的时候强制关机后会发生啥
  • react 技巧
  • android中数据存储
  • js定时器的两种方法
  • 搭建安卓开发环境必须的工具
  • vue如何用
  • androidui框架
  • 查找的算法有哪些
  • android 动态添加控件
  • jquery源码解析
  • javascript学习指南
  • 广西税务软件
  • 青岛市地方税务局网上办税厅
  • 浙江国税咨询电话12306
  • 出口退税函调回函时间
  • 个税专项扣除填报错误怎么办
  • 临沂市2020年居民燃气价格
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设