Python计算向量余弦相似度——从入门到实践-蒲公英云

Python计算向量余弦相似度——从入门到实践

悠悠 2024-03-25 21:13 175阅读 0赞

Python计算向量余弦相似度——从入门到实践

在文本挖掘、自然语言处理等领域，常常需要计算文本的相似度，而向量余弦相似度是较为常用的一种计算方式。本篇文章将介绍使用Python计算向量余弦相似度的方法。

向量余弦相似度的概念

向量余弦相似度是一种衡量两个向量方向差异的度量方法，通常用于计算文本之间的相似度。其计算公式如下：

cosine(A,B) = (A·B) / (||A|| * ||B||)

其中A和B为两个向量，A·B表示它们的点积，||A||和||B||表示它们的模长。

Python计算向量余弦相似度的实现

Python中有多种库可以实现向量余弦相似度的计算，比如NumPy、SciPy和sklearn等。这里以NumPy为例，演示使用Python计算向量余弦相似度的过程。

以下是一个简单的示例代码，用于计算两个向量a和b的余弦相似度：

import numpy as np
def cosine_similarity(a, b):
    return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
print(cosine_similarity(a, b))

运行结果为：

0.9746318461970762

应用实例——文本相似度计算

在自然语言处理领域，常常需要计算文本之间的相似度。下面以两篇新闻报道为例，演示使用Python计算它们的相似度。

import jieba
i

Python计算向量余弦相似度——从入门到实践

发表评论取消回复

还没有评论，来说两句吧...

相关阅读

相关 Python计算向量余弦相似度：从公式到实现

相关 Python计算向量余弦相似度：如何测量智能推荐系统的效果？

相关 Python计算向量余弦相似度——从入门到实践

相关使用余弦相似度计算文本相似度

相关 python 向量余弦相似度

相关 python计算余弦相似度

相关 ES计算余弦相似度

相关使用余弦相似度算法计算文本相似度

相关余弦相似度计算

相关词向量余弦算法计算文本相似度

随便看看

Semaphore（二）

【MySQL用法】在MySQL登录时出现Access denied for user ‘root‘@‘localhost‘ (using password: YES) 拒绝访问，并可修改MySQL密码

点云滤波处理(使用CloudCompare软件)

Spring JdbcTemplate 调用 Oracle 存储过程与 Oracle 驱动下载

WARNING: Could not determine this machines public hostname. Please configure one or set 'visible_hos

慕课编译原理(第八章.构造递归下降分析器)

教程文章

热评文章

1江湖小白之一起学Python （二）爬取数据的保存

2Java Shiro：简化身份验证和授权的安全框架

3Java中try()catch{}的使用方法

4Swagger注解-@ApiModel 和 @ApiModelProperty

5windows下强制杀死tomcat进程

6uni-app 条形码(一维码)/二维码生成实现

标签列表