str_Similarity函数
函数名:wb_字符串相似度 / str_Similarity
函数功能
基于Levenshtein距离算法计算两个字符串的相似度,返回0-1之间的标准化数值(1表示完全相同,0表示完全不同)。
参数规范
| 参数名 | 类型 | 必填 | 示例 | 特殊说明 |
|---|---|---|---|---|
str1 | String | 是 | "Excel" | 支持直接文本或单元格引用 |
str2 | String | 是 | "Excle" | 支持中文/英文混合输入 |
使用案例
拼写检查
问题描述:验证用户输入与标准术语的相似度
公式演示:
excel
=str_Similarity("Microsoft", "Microsft")输出效果:
text
0.875数据清洗
问题描述:匹配相似的公司名称
公式演示:
excel
=str_Similarity(A2, "阿里巴巴集团")输出效果(当A2="阿里爸爸"):
text
0.6技术说明
算法原理
- 计算两个字符串的最小编辑距离(插入/删除/替换操作次数)
- 相似度 = 1 - (编辑距离 / 最大字符串长度)
异常处理
| 错误场景 | 返回值 |
|---|---|
| 空文本 | 0.0 |
| 非文本参数 | -1.0 |
扩展应用
结合条件格式
excel
=str_Similarity(A1, B1)>0.8 // 高亮显示相似度超过80%的记录模糊匹配筛选
excel
=FILTER(A2:A100, str_Similarity(A2:A100, "标准文本")>0.7)注:本函数在WPS 2019+和Excel 365中测试通过