简介概要

基于强类别特征的文本相似度计算及其性能评估

来源期刊：软件工程2020年第10期

论文作者：刘辉

文章页码：5 - 11

关键词：强类别特征算法;机器学习;文本相似度;语义识别;性能评估;

摘要：本文基于强类别特征识别算法,研究一种文本语义相似度的计算算法并对其性能进行评估。为实现该功能并形成一种通用算法,本文设计了一种基于语义识别码的语义函数库作为比较对象,使用两次模糊神经元深度卷积机器学习算法模块,并在两次机器学习之间使用一次基于傅立叶变换的频域特征提取的刚性算法,最终在该算法模块前后使用外置的数据模糊算法和解模糊算法,实现了一个较复杂的机器学习通用算法。而该算法也是本文的一次技术创新。通过基于志愿者主观评价的性能评估,发现该系统重点实现了汉语言的文本语义相似度评价,且实现了81.78%的人工判断准确率对比结果,且只有5.52%的志愿者认为系统判断结果与人工判断结果完全不一致。

详情信息展示

基于强类别特征的文本相似度计算及其性能评估

刘辉

上海理工大学信息化办公室

摘要：本文基于强类别特征识别算法,研究一种文本语义相似度的计算算法并对其性能进行评估。为实现该功能并形成一种通用算法,本文设计了一种基于语义识别码的语义函数库作为比较对象,使用两次模糊神经元深度卷积机器学习算法模块,并在两次机器学习之间使用一次基于傅立叶变换的频域特征提取的刚性算法,最终在该算法模块前后使用外置的数据模糊算法和解模糊算法,实现了一个较复杂的机器学习通用算法。而该算法也是本文的一次技术创新。通过基于志愿者主观评价的性能评估,发现该系统重点实现了汉语言的文本语义相似度评价,且实现了81.78%的人工判断准确率对比结果,且只有5.52%的志愿者认为系统判断结果与人工判断结果完全不一致。

关键词：强类别特征算法;机器学习;文本相似度;语义识别;性能评估;

<上一页 1 下一页 >

相关论文

利用文本相似度计算的装配工作指令评估

基于不同机器学习算法的钙钛矿材料性能预测

基于均矢量相似性的机器学习样本集划分

一种图文组合相似度算法的设计与优化

基于重构向量空间模型的知识匹配算法研究

基于领域知识的文本分类

基于SISSO和机器学习方法的钙钛矿结构的稳定性预测：新型容许因子建立与验证

一种基于特征库投影的文本分类算法

基于云模型的文本特征自动提取算法

基于机器学习和图像处理的路面裂缝检测技术研究

相关知识点

应用于成矿预测结果的基于机器学习的输入数据

机器学习方法简介

应用于成矿预测结果的基于机器学习的模型分类和预测能力评价

机器学习遗传算法的应用情况

机器学习与高通量计算相结合

机器学习的基本问题

基于机器学习的成矿预测结果与讨论

应用于成矿预测结果的基于机器学习的模型训练

空间定量预测分析方法中机器学习的卷积神经网络

空间定量预测分析方法中机器学习的支持向量机

空间定量预测分析方法中机器学习的随机森林

有色金属在线官网 | 会议 | 在线投稿 | 购买纸书 | 科技图书馆

中南大学出版社技术支持版权声明电话：0731-88830515 88830516 传真：0731-88710482 Email:administrator@cnnmol.com

互联网出版许可证：（署）网出证（京）字第342号京ICP备17050991号-6 京公网安备11010802042557号