论文查重 | 论文文献库 | 基于文本相似度的心理预警技术研究

基于文本相似度的心理预警技术研究

来源:论文查重 时间:2019-08-05 10:40:59

摘要 : 随着信息化的发展,人们心理亚健康呈普遍化趋势。本文研究了基于相似度论文查重的心理预警技术研究,客户端采取分布式机器 学习模型,机器学习和语义分析嵌入客户端采取数据分布式处理,由用户本地资源进行对文本数据情感分析,客户端含有比较理想的 语料库、机器学习模型、语义分析、文本相似度 TF-IDF 模型。由客户端处理用户的自己的文本数据。实现心理健康的预警和跟踪。
近年来由于经济迅速增长,生活节奏加快等原因,抑郁症患 者每年大约同比增加 57%,增长速度非常快。抑郁症严重危害患 者身心健康。传统的心理健康诊断方法主要是通过患者到心理医 院问诊。而实际上许多患者不会主动就医,因此容易延误病情。 对于心理健康状态欠佳的人员,家庭辅助治疗尤为缺失。精神病 人大部分康复生活是在家庭中渡过的, 家庭照料可巩固治疗效果, 防止疾病复发,然而一般家庭对于抑郁症患者的心理健康水平难 以做出专业判断,而且也不具备专业知识来根据抑郁症患者的心 理健康水平来进行辅助治疗。
目前,现有的心理服务平台有 Q 心理、壹心理、心理医生 等产品,主要包括线上咨询、线下咨询预约、知识科普等功能 [1]。 然而,现有产品存在如下不足 :
(1)跟踪治疗不够到位,主要依靠患者的耐心和主动性,没 能实现真正的实时跟踪管理。
(2)无法根据患者当前的心理状态给予家属针对性的心理健 康干预知识引导。
(3)由于主要是一对一咨询的方式解决心理问题的发现及诊 断,即使使用了互联网手段,仍然未能解决心理医生人数匮乏的 问题。
本文对于现有的情感分析主要面向于短文本情感分析,由于 在长文本的数据中准确率难以达到理想的状态,所以基于机器学 习的 TF-IDF 的长文本情感分析能提高处理长文本的数据的准确 率。
2 主要技术
客户端技术,机器学习和语义分析采取分布式处理,其嵌入 客户端,由用户本地资源进行对数据情感分析,客户端含有比较 理想的语料库、机器学习模型、语义分析、文本相似度 TF-IDF 模型,由用户本地资源独立处理后并评分,传输到服务端进行医 生的干预和处理,很好避免了用户隐私的问题、服务端达到负载 均衡的最低值、利用现有的安卓手机的过剩、服务端的流量大大 减少。
后端技术,接入层 :负责终端 APP 与服务器建立连接,业 务逻辑层 :实现各种业务需求的功能,利用 PHP 开发。存储层 : 保存业务数据,利用 MySQL 数据库进行存储。
服务端技术,由客户端对网页采集进行长文本数据采集,经 过服务端的 TF-IDF 和机器学习计算出来结果,相似度计算处理 长文本起非常大的作用, 由于自然语言处理无法完成相似度计算, 本文把文本进行向量化,利用欧式距离、余弦相似度的数学模型 实现文本相似度计算。本文的相似度计算采用 TF-IDF 模型,利 余弦距离计算特征空间测度。 TF-IDF 模型关键作用在于词频和 逆向文本频率实现相似度,由于在原始文本数据里面存在大量的 垃圾数据,该模型通过过滤常见的一些不是主谓宾的词语,在分 词的步骤下保留了重要的词语,通过了向量空间 TF-IDF 权重计 算欧式距离、余弦相似度测试多个文本之间的距离从而计算它们 自己的词频率,在一篇文本中,计算文本的每一维度所对应的词 组或者词,一个词组假如出现在文本数据里面,那么该词组在文 本数据里面定义为非零状态。 TF-IDF 计算的公式 : TF-IDF= 词 频 X 拟文档频率,公式的理解 : 测试文本数据的单词在该文本当 中出现的频率很高而且在其他的测试文本中出现很少,就认为该 单词数据能够区分文本之间的差异性。文本利用 TF-IDF 进行情 感的辅助性分析,主要是给多个文本进行同步的相似度计算从而 知道一个用户的所以文本数据的情感值。
文献 [2] 改进了 TF-IDF 算法,提高了文本分析的效率和性能, 算法流程实现 :
(1)对原文本进行预处理
(2)对文本进行分词,词性标注
(3)计算文本的特定词频
(4)使用特征方法提取重要的文字
(5)使用特征权重算法对 TF-IDF 进行词频转换。
(6)完成对文本的向量化表达
(7)用训练好的模型分类器和语料库进行结果的计算形成分 类。
3 结束语
本文研究了基于相似度的心理预警技术研究,本文包括客户 端采取分布式机器学习模型,机器学习和语义分析采取分布式处 理,其嵌入客户端,由用户本地资源进行对数据情感分析,客户 端含有比较理想的语料库、机器学习模型、语义分析、文本相似 度 TF-IDF 模型,实验采取机器学习的 TF-IDF 实现长文本数据情 感分析。由于心理疾病的预防和医生的快速干预成为现在我们关 心得主题,但是用户存在担心隐私的问题。本文很好解决了用户 的隐私问题。
参考文献
[1] 彭雅楠,席居哲,左志宏 . 互联网 + 背景下心理服务类 APP 的现状、问题 及展望 [J]. 中国临床心理学杂志, 2017, 25(2): 333-336.
[2] 叶雪梅,毛雪岷,夏锦春,等 . 文本分类 TF-IDF 算法的改进研究 [J]. 计算 机工程与应用, 2019, 55(2): 104-109, 161.

相关文章:基于中文分词技术的文本相似度检测研究