基于改进LDA算法的电力用户咨询文本分类算法
作者:
作者单位:

1.国网安徽省电力有限公司,安徽 合肥 230061;2.国家电网有限公司,北京 100032;3.国家电网有限公司大数据中心,北京 100032;4.北京国网信通埃森哲信息技术有限公司,北京 100053

作者简介:

李竹青(1969-),男,硕士,高级会计师,主要研究方向为审计管理、数字化审计.email:13722983081@163.com.
侯本忠(1976-),男,本科,高级工程师,主要研究方向为数字化审计.
曹培祥(1984-),男,本科,高级经济师,主要研究方向为数字化审计、营销审计.
王一蓉(1979-),女,博士,教授级高级工程师,主要研究方向为数字信号处理、电力信息通信.
李向阳(1991-),男,本科,工程师,主要研究方向为审计管理、企业数字化转型.

通讯作者:

基金项目:

伦理声明:



Text classification algorithm of power user consultation based on improved LDA algorithm
Author:
Ethical statement:

Affiliation:

1.State Grid Anhui Electric Power Co.,Ltd,Hefei Anhui 230061,China;2.State Grid Corporation of China,Beijing 100032,China;3.Big Data Center of State Grid Corporation of China,Beijing 100032,China;4.Beijing State Grid Accenture Information Technology Co.,LTD,Beijing 100053,China

Funding:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    针对目前情感极性分析中电力咨询短文本的准确性较低的问题,提出一种基于改进潜在狄利克雷分配(LDA)算法的电力用户咨询文本分类算法。在分析电力咨询短文本与情感的关联关系基础上,定义了基于情感词共现袋、主题特殊词以及主题关系词的概念;为提高语义分析的质量,设计了改进LDA算法的电力用户咨询文本分类算法执行流程。实验表明,所提模型表现出优异性能,平均精确度和平均召回率为90.91%和85.03%。所提模型可充分发挥多模型集成优势,有效提升模型性能。

    Abstract:

    In response to the current issue of low accuracy in sentiment polarity analysis of short texts in power consulting, this paper proposes an improved Latent Dirichlet Allocation (LDA) algorithm-based classification algorithm for power user consulting texts. Based on the analysis of the relationship between power consulting short texts and sentiment, concepts such as sentiment word co-occurrence bags, topic-specific words, and topic relationship words are defined. To improve the quality of semantic analysis, an execution process for the improved LDA algorithm for classifying power user consulting texts is designed. Experiments show that the proposed model demonstrates excellent performance, with an average precision of 90.91% and an average recall rate of 85.03%. The proposed model can fully leverage the advantages of multi-model integration, effectively enhancing the model performance.

    参考文献
    相似文献
    引证文献
引用本文

李竹青,侯本忠,曹培祥,王一蓉,李向阳.基于改进LDA算法的电力用户咨询文本分类算法[J].太赫兹科学与电子信息学报,2024,22(12):1400~1406

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
历史
  • 收稿日期:2023-05-06
  • 最后修改日期:2023-07-26
  • 录用日期:
  • 在线发布日期: 2025-01-07
  • 出版日期:
关闭