基于Roberta进行微博情感分析

原创

小哥 8个月前 (02-10) 阅读数 86 #大杂烩

基于Roberta进行微博情感分析

概述

本资源文件提供了一个基于Roberta模型的微博情感分析实现。该实现使用了预训练的Roberta-wwm-ext模型，对微博数据进行情感分类，共分为六种类别：积极、愤怒、悲伤、恐惧、惊奇和无情绪。

数据介绍

训练集：包含27,768条微博数据。
测试集：包含5,000条微博数据。

数据格式如下： - id：编号 - content：文本内容 - label：情绪标签

模型训练

本实现基于HuggingFace开源的Transformers库（Torch版本）进行模型训练。主要库版本如下： - Transformers == 2.2.2 - Torch == 1.5.0

加载预训练模型

使用RoBERTa-wwm-ext模型进行预训练，模型参数通过全连接层转换为六种情感分类的输出。

构造训练数据和测试数据

数据经过token化处理后，生成三类向量： 1. 文本本身的token 2. 表征token type的向量 3. 表示mask标志的向量

训练过程

机器配置：两张V100 GPU
batch_size：8
每个epoch耗时约6分钟，训练了3个epoch。

测试结果

测试结果显示，总体精度为78.02%。展示了20条测试结果，初步认为该模型可以作为一个基础模型使用。

使用方法

安装依赖：npm install -g architect-local @architect/architect
运行训练脚本：python train.py
运行测试脚本：python testCase.py

参考文献

本文参考了HuggingFace开源的Transformers库和相关文献。

写在后面

个人认为HuggingFace开源的Transformers比较成功，值得国内同行学习。
完整代码可在资源文件中找到。

下载链接

基于Roberta进行微博情感分析

(备用: 备用下载)

版权声明

所有资源都来源于爬虫采集,如有侵权请联系我们,我们将立即删除

上一篇：基于RLS的永磁同步电机在线参数辨识仿真模型下一篇：基于RRT算法的六自由度机械臂轨迹规划

解决SolidWorks2019许可证错误-85440

解决SolidWorks 2019许可证错误(-8, 544, 0) 简介本资源文件旨在帮助用户解决SolidWo...

原创 8个月前 (02-11) 25阅读 #大杂烩
解决sklearn.datasets.fetch_20newsgroups下载速度慢的问题

解决sklearn.datasets.fetch_20newsgroups下载速度慢的问题简介在使用Python...

原创 8个月前 (02-11) 25阅读 #大杂烩
解决sklearn.datasets.fetch_20newsgroups下载报错问题分享

解决sklearn.datasets.fetch_20newsgroups下载报错问题在使用Python的机器学习库...

原创 8个月前 (02-11) 25阅读 #大杂烩
解决Scratch3.0scratch-hex文件下载失败问题

解决Scratch 3.0 scratch-hex文件下载失败问题描述本资源文件提供了一个解决方案，用于解决在n...

原创 8个月前 (02-11) 25阅读 #大杂烩
解决RHEL7无法使用YUM源的问题

解决RHEL7无法使用YUM源的问题当您在红帽企业版Linux 7（RHEL7）上遇到无法使用YUM源的问题时，通常...

原创 8个月前 (02-11) 25阅读 #大杂烩
解决Qt应用中遇到的libpngwarningiCCPknownincorrectsRGBprofile问题

解决Qt应用中遇到的libpng warning: iCCP: known incorrect sRGB profile...

原创 8个月前 (02-11) 25阅读 #大杂烩
解决QT启动时找不到python36.dll问题

解决QT启动时“找不到python36.dll”问题介绍本仓库提供了一个资源文件，旨在解决在使用QT启动时遇到的...

原创 8个月前 (02-11) 25阅读 #大杂烩
解决Qt5在麒麟Linux下不能输入中文问题

解决Qt5在麒麟Linux下不能输入中文问题资源描述本资源文件旨在解决在麒麟Linux操作系统下，Qt5应用程序...

原创 8个月前 (02-11) 25阅读 #大杂烩
解决QT5.12.6使用32位MinGW编译器无法使用SSL协议问题

解决QT5.12.6使用32位MinGW编译器无法使用SSL协议问题简介在开发基于QT 5.12.6的应用程序时...

原创 8个月前 (02-11) 25阅读 #大杂烩
解决PyTorchCUDA编译问题指南

解决PyTorch CUDA编译问题指南资源文件介绍文件标题解决AssertionError: Torch...

原创 8个月前 (02-11) 25阅读 #大杂烩