Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (2024)

1. Introduction

Les hotspots d'actualités peuvent être facilement discutés grâce à des plateformes telles que Weibo et Twitter, ce qui a entraîné une augmentation substantielle de la quantité de contenu généré par les utilisateurs.Ces messages représentent les opinions et les positions des utilisateurs et ont une influence significative sur la stratégie de marché, la politique gouvernementale et l'opinion publique.La tâche de détection de position dans les microblogs chinois a été proposée dans NLPCC-ICCPOL (2016), ce qui indique que les informations sur la position chinoise sont d'une grande signification de recherche.Les informations sur la position sont une base importante dans des domaines tels que les études de marché, la gestion des opinions publiques et la formulation des politiques.Dans les études de marché, la détection de position aide les entreprises à comprendre les perceptions du public de leurs produits.Dans le domaine de la gestion de l'opinion publique, les informations sur la position sont cruciales pour les stratégies d'alerte précoce et de réponse concernant le sentiment public.En outre, lors de la formulation de politiques, les agences gouvernementales peuvent utiliser les informations de position pour comprendre les opinions du public.De plus, en tant que l'une des langues les plus utilisées dans le monde, la détection de position chinoise présente des défis et des opportunités uniques pour le traitement du langage naturel (PNL).

L'accent actuel de la détection des positions est d'améliorer la précision de la détection des positions en utilisant divers modèles et méthodes.Ces approches divisent généralement les positions en trois catégories: le soutien, l'opposition et le neutre.Cependant, lorsqu'ils expriment des opinions, les utilisateurs diffèrent non seulement par la polarité mais aussi par le degré de leurs opinions.La polarité fait généralement référence à la tendance positive ou négative d'une position, mais la gamme d'opinions s'étend au-delà de la classification binaire simple et comprend un gradient de sentiments allant d'un léger accord à de fortes critiques.Par exemple, lors de l'expression du support, certains utilisateurs peuvent être totalement d'accord tandis que d'autres peuvent être d'accord avec un seul composant.Il en va de même lorsque les utilisateurs offrent un point de vue opposé.Cela reflète la complexité des sentiments humains et la diversité d'exprimer des points de vue.Dans de telles circonstances, la catégorie de position traditionnelle est trop simpliste pour décrire la diversité des positions des utilisateurs.Le degré de force dans l'expression d'une opinion peut être considéré comme la volonté ou la croyance derrière l'opinion.Un individu peut exprimer son point de vue avec un ton occasionnel, ou il peut défendre sa position avec une solide conviction.Ces degrés variables influencent considérablement les perspectives des gens.Dans le domaine de l'extraction d'opinion, comprendre l'importance de ce degré est tout aussi crucial que la compréhension de la polarité.Il est essentiel de saisir ces différences subtiles pour construire des modèles d'analyse et de détection de position plus sophistiqués, permettant une capture plus précise d'opinions publiques complètes.

Les approches traditionnelles, en revanche, ne considèrent généralement que le texte lui-même, ignorant les caractéristiques sentimentales qui y sont enterrées.Les caractéristiques du sentiment ont un effet favorable sur la détection des positions, et lorsque la détection de position est combinée avec l'analyse des sentiments, il est possible de filtrer l'influence des expressions de mauvaise humeur.Par conséquent, il y a des limites à la détection des positions, et une image plus complète des attitudes des utilisateurs peut être acquise en combinant l'analyse des sentiments.

Cet article vise à résoudre les problèmes suivants: Premièrement, à classer les positions en cinq catégories en fonction du degré et de la polarité des attitudes des utilisateurs pour décrire plus en détail les positions des utilisateurs;Deuxièmement, pour exploiter les raisons des différentes attitudes des utilisateurs à travers les cinq catégories de positions, qui peuvent être utilisées pour guider la gestion de l'opinion publique;et troisièmement, pour combiner l'analyse des sentiments avec la détection des positions pour acquérir une compréhension plus complète des opinions des utilisateurs.En conséquence, cet article présente BACF (Bi-LSTM-ATTENTIONNEMENT-CNN-FUSION), un modèle de détection à plusieurs forces qui combine l'apprentissage en profondeur avec le lexique Sentiment pour résoudre le problème ci-dessus.L'expérience montre que le BACF effectue la détection de position plus précisément que l'approche traditionnelle, ce qui est significatif pour la sélection des politiques et l'analyse d'opinion publique.

2. Recherche connexe

La détection de position est une sous-tâche d'exploration d'opinion qui peut classifier automatiquement les positions de texte en fonction d'une cible donnée.Les premières recherches se sont concentrées sur les débats politiques et les forums en ligne, tandis que les recherches récentes se sont concentrées sur les plateformes sociales en ligne telles que Weibo et Twitter.

2.1.Catégorie de position

Au début, la détection de position était un problème de classification binaire, avec les positions classées comme «soutien» ou «s'opposer».Comme les positions étaient mieux comprises, la détection de position est passée d'une classification binaire à une classification à trois classes, et les chercheurs ont commencé à classer les positions comme «Support, opposition ou non» [1].Par exemple, Jia et al.Les positions classées comme «soutien, opposition et neutre» dans leur étude sur la reconnaissance de la position des points de vue des utilisateurs [2].Comme on peut le voir, la classification des positions est une progression significative dans le domaine de la détection de position.La catégorie simple à trois classes ne peut plus refléter efficacement les opinions des utilisateurs, et certains chercheurs ont proposé empiriquement une catégorie à quatre classes.Cependant, la classification des positions basée sur l'expérience est limitée dans la généralisation et se concentre sur des domaines spécifiques.Ma et al.Classé les positions des deux ensembles de données utilisés pour la détection des rumeurs comme «soutien, refuser, questionner et commentaire» et «d'accord, en désaccord, discuter et sans rapport» [3].Aux fins de la détection de position dans les rumeurs de Twitter, Poddar et al.Classifié la position en quatre catégories: «Remarque, soutien, nier et requête» [4].Comment étendre la catégorie de position est un problème important pour la détection de position.

Le classem*nt des positions peut aider à résoudre le problème.Les positions des utilisateurs diffèrent considérablement en termes de polarité et de degré, ce qui permet la possibilité de classer les positions.Lorsque les utilisateurs commentent divers sujets, ce phénomène devient plus évident.Par exemple, lorsqu'une nouvelle politique est proposée, des discussions distinctes peuvent se concentrer sur son impact actuel et ses avantages futurs potentiels.Les gens auront des préférences différentes, comme pour leurs niveaux de soutien et d'opposition.En conséquence, les utilisateurs ayant diverses positions peuvent se concentrer sur différents sujets.Il est possible d’acquérir une compréhension plus précise des attitudes des utilisateurs en notant leurs positions en fonction de divers sujets.Extension des positions segmentées en termes de classem*nt est une pratique standard qui peut mieux représenter les attitudes des utilisateurs.Par exemple, les échelles à cinq niveaux sont fréquemment créées dans l'industrie du marketing en fonction de la satisfaction des utilisateurs.

Pour obtenir un classem*nt de degré dans le domaine de la détection de position, nous pouvons d'abord exploiter les sujets de l'événement et les regrouper dans diverses positions en fonction de leur degré et de leur polarité pour créer un système d'indicateurs à plusieurs forces.Le modèle de sujet LDA (allocation latente Dirichlet) est une technique d'apprentissage non supervisée pour l'analyse de texte et l'exploitation de sujets qui a d'abord été proposée par Blei et al.[5].LDA acquiert des sujets de texte à travers l'analyse statistique et la modélisation probabiliste des mots dans le texte.Afin d'analyser les expériences des invités Airbnb pendant la crise de Covid-19, Keawtoomla a examiné les avis publiés sur la plate-forme Airbnb à l'aide de la LDA [6].Pour présenter une image complète du domaine de la recherche, Tomojiri a utilisé la LDA pour déduire les sujets de recherche sur les débris marins anthropiques [7].En conséquence, le modèle LDA peut implémenter efficacement l'exploitation de sujets cachés.Il peut mieux refléter les attitudes des utilisateurs en exploitant des sujets de texte et en construisant un système d'indicateurs à plusieurs forces avec des modèles LDA.

2.2.Modèles de détection de position

La détection de position traditionnelle utilise fréquemment des machines à vecteurs de support [8], naïf Bayes, régression logistique, forêts aléatoires [9], K-means et autres modèles d'apprentissage automatique [dix].Les modèles d'apprentissage automatique sont bien définis et simples en structure.Par exemple, un système de détection de position en deux étapes basé sur SVM a été proposé pour caractériser les positions sur Twitter [11].Mourad et al.ont découvert que les forêts aléatoires, le SVM linéaire et la NB gaussienne peuvent être utilisées comme classificateurs d'identification de vote majoritaire [12].Cependant, les modèles d'apprentissage automatique sont exigeants linguistiquement et sujets à l'erreur humaine.À mesure que le volume d'informations augmente, les modèles de détection de position traditionnels deviennent plus longs et coûteux, et les informations sur la position minière deviennent de plus en plus difficiles à l'ère de l'information.

Les modèles d'apprentissage en profondeur, tels que les réseaux de neurones récurrents (RNN) et les réseaux de neurones convolutionnels (CNNS), sont devenus les méthodologies standard de détection de position.Les RNN sont bons pour traiter les données séquentielles.Dans la détection de la position de Twitter, Siddiqua a proposé une variante qui utilise les BI-LSTM et les LSTM imbriqués pour capturer les dépendances à long terme, où chaque module est amélioré avec un mécanisme d'attention [13].Dans la tâche de détection de position à deux cibles, Liu et al.utilisé plusieurs couches LSTM pour coder les régions liées à la cible [14].Les CNN sont bien adaptés à l'extraction des fonctionnalités locales en raison de leurs multiples noyaux.Zhang et al.a proposé une approche d'analyse de position basée sur CNN pour identifier les tendances de position [15].Tran et al.a utilisé Bert et CNNS pour créer un modèle de détection de position pour les vietnamiens [16].Avec l'avancement de l'apprentissage en profondeur, les chercheurs ont commencé à étudier les structures du modèle hybride.Li et al.a produit un excellent résultat en utilisant un modèle de détection de position hybride construit avec GRU, vecteur de poids de position et CNNS [17].Dans le domaine de la détection des rumeurs, Li et al.a proposé un cadre basé sur des réseaux de neurones multi-graphiques pour capturer l'attribut et les informations structurelles de contexte [18].Dans la tâche de la détection de position sur les plateformes sociales, Liu et al.utilisé une approche de réseau neuronal graphique fermé (GGNN) pour intégrer les informations structurelles entre les revues [19].En outre, des technologies telles que les lexiques de sentiment et les mécanismes d'attention ont été utilisées pour améliorer les performances du modèle.Le lexique de sentiment peut être utilisé pour obtenir des informations sur le sentiment à partir d'un texte.Par exemple, Zheng et al.utilisé le lexique de sentiment pour effectuer la sélection des caractéristiques dans la détection de la position des microblogs et a trouvé des résultats favorables [20].Bien que les lexiques de sentiment soient couramment utilisés comme supplément, la combinaison de l'analyse des sentiments et de la détection de position en est encore à ses débuts.De plus, le processus d'attention peut donner plus de poids à des informations importantes, ce qui peut améliorer la précision du modèle.Dey et al.a proposé un modèle en deux étapes basé sur LSTM en combinaison avec un mécanisme d'attention qui peut bien fonctionner dans la détection de la position de Twitter [21].De plus, Karande et al.des incorporations de mots implémentées pour les modèles de détection de position à l'aide de bert [22].En conclusion, l'apprentissage en profondeur a dépassé l'apprentissage automatique en tant que modèle dominant pour la détection des positions, et le mécanisme d'attention et le lexique de sentiment ont été utilisés pour améliorer l'efficacité du modèle.Cependant, bien que la classification binaire ait cédé la place à la classification à trois classes, la question de savoir comment prolonger davantage la classification des positions reste sans réponse.De plus, les informations sur le sentiment contenues dans les expressions de position n'ont pas été entièrement utilisées.Pour résoudre ces problèmes, cet article propose un modèle de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment.

3. Méthodologie

Cet article vise à construire une méthode de détection à plusieurs fonctions en fusionnant les fonctionnalités du sentiment.La méthode se compose de trois parties: la construction d'un système d'indicateurs à plusieurs forces, l'acquisition de caractéristiques de sentiment et la construction d'un modèle de détection de position.Premièrement, nous construisons un système d'indicateurs à 5 stations basé sur le degré et la polarité des attitudes des utilisateurs;Ensuite, les caractéristiques du sentiment des revues sont obtenues via le lexique de sentiment;Et enfin, un réseau neuronal hybride est utilisé pour atteindre la détection multi-fonctions.Après la construction de la méthode, nous avons mis en œuvre la gestion d'opinion publique sur la base d'un système d'indicateurs à plusieurs forces.Le cadre de recherche est montré dansFigure 1.

3.1.Système d'indicateurs à plusieurs forces

Les examens des utilisateurs diffèrent non seulement par la polarité mais aussi dans la mesure dans laquelle ils expriment leur position.L'approche traditionnelle divise généralement les positions en trois catégories, qui ne différencient pas les distinctions au sein de la même polarité (soutien ou contre) et ne parvient pas à expliquer pourquoi ces écarts existent.En conséquence, cette étude sépare les positions en cinq catégories en fonction de la polarité et des degrés:

(1)

Selon Support (SS): une attitude totalement positive envers l'événement et une opinion favorable de l'événement.

(2)

Soutien faible (WS): une vision généralement positive des événements, affirmant la plupart d'entre eux malgré des concessions dans certaines parties.

(3)

Neutre: neutralité vers les événements et la discussion à leur sujet.

(4)

Faible opposition (WO): une vision généralement négative des événements, s'opposant à la plupart d'entre eux malgré les concessions dans certaines parties.

(5)

Strong Opposition (SO): une attitude totalement négative envers l'événement et défavorable à l'événement.

Dans cet article, un système d'indicateurs à plusieurs forces basé sur le modèle LDA est développé pour établir l'association entre les positions et les sujets segmentés.Nous utilisons Gensim pour implémenter l'exploitation LDA, qui est une bibliothèque Python pour la modélisation de sujets.Les paramètres sont affichés dansTableau 1.Les cinq positions classées en fonction des résultats du sujet peuvent fournir une compréhension plus détaillée des attitudes des utilisateurs envers l'événement et les raisons des différences, fournissant ainsi un guide de la gestion de l'opinion publique.

3.2.Caractéristique du sentiment

Les informations sur le sentiment jouent un rôle important dans l'expression de la position.Le noyau du lexique de sentiment est le calcul basé sur des règles, à partir de laquelle les caractéristiques du sentiment relatives aux revues peuvent être obtenues.

3.2.1.Construction du lexique des sentiments

Le modèle nécessite un lexique complet pour bien fonctionner.Dans cet article, un lexique de sentiment open source connu sous le nom de Hownet est complété par l'inclusion manuelle de nouveaux mots pour construire un lexique de sentiment.Le lexique se compose de cinq sections, comme indiqué dansTableau 2.Un lexique positif comprend des mots qui expriment la joie, le soutien et d'autres sentiments positifs.Un lexique négatif comprend des mots qui expriment la déception et la colère, représentant des sentiments négatifs.Le lexique adverbe se compose d'adverbes qui modifient le degré de sentiments en d'autres termes.Les mots de négation incluent des mots qui expriment des significations opposées, et ils occupent une position spéciale dans l'analyse des sentiments car ils peuvent inverser la polarité du sentiment d'une phrase.Certaines conjonctions et prépositions ont un impact minimal sur l'expression des sentiments et peuvent être inclus dans la liste des mots arrêtés, car les ignorer peut améliorer l'efficacité de l'analyse des phrases.

3.2.2.Acquisition de caractéristiques du sentiment

Les mots de sentiment sont classés en catégories positives ou négatives en fonction de leur polarité.De plus, les adverbes du sentiment peuvent être classés en fonction de leur diplôme, tels que «extrêmement», «très», «plus», «légèrement», «insuffisant» et «excessif».Ces adverbes sont affectés à leurs sous-flux respectifs comme indiqué dansTableau 3.

Sur la base des résultats expérimentaux,Vjeest quantifié en utilisant des poids avec des valeurs de 2,5, 2, 1,5, 0,5, −0,5 et −0,8.Les mots de négation sont susceptibles d'inverser complètement la sémantique d'origine;Ainsi, le nombre inverse est utilisé pour inverser la sémantique.

Sur cette base, la valeur du sentiment positif du texteSpet valeur de sentiment négatifSnsont calculés et la caractéristique du sentiment e de la revue connexe est obtenue en soustrayant les deux, comme indiqué dans les équations (1) - (3):

nS=(-1)dVje

Sje=nS

E=Sp-Sn

nSreprésente la valeur du sentiment d'un mot,Sjereprésente la valeur de sentiment spécifique de la phrase,dest le nombre de mots de négation, etVjeest le produit de tous les adverbes de sentiment précédant le mot de sentiment actuel.

3.3.Modèle de détection à plusieurs stances

Cet article propose un modèle de détection de position de réseau de réseau neuronal hybride fusionné avec des caractéristiques de sentiment en combinant les approches du lexique d'apprentissage en profondeur et de sentiment, et la structure du modèle est indiquée dansFigure 2.

3.3.1.Incorporation de mots

Les entrées du réseau neuronal sont des vecteurs.Le modèle Skip-Gram peut former des vecteurs de mots avec une grande précision en prédisant le contexte du mot actuelwt.En revueTje=w1,,wje,,wn, le motwjeest converti au vecteurXje=[V1,,Vje,,Vd]], etTjeest converti à la matriceSn×d=[X1,,Xje,,Xn]]T, oùnest la longueur du rembourrage etdest le mot dimension vectorielle.

3.3.2.Bi-LSTM Couche

La structure BI-LSTM est apte à traiter les données séquentielles [23].En introduisant la porte d'oubli, la porte d'entrée et la porte de sortie, le BI-LSTM peut conserver et oublier sélectivement les informations, comme indiqué dans les équations (4) - (9).

jet=sjegmojed(WjeHt-1,Xt+bje)

Ft=sjegmojed(WFHt-1,Xt+bF)

gt~=tunnH(WgHt-1,Xt+bg)

ct=Ftct-1+jetgt~

ot=sjegmojed(WoHt-1,Xt+bo)

Ht=ottunnH(ct)

Xest l'entrée;cest la cellule;Hest l'état caché;test à tempst;est le produit Hadamard;West le poids de la porte;best le terme biais;etje,F,g~,osont respectivement les portes d'entrée, d'oubli, de cellules et de sortie.

Sur cette base, le texte est traité dans les deux sens pour capturer des informations sémantiques bidirectionnelles.Les vecteurs de sortie dans les deux directions sont collocalisés pour produire le vecteurlt, comme indiqué dans l'équation (10).

lt=[Ht:Ht]]

3.3.3.Attention à des produits à l'échelle

L'attention du produit à échelles à l'échelle est une forme d'attention du produit qui a une plus grande efficacité de calcul.La corrélation entre le vecteur de requête et la matrice clé est calculée et la similitude est utilisée comme poids.Les poids obtenus sont pondérés et additionnés avec la matrice de valeur et, via la normalisation de Softmax, la matrice de sortie d'attentionUNest obtenu, comme indiqué dans les équations (11) et (12).

un(Lq,Lk)=LqTLkdk

UN=soFtmunX(LQLKdk)LV

LQ,LV, etLKsont respectivement les matrices de requête, de clé et de valeur.Lqest le vecteur de requête,Lkest le vecteur clé, etdkest la longueur duLK.

3.3.4.Couche CNN

Dans cet article, un CNN multi-caseral est utilisé pour extraire les caractéristiques, qui se compose de trois couches: une couche de convolution, une couche de pool et une couche entièrement connectée [24].

(1)

La couche convolutionnelle est utilisée pour l'extraction initiale des caractéristiques.Le modèle utilise un noyau multi-tailleWuPour mener une opération de convolution avec la longueur 1 de pas, et la transformation non linéaire est réalisée en utilisant le RELU, comme le montre les équations (13) et (14).

cje=F(WuUNje+b)

C=c1,,cje,,cl-u+1,u{2,3,4}

best les termes de biais,lest la longueur de la phrase, etuest la taille du noyau convolutionnel.

(2)

La couche de mise en commun résume et réduit la dimensionnalité du résultat de la couche de convolution et utilise l'opération de mise en commun 1-max pour obtenir le vecteur de mise en communpje, comme indiqué dans l'équation (15).

pje=munX(C)

(3)

La couche entièrement connectée étend la fonction de texte en vecteurs.Les caractéristiques optimales locales extraites des noyaux convolutionnels de différentes tailles sont collocalisés pour obtenir la sortie finaleQde la couche CNN, comme le montre l'équation (16).

Q=[p2:p3:p4]]

3.3.5.Festion du sentiment Fusion

La fusion des fonctionnalités, qui est un type de fusion d'informations, peut introduire des informations utiles pour améliorer la prédiction du modèle.Les approches traditionnelles de la fusion de fonctionnalités incluent la stratégie série et la stratégie parallèle, et la stratégie série est utilisée dans ce modèle car elle est efficace et simple à mettre en œuvre.Le vecteur de caractéristique de sentimentEest collocalisé avecQ, comme indiqué dans l'équation (17).

M=[Q:E]]

3.3.6.Couche de sortie

Le vecteur fusionnéMest sorti via une couche linéaire pour cinq classifications, et les résultats sont obtenus par normalisation Softmax, avec la valeur la plus élevée indiquant la position prévue, comme le montre les équations (18) et (19).

R=LjeneunrM=r1,r2,r3,r4,r5

Stunnce=MunXsoFtmunXrje=MunX(erje1kerje)

4. Expérimenter

4.1.Base de données

Dans l'expérience, nous prenons «un médecin a battu un enfant de 5 ans à Nanjing le 8 novembre 2022» comme étude de cas.Le 8 novembre 2022, un médecin orthopédique a attaqué le garçon et a poussé son grand-père chez eux depuis que son enfant avait été percé à la tête par le garçon.L'événement a déclenché un débat sur la protection des parents et la réaction excessive à l'intimidation dans les écoles.Un ensemble de données est construit par les revues de microblog rampantes du 9 novembre 2022 au 15 novembre 2022. Pour améliorer les performances du modèle, le traitement des données a été effectué.Tout d'abord, les valeurs en double ont été supprimées, puis les liaisons URL incorrectes ont été supprimées.Les données de texte ont été tokenisées en effectuant Jieba.Après le traitement des données, un total de 10 082 éléments de données ont été obtenus.L'ensemble de données a été divisé en formation de formation, de validation et de test dans un rapport de 6: 2: 2.

4.2.Évaluation Métrique et environnement expérimental

Le modèle a été construit et formé sur le cadre d'apprentissage en profondeur Pytorch.L'optimiseur ADAM a été sélectionné pour l'optimisation et l'AMD Ryzen 5 4600H a été utilisé dans l'expérience.Les paramètres des paramètres publics sont affichés dansTableau 4.

Les performances du modèle sont évaluées à l'aide de la précision, du rappel et du score F1.La précision est la proportion de véritables cas positifs parmi les cas positifs prévus;Le rappel est la proportion de cas positifs prédits dans les véritables cas;et le score F1 est utilisé comme métrique d'évaluation complète, comme le montre les équations (20) - (22).

Precjesjeon=TPTP+FP

Recunll=TPTP+FN

F1=2PrecjesjeonRecunllPrecjesjeon+Recunll

Lorsque TP est vrai positif, TN est vrai négatif, FP est faux positif et FN est faux négatif.

Étant donné que la distribution de chaque type de position n'est pas répartie uniformément, la précision, le rappel et le score F1 sont pondérées proportionnelles à la quantité de chaque type de position, comme indiqué dans les équations (23) - (25).

Pw=je5pjePje

Rw=je5pjeRje

Fw=je5pjeFje

Pje,Rje, etFjesont la précision, le rappel et le score F1 duje-th stance Classification, respectivement, etpjeest la proportion duje-THE SÉMALEMENT DE CLASSIFICATION DE POSITION À L'ÉMALLE ENTIER.

4.3.Modèles de comparaison

Huit modèles ont été choisis pour des investigations de comparaison pour confirmer l'efficacité du BACF dans cet article.

(1)

Lstm [25]: Ce modèle introduit les portes, les portes d'entrée et les portes de sortie pour réguler la rétention et la transmission des informations.

(2)

Cnn [26]: Ce modèle extrait les fonctionnalités du texte d'entrée en utilisant des noyaux convolutionnels de différentes tailles.

(3)

GRU: Ce modèle utilise des portes de réinitialisation et de mise à jour des portes pour conserver et transmettre des informations à partir des données de séquence.

(4)

bi-lstm-ATT [27]: un modèle BI-LSTM est utilisé pour traiter le texte de la revue des entrées, et un mécanisme d'attention est utilisé pour améliorer l'accent mis sur les informations importantes.

(5)

Textrcnn [28]: Ce modèle est basé sur un modèle RNN et extrait des caractéristiques cruciales en utilisant une stratégie de mise en commun maximale.

(6)

BI-LSTM-CNN: Ce modèle combine les modèles Bi-LSTM et CNN.Le BI-LSTM est utilisé pour traiter les informations de séquence et CNN est utilisé pour extraire les fonctionnalités locales.

(7)

BCF: Dans ce modèle, les caractéristiques de sentiment sont obtenues à l'aide d'un lexique de sentiment et combinées avec la sortie de la couche de pool du Bi-LSTM-CNN.

(8)

BAC: Ce modèle traite d'abord les informations de séquence à l'aide d'un modèle BI-LSTM, puis utilise un mécanisme d'attention pour donner du poids à des informations importantes, puis utilise CNN pour extraire les caractéristiques locales.

4.4.Sélection du taux d'apprentissage

La sélection des hyperparamètres est cruciale dans la formation des modèles, et le taux d'apprentissage est l'un des hyperparamètres les plus importants.Si le taux d'apprentissage est trop élevé, le modèle manquera le point optimal mondial et si le taux d'apprentissage est trop faible, la difficulté de la convergence du modèle augmentera.Pour sélectionner la valeur appropriée, cet article évalue le modèleFwsous divers taux d'apprentissage, comme indiqué dansTableau 5.

Comme on peut le voir deTableau 5,FwRéduit de manière significative à 33,52% lorsque le taux d'apprentissage dépasse 0,03 et le modèle peut manquer le point optimal global.Lorsque le taux d'apprentissage est inférieur à 0,0003, le modèle peut planer au point optimal local, résultant en unFwde moins de 70%.En conséquence, le taux d'apprentissage est sélectionné comme 0,01.

4.5.L'analyse des résultats

(1)

Expériences de comparaison avec des modèles d'apprentissage en profondeur traditionnels

Les performances du BACF sont contrastées avec le modèle traditionnel d'apprentissage en profondeur pour évaluer l'efficacité du modèle.Les résultats expérimentaux sont présentés dansTableau 6.

Tableau 6montre que le BACF proposé dans cet article atteint les meilleures performances de prédiction, avec le plus élevéFwde 84,03%.Parmi les modèles traditionnels d'apprentissage en profondeur, CNN surpasse le LSTM, tandis que GRU surpasse CNN.En termes de l'ensemble de données, les avis varient en longueur de [1, 359], tandis quefigure 3illustre que près de 80% des textes ont des longueurs inférieurs à 61. LSTM traite les données de séquence via la porte de l'oubli, le portage de l'oubli et la porte de sortie, qui convient plus au texte long.Lorsque la quantité de données n'est pas suffisante, elle peut facilement conduire à un sur-ajustement.CNN est excellent pour traiter les fonctionnalités locales, donc les textes courts sont en sa faveur.Cependant, lorsque le LSTM extrait les informations bidirectionnelles et combine un mécanisme d'attention, leFwde Bi-LSTM-ATT s'améliore considérablement et est de 1,31% supérieur à celui de CNN.Gru a un meilleur effet de prédiction que CNN dansPw,Rw, etFw, respectivement, car la structure de GRU est utile pour le traitement des données de séquence.En combinant la structure RNN avec la couche de pool maximale, TextrCNN peut capturer de manière appropriée des informations textuelles.Par conséquent, TextrCNN est le plus performant parmi les modèles traditionnels.Cependant, leFwDe ce modèle est de 79,20%, ce qui est encore environ 4% inférieur à BACF, et tous les autres modèles sont inférieurs à 80% dans toutes les mesures.Le BACF est construit en intégrant l'apprentissage en profondeur, le lexique sentimental et la fusion.L'expérience montre que, par rapport au modèle traditionnel d'apprentissage en profondeur, le BACF proposé dans cet article peut atteindre plus efficacement la détection de position à cinq catégories.

Les réseaux de neurones hybrides peuvent extraire les caractéristiques de manière plus exhaustive, ce qui peut améliorer la précision de la prédiction de la position.Un examen peut contenir des informations importantes dispersées tout au long.Lors de la publication de critiques, les utilisateurs expriment parfois leurs opinions immédiatement, tandis que d'autres fois, ils les réservent pour la fin ou les enterrent au milieu.Les RNN peuvent être utilisés pour traiter les données de séquence.Cependant, les mots qui apparaissent plus tard ont généralement un avantage dans les RNN.En revanche, les CNN sont un modèle impartial avec l'avantage d'extraire des fonctionnalités en utilisant des noyaux de différentes tailles.Les réseaux de neurones hybrides qui combinent des CNN avec BI-LSTM peuvent utiliser des CNN pour extraire les fonctionnalités locales tout en bénéficiant des avantages des RNN qui sont bons dans le traitement des données séquentielles.Tableau 6montre que le bi-lstm-cnn fonctionne mieuxPw,Rw, etFwPar rapport aux modèles uniques traditionnels, ce qui montre que le réseau neuronal hybride améliore la détection des positions.

(2)

Étude d'ablation

Une étude d'ablation a été réalisée pour démontrer l'importance de chaque module, et les résultats sont présentés enTableau 7.

La combinaison du lexique sentiment avec l'apprentissage en profondeur peut aider à améliorer la détection des positions.Les utilisateurs expriment généralement leurs attitudes tout en exprimant leurs sentiments.La prise en considération des facteurs sentimentaux pourrait être utile pour identifier la position de l'utilisateur.Dans le même temps, la combinaison de la détection des positions et de l'analyse des sentiments peut réduire l'interférence des expressions de mauvaise humeur.Dans cet article, le lexique de sentiment est utilisé pour calculer le score de sentiment de la revue, et une stratégie série est utilisée pour fusionner les caractéristiques du sentiment avec les caractéristiques textuelles.Tableau 7montre qu'en fusionnant les caractéristiques du sentiment, BCF surpasse le bi-lstm-cnn surFwde 2,58%.De plus, par rapport au BAC, BACF améliorePw,Rw, etFwde 3,24%, 1,79% et 1,96%, respectivement.L’expérience démontre que ce modèle peut utiliser efficacement les informations de sentiment pour aider le modèle à atteindre la détection des positions, ce qui améliore les performances de prédiction du modèle.Par conséquent, la fusion des caractéristiques du sentiment peut aider le modèle à effectuer la détection de position plus efficacement.

Le mécanisme d'attention peut améliorer les prévisions du modèle.En utilisant un mécanisme d'attention, le modèle peut se concentrer sur des informations cruciales et améliorer la précision des prédictions en donnant des poids différents.BAC améliore les performances du modèle en donnant plus de poids à des informations importantes et moins de poids à des informations non pertinentes via le mécanisme d'attention.Tableau 7montre que BAC fonctionne mieux que le bi-lstm-cnn surPw,Rw, etFwGrâce à des améliorations de 1,86%, 1,83% et 2,74%, respectivement.Les résultats montrent que les performances du modèle peuvent être considérablement améliorées en introduisant un mécanisme d'attention.Par conséquent, en pondérant les informations importantes, le mécanisme d'attention permet au modèle de prédire la position plus précisément.

(3)

Vérification de la généralisation

Pour vérifier la généralisation de BACF, cette recherche sélectionne des ensembles de données open source pour les expériences.Étant donné que la recherche actuelle n'a pas la même tâche, cet article choisit un ensemble de données dans le domaine de l'exploitation d'opinion.Cet ensemble de données concerne les avis d'hôtel et comprend 2444 avis négatifs et 5322 avis positifs.L'une des critiques négatives est vide, ce qui a entraîné un total de 7765 revues.L'ensemble de données a été divisé en formation de formation, de validation et de test dans un rapport de 6: 2: 2.Les résultats expérimentaux sont présentés dansTableau 8.

Tableau 8montre que le BACF proposé dans cette étude a les meilleures performances, avec unPw,Rw, etFwsur 85,80%, 85,07% et 85,29%, respectivement.Il est suivi par Bi-LSTM-ATT, qui incorpore le mécanisme d'attention et a unFwde 84,69%.Textrcnn utilisant une couche de mise en commun obtient également de bons résultats avec unFwde 83,59%.Les résultats les plus bas proviennent de LSTM, qui a unFwde seulement 71,21%, ce qui devrait être dû au fait que le LSTM n'est pas efficace pour traiter les textes courts.En conséquence, le BACF proposé dans cet article est plus généralisable.

En conclusion, le BACF proposé dans cet article utilise une structure de réseau neuronal hybride, introduit des informations de sentiment via la fusion des fonctionnalités, utilise le mécanisme d'attention pour pondérer les informations essentielles et surpasse les autres approches dans la tâche de détection de position.En comparaison avec les modèles traditionnels d'apprentissage en profondeur, le BACF peut effectuer efficacement la détection des positions et a un meilleur taux de précision.

5. Gestion de l'opinion publique

Dans ce travail, un système d'indicateurs à plusieurs forces est construit à l'aide du modèle LDA pour exploiter des sujets avec divers degrés et polarités de position.Les sujets sont classés en fonction de la polarité et du degré de la position à laquelle ils sont liés.Nous utilisons la cohérenceCVPour sélectionner le bon nombre de sujets [29].La cohérence mesure le degré de similitude sémantique des mots clés dans le sujet [30].Le plus grandCVest, meilleur est l'effet du modèle.Pour identifier un nombre raisonnable de sujets, l'expérience a itéré la cohérence sous différents dénombrements de sujets et a découvert que le modèle avait le mieux fonctionné avec 15 sujets, comme indiqué dansFigure 4.

Selon les différences qui existent dans le degré et la polarité des sujets en exprimant leurs positions, cet article développe un système d'indicateur de position à cinq catégories et classe les 15 sujets en cinq positions, comme le montreTableau 9.Des nuages de mots sont générés pour chaque position, et il y a une différence substantielle de polarité et le degré de position, comme indiqué dansFigure 5.

En analysant les mots clés dans 15 catégories, nous pouvons classer les avis en 15 sujets.Si une revue s'oppose fermement au comportement d'un enfant et soutient le médecin, il est classé comme «SS».Si un examen s'oppose au gardien de l'enfant ou à la violence en ligne ou considère simplement le comportement de l'enfant comme trop extrême, il est classé comme «WS».Si une revue suggère que le médecin est en faute pour avoir frappé impulsivement l'enfant ou estime que le médecin n'est pas en faute pour avoir frappé l'enfant, il est étiqueté comme «WO».Si une revue s'oppose fermement au médecin et suggère une sanction légale, elle est désignée comme «donc».Tous les autres sujets relèvent de la catégorie neutre.

Prendre des «SS» comme exemple, considérant les mots clés tels que «mérité», «votre enfant», «sa famille», «calme» et «puissant», nous pouvons déduire les conclusions suivantes du contexte de l'événement et du sensde ces termes.Dans ce cas, l'expression «méritée» implique que le comportement de l'enfant est censé justifier des conséquences correspondantes.Le terme «calme» peut indiquer que la plupart des gens ont du mal à rester rationnel dans cette situation.Ce point de vue peut amener les utilisateurs à ne pas être en mesure d'accepter le comportement de l'enfant et à maintenir une attitude de soutien envers le médecin.

Comme on peut le voir deTableau 9, SS estime que la faute réside dans l'enfant battu et soutient la conduite du médecin dans la défense de ses droits.WS fait preuve de solidarité avec le médecin en s'opposant au gardien de l'enfant battu, etc. Il croit donc que l'utilisation de la violence pour maintenir les droits est tout à fait inacceptable, tandis que Wo pense que le médecin vient d'agir impulsivement.De plus, Neutre discute des détails de l'événement, y compris la cause et l'effet de l'incident, etc.

Ensuite, ces problèmes peuvent être traités spécifiquement.Pour SS, nous devons prêter attention à calmer leur colère et à les informer des lois pertinentes;Pour WS, nous devons répondre positivement aux requêtes soulevées par eux;Pour ce, nous devons les informer rapidement des résultats du traitement et répondre à leurs demandes;Et pour WO, nous devons prêter attention à leurs opinions et suggestions.De plus, pour neutre, nous devons divulguer des informations et répondre aux requêtes en temps opportun.

Par conséquent, la position à cinq catégories suggérée dans cette étude reflète non seulement la position de l'utilisateur d'une manière plus détaillée, mais montre également des différences dans la position utilisateur qui ne peut pas être réalisée par la position à trois catégories.La position à cinq catégories aide à mieux réaliser l'extraction d'opinion et a une grande valeur d'application.

6. Conclusions et perspectives

Cet article propose une méthode de détection en multi-fonctions en fusionnant les caractéristiques du sentiment.Un système d'indicateur de position à cinq catégories est initialement créé sur la base du modèle LDA pour distinguer les positions de différentes polarités et degrés.Ensuite, le lexique du sentiment et l'apprentissage en profondeur sont combinés pour construire un modèle de détection de position.

Les résultats expérimentaux indiquent que le modèle a obtenu le score le plus élevé de 85,29% sur leFwmétrique, démontrant sa capacité à identifier efficacement les positions de différentes polarités et degrés.En outre, grâce à la fonctionnalité d'extraction de sujets de LDA, le modèle décrit avec précision non seulement les positions et les sentiments des utilisateurs, mais révèle également les différences entre les positions.Avec une classification plus complète des positions, le BACF peut saisir avec précision les positions et les attitudes des utilisateurs et reconnaître les différences et les raisons entre différentes positions.Cette compréhension présente des implications importantes pour la gestion d'opinion publique et a un énorme potentiel de demandes dans des domaines tels que l'élaboration des politiques et la planification du marché.

Bien que la méthode proposée dans cet article obtient des résultats améliorés dans la détection multi-fonctions, il repose principalement sur un jugement manuel lors de la catégorisation des sujets en différentes polarités et degrés de position.Une étude future se concentrera sur la façon de construire une relation quantitative entre les sujets et les positions.Pendant ce temps, à mesure que les réseaux sociaux en ligne évoluent, des fonctionnalités d'utilisateurs plus diverses et complexes peuvent émerger.Une future étude se concentrera sur la façon de mettre à jour constamment le modèle pour l'adapter aux nouvelles conditions d'application.

Contributions d'auteur

Conceptualisation, W.H.et J.Y.;Méthodologie, W.H;Software, J.Y.;Validation, J.Y.;Analyse formelle, W.H.et J.Y.Curration des données, J.Y.;Écriture - Préparation d'origine, J.Y.;Écriture - Révisier et édition, W.H.Tous les auteurs ont lu et accepté la version publiée du manuscrit.

Financement

Cette recherche a été financée par la National Natural Science Foundation of China - recherche sur le mécanisme de guidage et de blocage de la propagation de l'opinion publique du point de vue du modèle d'émotion (72271128);Recherche sur la sécurité et la stabilité de la chaîne d'approvisionnement internationale de coopération dans le cyberespace, un projet de soutien au travail clé de la base de recherche de la gouvernance internationale dans le cyberespace pour 2023.

Déclaration du comité d'examen institutionnel

N'est pas applicable.

Énoncé du consentement éclairé

N'est pas applicable.

Énoncé de disponibilité des données

Les données originales présentées dans l'étude sont ouvertement disponibles dans GitHubat (https://github.com/hello-world2024/A_Multi_Stance_Detection_Method_by_Fusing_Sentiment_Features.git, consulté le 25 avril 2024).

Les conflits d'intérêts

Aucun conflit d'intérêts potentiel n'a été signalé par les auteurs.

Les références

  1. Dilek, K.;Fazli, C. Détection de position: une enquête.ACM Comput.Surv. 2020,53, 1–37.[Google Scholar] [Crossref]]
  2. Jia, P.;Du, Y.;Hu, J.;Li, H.;Li, X.;Chen, X. Une approche BILSTM améliorée pour la détection de position des utilisateurs basée sur des connaissances externes de connaissances et d'environnement.Appl.Sci. 2022,12, 10968. [Google Scholar] [Crossref]]
  3. Jing, M.;Wei, G.;Kam-Fai, W. Détectez les rumeurs et la position conjointement par l'apprentissage par plusieurs tâches neuronales.Dans les actes du WWW’18: Companion, la conférence Web, Lyon, France, 23-27 avril 2018;pp. 585–593.[Google Scholar] [Crossref]]
  4. Poddar, L.;Hsu, W.;Lee, M.L.;Subramaniyam, S. Prédire les positions dans les conversations Twitter pour détecter la véracité des rumeurs: une approche neuronale.Dans les actes de la 30e conférence internationale de l'IEEE sur les outils avec l'intelligence artificielle (ICTAI), Volos, Grèce, 5-7 novembre 2018;pp. 65–72.[Google Scholar] [Crossref]]
  5. Blei, D.M.;Ng, A.Y.;Jordan, M.I.Allocation latente Dirichlet.J. Mach.Apprendre.Res. 2003,3, 993–1022.[Google Scholar]]
  6. Keawtoomla, N.;Pongwat, A.;Bootkrajang, J. Utilisation de l'allocation latente Dirichlet pour enquêter sur l'expérience des clients dans l'hébergement Airbnb pendant la pandémie Covid-19 au Royaume-Uni.Dans les actes de la 192e 19e Conférence conjointe internationale sur l'informatique et le génie logiciel (JCSSE), Bangkok, Thaïlande, 22-25 juin 2022;pp. 1–6.[Google Scholar] [Crossref]]
  7. Tomojiri, D.;Takaya, K.;ISE, T. Tendances temporelles et distribution spatiale des sujets de recherche dans l'étude des débris marins anthropiques: modélisation de sujets utilisant l'allocation de Dirichlet latente.MAR. POLLUT.Taureau. 2022,182, 113917. [Google Scholar] [Crossref] [Pubment]]
  8. Xu, X.;Hu, F.;Du, P.;Wang, J.;Li, L. Détection de position efficace avec une caractéristique latente.Web et Big Data.Dans les actes des ateliers internationaux de l'APWEB-Waim 2017: MWDA, Hotspatial, GDMA, DDC, SDMA, Mass, Pékin, Chine, 7-9 juillet 2017;Volume 10612, pp. 21–30.[Google Scholar] [Crossref]]
  9. Sherif, S.S.;Shawky, D.M.;Fayed, H.A.Un modèle d'ensemble pour la détection de position dans les textes des médias sociaux.Int.J. Inf.Technol.Deis.Mak. 2023,22, 737–775.[Google Scholar] [Crossref]]
  10. Liu, W.;Peng, X.;Li, C.;Wang, P.;Wang, L.H. Une enquête sur la détection des positions.J. Chin.Inf.Processus. 2020,34, 1–8.[Google Scholar]]
  11. Dey, K.;Shrivastava, R.;Kaushik, S. Twitter Stance Detection - Une approche biphasée de la subjectivité et de la polarité du sentiment.Dans les actes de la Conférence internationale de l'IEEE 2017 sur les ateliers d'exploration de données (ICDMW), Nouvelle-Orléans, LA, États-Unis, 18-21 novembre 2017;pp. 365–372.[Google Scholar] [Crossref]]
  12. Mourad, S.S.;Shawky, D.M.;Fayed, H.A.;Badawi, A.H. Détection de position dans les tweets à l'aide d'un classificateur de vote majoritaire.Dans les actes de la Conférence internationale sur les technologies et applications d'apprentissage automatique avancées (AMLTA2018), Caire, Égypte, 22-24 février 2018;Volume 723, pp. 375–384.[Google Scholar] [Crossref]]
  13. Siddiqua, U.A.;Chy, A.N.;Aono, M. Tweet Telect Dectection à l'aide d'un modèle d'ensemble neural basé sur l'attention.Dans les actes du chapitre nord-américain 2019 de l'Association for Computational Linguistics: Human Language Technologies, Minneapolis, MN, États-Unis, 2-7 juin 2019;Volume 1, pp. 1868–1873.[Google Scholar] [Crossref]]
  14. Liu, H.;Li, S.;Zhou, G. Détection de position à deux cibles avec modélisation de zone liée à la cible.Dans les procédures de la 24e conférence de Chine, CCIR 2018, Renseignante de l'information, Guilin, Chine, 27-29 septembre 2018;pp. 170–182.[Google Scholar] [Crossref]]
  15. Zhang, X.;Liu, C.;GAO, Z.Q.;Jiang, Y. Détection de position de texte basée sur l'apprentissage en profondeur.Dans les actes de la Conférence internationale de l'IEEE 2021 sur les progrès dans l'informatique et l'informatique (PIC), Shanghai, Chine, 17-19 décembre 2021;pp. 193–199.[Google Scholar] [Crossref]]
  16. Tran, O.T.;Phung, A.C.;Bach, N.X.Utilisation du réseau neuronal de convolution avec Bert pour la détection de position en vietnamien.Dans les actes de la treizième conférence de ressources linguistiques et d'évaluation, Marseille, France, 20-25 juin 2022;pp. 7220–7225.[Google Scholar]]
  17. Li, W.;Xu, Y.;Wang, G. Détection de position multi-ciblement basée sur le modèle de réseau GRU-PWV-CNN.J. Internet Technol. 2021,22, 593–603.[Google Scholar]]
  18. Li, C.;Peng, H.;Li, J.X.;Sun, L.;Lyu, L.;Wang, L.;Philip, S.Y.;Lui, L. Position commune et détection de rumeurs dans un graphique hétérogène hiérarchique.J. IEEE Trans.Neural netw.Apprendre.Syst. 2022,33, 2530–2542.[Google Scholar] [Crossref] [Pubment]]
  19. Liu, C.;Zhou, K.X.;Zhou, L.X.Infusant des connaissances externes dans la détection des positions des utilisateurs dans les plateformes sociales.J. Intelle.SYME FUZZY. 2024,46, 2161–2177.[Google Scholar] [Crossref]]
  20. Zheng, H.Y.;Gao, J.B.;Qiu, J. Stance Detection in Chinese Microblog Topic basé sur la technologie d'intégration des mots et la caractéristique des mots thématiques.Comput.Syst.Appl. 2018,27, 118–123.[Google Scholar] [Crossref]]
  21. Dey, K.;Shrivastava, R.;Kaushik, S. Détection de position topique pour Twitter: un modèle LSTM en deux phases utilisant l'attention.Dans les actes de la 40e Conférence européenne sur la recherche IR, ECIR 2018, Advances in Information Retrieval, Grenoble, France, 26-29 mars 2018;pp. 529–536.[Google Scholar] [Crossref]]
  22. Karande, H.;Walambe, R.;Benjamin, V.;Kotecha, K.;Raghu, T.S.Détection de position avec Bert Embeddings pour l'analyse de crédibilité des informations sur les réseaux sociaux.J. Peerj Comput.Sci. 2021,7, 467.[Google Scholar] [Crossref] [Pubment]]
  23. Hochreiter, S.;Schmidhuber, J. Mémoire à court terme à court terme.J. Neural Comput. 1997,9, 1735–1780.[Google Scholar] [Crossref] [Pubment]]
  24. Le, C.Y.;Boseer, B.;Denker, J.S.;Henderson, D.;Howard, R.E.;Hubbard, W.;Jackel, L.D.Backpropagation appliquée à la reconnaissance de code postal manuscrit.J. Neural Comput. 1989,1, 541–551.[Google Scholar]]
  25. Liu, P.F.;Qiu, X.P.;Huang, X.J.Réseau neuronal récurrent pour la classification du texte avec apprentissage multi-tâches.Dans les actes de la vingt-cinquième conférence conjointe internationale sur l'intelligence artificielle, New York, NY, États-Unis, 9-15 juillet 2016;pp. 2873–2879.[Google Scholar]]
  26. Kim, Y. Réseaux de neurones convolutionnels pour la classification des phrases.Dans les actes de la Conférence de 2014 sur les méthodes empiriques en matière de traitement du langage naturel (EMNLP), Doha, Qatar, 25-29 octobre 2014;pp. 1746–1751.[Google Scholar]]
  27. Zhou, P.;Shi, W.;Tian, J.;Qi, Z.Y.;Li, B.C.;Hao, H.W.;Xu, B. Réseaux de mémoire bidirectionnels à court terme basés sur l'attention pour la classification des relations.Dans les actes de la 54e réunion annuelle de l'Association for Computational Linguistics, Berlin, Allemagne, 7-12 août 2016;pp. 207–212.[Google Scholar]]
  28. Lai, S.W.;Xu, L.H.;Liu, K.;Zhao, J. Réseaux de neurones convolutionnels récurrents pour la classification du texte.Dans les actes de la vingt-neuvième conférence AAAI sur l'intelligence artificielle, Austin, TX, États-Unis, 25-30 janvier 2015;pp. 2267–2273.[Google Scholar]]
  29. Röder, M.;Les deux, A.;Hinneburg, A. Exploration de l'espace des mesures de cohérence du sujet.Dans les actes de la huitième conférence internationale de l'ACM sur la recherche sur le Web et l'exploration de données, Shanghai, Chine, 2-6 février 2015;pp. 399–408.[Google Scholar] [Crossref]]
  30. Keith, S.;Philip, K.;David, A.;David, B. Exploration de la cohérence du sujet sur de nombreux modèles et de nombreux sujets.Dans les actes de la Conférence conjointe de 2012 sur les méthodes empiriques en matière de traitement du langage naturel et d'apprentissage du langage naturel informatique, Island de Jeju, République de Corée, 12-14 juillet 2012;pp. 952–961.[Google Scholar]]

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (1)

Figure 1.Cadre de recherche.

Figure 1.Cadre de recherche.

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (2)

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (3)

Figure 2.Structure du modèle de détection multi-fonctions.

Figure 2.Structure du modèle de détection multi-fonctions.

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (4)

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (5)

Figure 3.Statistiques de longueur des revues.

Figure 3.Statistiques de longueur des revues.

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (6)

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (7)

Figure 4.Identification du nombre de sujets.

Figure 4.Identification du nombre de sujets.

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (8)

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (9)Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (10)

Figure 5.Nuages de mots pour chaque position: (1) Un appui solide, (2) Un faible soutien, (3) Neutre, (4) Une faible opposition, (5) Une forte opposition.

Figure 5.Nuages de mots pour chaque position: (1) Un appui solide, (2) Un faible soutien, (3) Neutre, (4) Une faible opposition, (5) Une forte opposition.

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (11)Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (12)

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (13)

Tableau 1.Paramètres des paramètres de LDA.

Tableau 1.Paramètres des paramètres de LDA.

ParamètreValeur
corpusTf-idf
num_topics25
coldix
chunksize100

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (14)

Tableau 2.Structure du lexique du sentiment.

Tableau 2.Structure du lexique du sentiment.

LexiqueMots du sentimentNombre
Lexique positifgrand bonheur6094
Lexique négatifennuyé, découragé11 445
Lexique adverbeplutôt, extrêmement252
Lexique de négationpas, non14
Mots d'arrêt",", un112

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (15)

Tableau 3.Structure du sous-flux.

Tableau 3.Structure du sous-flux.

Sub-composeMots du sentiment
ExtrêmementTrès, extrêmement
Trèstout à fait, assez
PlusEncore plus, relativement
Légèrementlégèrement, un peu
InsuffisantPas très, pas le cas
Excessifexcessif, trop

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (16)

Tableau 4.Paramètres des paramètres publics.

Tableau 4.Paramètres des paramètres publics.

ParamètreValeur
padding_size64
taille du lot128
taux d'apprentissage1 × 10−2
époques15

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (17)

Tableau 5.Sélection du taux d'apprentissage.

Tableau 5.Sélection du taux d'apprentissage.

Taux d'apprentissageFw
0.00010,5629
0,00030,7410
0,0010,7586
0,0030,7733
0,010,8403
0,030,3352
0.10.2194
0.30,2244

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (18)

Tableau 6.Résultats expérimentaux de comparaison avec les modèles traditionnels en profondeur.

Tableau 6.Résultats expérimentaux de comparaison avec les modèles traditionnels en profondeur.

ModèlePwRwFw
LSTM73,82%75,01%73,86%
CNN78,21%78,33%77,33%
Gru78,71%78,53%78,57%
bi-lstm-watch79,45%78,33%78,64%
Textrcnn79,82%80,12%79,20%
bi-lstm-cnn80,32%80,37%79,33%
BACF84,42%83,99%84,03%

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (19)

Tableau 7.Résultats expérimentaux de l'étude d'ablation.

Tableau 7.Résultats expérimentaux de l'étude d'ablation.

ModèlePwRwFw
bi-lstm-cnn80,32%80,37%79,33%
BCF82,17%81,95%81,91%
Bac82,18%82,20%82,07%
BACF84,42%83,99%84,03%

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (20)

Tableau 8.Résultats expérimentaux de la vérification de la généralisation.

Tableau 8.Résultats expérimentaux de la vérification de la généralisation.

ModèlePwRwFw
LSTM73,75%74,52%71,21%
CNN83,04%83,40%83,02%
Gru84,12%84,43%84,11%
bi-lstm-watch84,62%84,81%84,69%
Textrcnn84,08%84,23%83,59%
BACF85,80%85,07%85,29%

Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (21)

Tableau 9.Système d'indicateur de position à cinq catégories et leurs mots clés correspondants.

Tableau 9.Système d'indicateur de position à cinq catégories et leurs mots clés correspondants.

PositionSujetMots clés
SS# L'enfant battu avait affiché un comportement inacceptable.Comprendre et soutenir le médecin.Mérité, votre enfant, sa famille, calme, puissant
WS# Opposition à l'utilisation par le tuteur de l'enfant battu de la violence sur Internet et à la dissimulation des faits.Violence Internet, génial, mal, esquive le problème, conflit
# Le gardien de l'enfant battu est principalement responsable de l'événement.Comprendre, cette famille, les valeurs morales, le quartier, publier en ligne
# La violence de l'enfant battu est scandaleuse.Poke, violence, inverse, bon, colère
Neutre# Discussion des détails liés à l'événement.Combats, santé mentale, commentaires, événements, fonctionnaires
# Discussion de la conduite et de la responsabilité de la personne impliquée.Mauvais enfant, opinion publique, maternelle, grand-père, Dr Lu
# Discussion des causes de l'événement.Jugement, visage, ponction, vérité, jab
# Discussion de l'impact de l'événement.Diable, événement, traumatisme, psychologique, tuteur
# Faire des remarques sarcastiques sur l'événement.Gifle, espoir, correction, service de police, gentil
# Les deux côtés dans l'événement sont à blâmer.Battre, mauvaise femme, appeler la police, la famille, un œil pour un œil
Wo# L'agression du médecin était tout simplement impulsive.Gamin, docteur, adulte, coup, impulsif
# La principale erreur du médecin réside dans l'approche du traitement.Frappez en arrière, ma maison, raconte, réclame, capacité
# L'agression du médecin a rendu son action raisonnable déraisonnable.Dr Lu, aurait, raisonnable, conséquences, responsables
DONC# L'agression sera sévèrement punie en vertu de la loi.CD (abréviation de la détention pénale), coût, détention pénale, décès, accord
# Les adultes ne devraient en aucun cas frapper les enfants.Combattre, gamin, adulte, certainement, inapproprié

Avertissem*nt / note de l'éditeur:Les déclarations, opinions et données contenues dans toutes les publications sont uniquement celles des auteurs individuels et des contributeurs et non de MDPI et / ou des éditeurs.MDPI et / ou l'éditeur (s) déclinent la responsabilité de toute blessure aux personnes ou à des biens résultant de toute idées, méthodes, instructions ou produits mentionnés dans le contenu.


© 2024 par les auteurs.Licencié MDPI, Bâle, Suisse.Cet article est un article en libre accès distribué dans les termes et conditions de la licence Creative Commons Attribution (CC by) (https://creativecommons.org/licenses/by/4.0/).
Une méthode de détection à plusieurs stances en fusionnant les fonctionnalités du sentiment (2024)

References

Top Articles
Latest Posts
Article information

Author: Tuan Roob DDS

Last Updated:

Views: 6309

Rating: 4.1 / 5 (62 voted)

Reviews: 93% of readers found this page helpful

Author information

Name: Tuan Roob DDS

Birthday: 1999-11-20

Address: Suite 592 642 Pfannerstill Island, South Keila, LA 74970-3076

Phone: +9617721773649

Job: Marketing Producer

Hobby: Skydiving, Flag Football, Knitting, Running, Lego building, Hunting, Juggling

Introduction: My name is Tuan Roob DDS, I am a friendly, good, energetic, faithful, fantastic, gentle, enchanting person who loves writing and wants to share my knowledge and understanding with you.