Modele : XLM-RoBERTa (4 classes sentiment)
Classification : chaque article RSS et post social est classe automatiquement en 4 categories :
- Positif — signal fort d'adhesion
- Neutre + — factuel / leger soutien
- Neutre − — leger critique
- Negatif — signal fort de rejet
Formule du score (par scope NAT / INT) :
avg = (pos × 1.0 + neup × 0.10 + neun × −0.25 + neg × −1.0) / total
score = (avg + 1) / 2 × 100
Echelle : 0 = rejet total · 50 = neutre · 100 = adhesion totale
Ponderation :
- Positif × 1.0 — poids fort (adhesion reelle)
- Neutre + × 0.10 — poids faible (factuel, pas de l'adhesion)
- Neutre − × −0.25 — leger signal negatif
- Negatif × −1.0 — poids fort (rejet reel)
Anti-spam RSS : au-dela de 3 articles/source/personnalite/jour, le poids decroit en logarithme (cap ≈ 7 pour 50 articles). Empeche une source unique de dominer le score.
Seuil de fiabilite : < 10 mentions sur 30 jours = "N/A" (donnees insuffisantes).
Scopes :
- NAT — sources nationales (medias + reseaux sociaux du pays)
- INT — sources internationales (presse etrangere)
Ce score mesure le ton mediatique, pas un sondage d'opinion. L'ecart avec les sondages est normal : les medias couvrent les faits, les sondages mesurent l'adhesion directe des citoyens.