File size: 2,723 Bytes
4a3c725
33de6ef
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4a3c725
33de6ef
 
 
 
4a3c725
33de6ef
 
 
c6e1606
33de6ef
4a3c725
33de6ef
 
 
 
 
 
 
 
 
 
 
 
4a3c725
 
 
33de6ef
 
 
 
 
 
 
4a3c725
33de6ef
 
81d55d8
 
 
4a3c725
c6e1606
6347599
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
import gradio as gr
import pandas as pd
from transformers import pipeline
from collections import Counter
import re

# Configurar el clasificador de sentimientos multilingüe
classifier = pipeline(task="zero-shot-classification", model="facebook/bart-large-mnli")

# Función para analizar los sentimientos de una lista de textos
def analyze_sentiments(texts):
    if not texts:
        return "0.0%", "0.0%", "0.0%", []  # Manejar el caso donde no hay textos para analizar

    positive, negative, neutral = 0, 0, 0
    all_words = []
    for text in texts:
        results = classifier(text, ["positive", "negative", "neutral"], multi_label=True)
        mx = max(results['scores'])
        ind = results['scores'].index(mx)
        result = results['labels'][ind]
        if result == "positive":
            positive += 1
        elif result == "negative":
            negative += 1
        else:
            neutral += 1
        
        # Procesar palabras del texto
        words = re.findall(r'\w+', text.lower())
        all_words.extend(words)
    
    total = len(texts)
    positive_percent = round((positive / total) * 100, 1)
    negative_percent = round((negative / total) * 100, 1)
    neutral_percent = round((neutral / total) * 100, 1)
    
    # Contar las palabras más comunes
    word_counts = Counter(all_words)
    most_common_words = word_counts.most_common(10)  # Obtener las 10 palabras más comunes
    
    return f"{positive_percent}%", f"{negative_percent}%", f"{neutral_percent}%", most_common_words

# Función para cargar el archivo CSV y analizar los primeros 100 comentarios
def analyze_sentiment_from_csv(file):
    try:
        df = pd.read_csv(file.name)
        if 'content' not in df.columns:
            raise ValueError("El archivo CSV no contiene una columna 'content'")
        texts = df['content'].head(100).tolist()  # Tomar solo los primeros 100 comentarios
        return analyze_sentiments(texts)
    except pd.errors.ParserError as e:
        return f"Error al analizar el archivo CSV: {e}", "", "", []
    except Exception as e:
        return f"Error inesperado: {e}", "", "", []

# Configurar la interfaz de Gradio
demo = gr.Interface(
    fn=analyze_sentiment_from_csv,
    inputs=gr.File(file_count="single", label="Sube tu archivo CSV"),  # Permitir la carga del archivo CSV
    outputs=[
        gr.Textbox(label="Porcentaje Positivo"),
        gr.Textbox(label="Porcentaje Negativo"),
        gr.Textbox(label="Porcentaje Neutro"),
        gr.Textbox(label="Palabras Más Usadas")
    ],
    title="Analizador de Sentimientos V.2",
    description="Porcentaje de comentarios positivos, negativos y neutrales, y palabras más usadas"
)

demo.launch(share=True)