RafaelJaime commited on
Commit
34c6bef
1 Parent(s): 8903eb7

Upload app.py

Browse files
Files changed (1) hide show
  1. app.py +23 -2
app.py CHANGED
@@ -101,7 +101,7 @@ def end_text():
101
  - Contenido de entrenamiento: Como está basado en datos previos a 2020, no tiene conocimientos sobre eventos recientes. Aunque en nuestro caso, no se haga una limitacion.
102
  - Sesgos en los datos: Dado que se entrenó en un amplio corpus de internet, puede presentar sesgos reflejados en esos datos, lo que debe ser considerado en aplicaciones que lo utilicen para generar texto. De nuevo, para contar cuentos, no importa que los datos sean fantasiosos, aunque puede llevar a historias sin logica.
103
  **Tiempo promedio**
104
- Bastante rapido, normalmente menos de 60 segudos
105
  """)
106
  with gr.Column():
107
  gr.Markdown("""<h4>Bark</h4>
@@ -123,7 +123,28 @@ def end_text():
123
  - No tiene todos los idiomas, debido a que requiere grandes volúmenes de datos de entrenamiento y puede tener dificultades con dialectos menos comunes o con datos limitados.
124
  - Genera audios cortos. No genera mas de 14 segundos, en hugging face al menos.
125
  **Tiempo promedio**
126
- Bastante mas lento que el otro, puede llegar a mas de 300 segundos cada 5 segundos de audio.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
127
  """)
128
  gr.Markdown("""<h3>Links consultados</h3>""")
129
  gr.Markdown("[Git, bark](https://github.com/suno-ai/bark/)")
 
101
  - Contenido de entrenamiento: Como está basado en datos previos a 2020, no tiene conocimientos sobre eventos recientes. Aunque en nuestro caso, no se haga una limitacion.
102
  - Sesgos en los datos: Dado que se entrenó en un amplio corpus de internet, puede presentar sesgos reflejados en esos datos, lo que debe ser considerado en aplicaciones que lo utilicen para generar texto. De nuevo, para contar cuentos, no importa que los datos sean fantasiosos, aunque puede llevar a historias sin logica.
103
  **Tiempo promedio**
104
+ Bastante rapido, normalmente menos de 40 segudos, puedes revisar esto en el [example log](https://huggingface.co/spaces/RafaelJaime/SherezIAde/blob/main/logs/log1.txt).
105
  """)
106
  with gr.Column():
107
  gr.Markdown("""<h4>Bark</h4>
 
123
  - No tiene todos los idiomas, debido a que requiere grandes volúmenes de datos de entrenamiento y puede tener dificultades con dialectos menos comunes o con datos limitados.
124
  - Genera audios cortos. No genera mas de 14 segundos, en hugging face al menos.
125
  **Tiempo promedio**
126
+ Bastante mas lento que el otro, puede llegar a mas o menos 60 segundos cada segundo de audio, puedes revisar esto en el [example log](https://huggingface.co/spaces/RafaelJaime/SherezIAde/blob/main/logs/log1.txt) donde se estarán generando audios de 14 segundos, por lo que tendrá más o menos unos 800 segundos.
127
+ """)
128
+ with gr.Row():
129
+ with gr.Column():
130
+ gr.Markdown("""<h4>sdxl-turbo</h4>
131
+ """)
132
+ gr.Markdown("""
133
+ Desarrollado por [Stability AI](https://huggingface.co/stabilityai), el modelo SDXL-Turbo es una versión avanzada y optimizada de la arquitectura de generadores de imágenes y texto que utiliza transformadores y redes neuronales profundas para generar contenido visual y textual con alta calidad. Es una herramienta de última generación diseñada para proporcionar respuestas rápidas, coherentes y visualmente atractivas, especialmente útil en aplicaciones que requieren generación de imágenes de alta resolución, adaptabilidad temática, y generación de textos creativos o técnicos.
134
+
135
+ **Componentes principales del modelo:**
136
+ - **Arquitectura de transformador avanzada**: SDXL-Turbo emplea una arquitectura de transformador especialmente afinada para generar imágenes y textos con un alto nivel de detalle y coherencia, capturando las relaciones espaciales y semánticas a través de modelos multimodales. Esto permite una integración fluida entre las tareas de texto e imagen.
137
+ - **Generación de imágenes de alta resolución**: Capaz de producir imágenes de alta calidad a partir de descripciones textuales detalladas, el modelo ofrece resultados visuales sorprendentes, lo que lo hace ideal para proyectos creativos, diseño gráfico y generación de contenido visual para medios interactivos.
138
+ - **Optimización de rendimiento**: La versión Turbo de SDXL está diseñada para ser más eficiente en términos de velocidad de generación, sin comprometer la calidad de los resultados. Esto lo hace adecuado para aplicaciones que requieren tiempos de respuesta rápidos, como la generación en tiempo real de contenido visual y textual para juegos, aplicaciones de diseño o chatbots.
139
+ - **Generación de texto creativo y técnico**: Al igual que GPT-2, el modelo tiene la capacidad de generar texto fluido, ya sea para narrativas complejas, artículos, respuestas a preguntas o incluso guiones. Sin embargo, se distingue por su capacidad para adaptarse también a contenidos de alta complejidad técnica, lo que lo hace útil en aplicaciones que requieran un entendimiento preciso de terminología especializada.
140
+
141
+ **Limitaciones del modelo**:
142
+ - Dependencia de datos visuales y textuales: Aunque el modelo ha sido entrenado en un amplio corpus de datos, algunos resultados pueden reflejar los sesgos presentes en las imágenes o textos utilizados para su entrenamiento, lo que puede influir en la calidad o en la diversidad de los contenidos generados.
143
+ - Generación inconsistente en escenas complejas: Aunque el modelo es altamente efectivo, puede encontrar dificultades al generar imágenes extremadamente complejas que requieren detalles muy finos o al mantener la coherencia entre una narrativa escrita y una imagen generada de manera simultánea.
144
+ - Sensibilidad a prompts ambiguos: Al igual que otros modelos de IA, la claridad y precisión del prompt son clave. Instrucciones vagas o ambiguas pueden resultar en contenido menos relevante o difícil de interpretar, tanto en el aspecto visual como textual.
145
+
146
+ **Tiempo promedio**
147
+ Bastante rapido, normalmente algo más de 70 segundos, puedes revisar esto en el [example log](https://huggingface.co/spaces/RafaelJaime/SherezIAde/blob/main/logs/log1.txt).
148
  """)
149
  gr.Markdown("""<h3>Links consultados</h3>""")
150
  gr.Markdown("[Git, bark](https://github.com/suno-ai/bark/)")