BERTopic_IlPost_baseModel
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("alexman83/BERTopic_IlPost_baseModel")
topic_model.get_topic_info()
Topic overview
- Number of topics: 69
- Number of training documents: 1604
Click here for an overview of all topics.
Topic ID | Topic Keywords | Topic Frequency | Label |
---|---|---|---|
-1 | italia - azienda - altre - soprattutto - euro | 5 | -1_italia_azienda_altre_soprattutto |
0 | specie - animali - casi - orsi - virus | 439 | 0_specie_animali_casi_orsi |
1 | acqua - aria - mare - attività - inquinamento | 104 | 1_acqua_aria_mare_attività |
2 | libro - romanzo - libri - scrittore - romanzi | 65 | 2_libro_romanzo_libri_scrittore |
3 | partito - centrosinistra - candidato - pd - elezioni | 62 | 3_partito_centrosinistra_candidato_pd |
4 | studi - salute - effetti - studio - ricerca | 35 | 4_studi_salute_effetti_studio |
5 | olimpiadi - parigi - atleti - paralimpiadi - cerimonia | 33 | 5_olimpiadi_parigi_atleti_paralimpiadi |
6 | legge - decreto - presidente - italia - riforma | 33 | 6_legge_decreto_presidente_italia |
7 | moda - scarpe - calzini - tasche - modelli | 30 | 7_moda_scarpe_calzini_tasche |
8 | economia - tassi - aumento - inflazione - prezzi | 29 | 8_economia_tassi_aumento_inflazione |
9 | carcere - detenuti - salis - carceri - italia | 28 | 9_carcere_detenuti_salis_carceri |
10 | article text - to extract - to extract article - text - failed to extract | 26 | 10_article text_to extract_to extract article_text |
11 | apple - app - iphone - visore - smartphone | 24 | 11_apple_app_iphone_visore |
12 | israele - palestinesi - gaza - israeliano - hamas | 23 | 12_israele_palestinesi_gaza_israeliano |
13 | musk - twitter - tweet - zuckerberg - social | 23 | 13_musk_twitter_tweet_zuckerberg |
14 | gioco - videogiochi - giochi - videogioco - film | 22 | 14_gioco_videogiochi_giochi_videogioco |
15 | moda - kahlo - abito - met - gala | 22 | 15_moda_kahlo_abito_met |
16 | tiktok - utenti - contenuti - social - facebook | 21 | 16_tiktok_utenti_contenuti_social |
17 | toti - presidente - meloni - genova - italia | 21 | 17_toti_presidente_meloni_genova |
18 | musica - spotify - canzoni - verde - album | 20 | 18_musica_spotify_canzoni_verde |
19 | band - concerti - noel - concerto - musica | 20 | 19_band_concerti_noel_concerto |
20 | google - intelligenza - artificiale - intelligenza artificiale - openai | 19 | 20_google_intelligenza_artificiale_intelligenza artificiale |
21 | vinto - medaglia - finale - oro - olimpiadi | 19 | 21_vinto_medaglia_finale_oro |
22 | metri - olimpiadi - oro - gara - vinto | 19 | 22_metri_olimpiadi_oro_gara |
23 | shein - lusso - azienda - vestiti - marchi | 18 | 23_shein_lusso_azienda_vestiti |
24 | stellantis - auto - fiat - marelli - stabilimento | 17 | 24_stellantis_auto_fiat_marelli |
25 | nasa - spaziale - starliner - terra - lancio | 17 | 25_nasa_spaziale_starliner_terra |
26 | superbonus - commissione - italia - giorgetti - spesa | 17 | 26_superbonus_commissione_italia_giorgetti |
27 | sinner - tennis - torneo - partita - tennista | 16 | 27_sinner_tennis_torneo_partita |
28 | bonatti - gutu - metri - alpinisti - rzucidlo | 16 | 28_bonatti_gutu_metri_alpinisti |
29 | olimpiadi - atleti - sport - metri - gare | 15 | 29_olimpiadi_atleti_sport_metri |
30 | harris - trump - convention - biden - discorso | 15 | 30_harris_trump_convention_biden |
31 | pesce - carne - burger - smash - smash burger | 14 | 31_pesce_carne_burger_smash |
32 | barca - bayesian - lynch - naufragio - equipaggio | 14 | 32_barca_bayesian_lynch_naufragio |
33 | libri - nobel - premio - letteratura - autori | 13 | 33_libri_nobel_premio_letteratura |
34 | cravatta - dogg - foto - snoop dogg - snoop | 13 | 34_cravatta_dogg_foto_snoop dogg |
35 | crowdstrike - windows - informatico - aggiornamento - software | 12 | 35_crowdstrike_windows_informatico_aggiornamento |
36 | adidas - drop - birkin - strisce - lives matter | 12 | 36_adidas_drop_birkin_strisce |
37 | vele - vela - vela celeste - crollo - celeste | 11 | 37_vele_vela_vela celeste_crollo |
38 | chatgpt - openai - intelligenza - intelligenza artificiale - artificiale | 11 | 38_chatgpt_openai_intelligenza_intelligenza artificiale |
39 | nvidia - nft - settore - azienda - aziende | 11 | 39_nvidia_nft_settore_azienda |
40 | ucraina - ucraino - esercito - kursk - russo | 11 | 40_ucraina_ucraino_esercito_kursk |
41 | chanel - valentino - moda - garavani - gucci | 10 | 41_chanel_valentino_moda_garavani |
42 | sole - cielo - eclissi - terra - solare | 10 | 42_sole_cielo_eclissi_terra |
43 | post - spiegate - giornalismo - dicose spiegate - dicose | 10 | 43_post_spiegate_giornalismo_dicose spiegate |
44 | europea - servizi - unione europea - commissione - piattaforme | 10 | 44_europea_servizi_unione europea_commissione |
45 | sesso - donne - lgbt - genere - victoria secret | 10 | 45_sesso_donne_lgbt_genere |
46 | borse - monete - lusso - pantofole - valore | 10 | 46_borse_monete_lusso_pantofole |
47 | von der - der - von - der leyen - von der leyen | 9 | 47_von der_der_von_der leyen |
48 | google - browser - cookie - pubblicità - ricerca | 9 | 48_google_browser_cookie_pubblicità |
49 | libri - biblioteca - library - biblioteche - lugo | 9 | 49_libri_biblioteca_library_biblioteche |
50 | italia - migranti - cittadinanza - cittadinanza italiana - albania | 9 | 50_italia_migranti_cittadinanza_cittadinanza italiana |
51 | libro - moehringer - harry - winfrey - libri | 8 | 51_libro_moehringer_harry_winfrey |
52 | linguaggio - mito - antartide - lingua - comune | 8 | 52_linguaggio_mito_antartide_lingua |
53 | altman - openai - microsoft - amministrazione - intelligenza | 7 | 53_altman_openai_microsoft_amministrazione |
54 | lega - fratelli - fratelli italia - italia - salvini | 7 | 54_lega_fratelli_fratelli italia_italia |
55 | tesla - musk - cybertruck - auto - model | 7 | 55_tesla_musk_cybertruck_auto |
56 | film - vescica - shyamalan - scorsese - roth | 7 | 56_film_vescica_shyamalan_scorsese |
57 | mercato - auto - dazi - euro - cina | 7 | 57_mercato_auto_dazi_euro |
58 | bergamo - treni - lavori - alta - turismo | 7 | 58_bergamo_treni_lavori_alta |
59 | verona - sogliano - squadra - atalanta - calciatori | 7 | 59_verona_sogliano_squadra_atalanta |
60 | pogačar - tour - de france - tour de france - tour de | 7 | 60_pogačar_tour_de france_tour de france |
61 | natale - calendario - regali - dicembre - magi | 7 | 61_natale_calendario_regali_dicembre |
62 | vino - vini - matcha - tè - birra | 6 | 62_vino_vini_matcha_tè |
63 | partito - elezioni - afd - turingia - italia | 6 | 63_partito_elezioni_afd_turingia |
64 | hauser - polizia - stazzema - sant anna - sant | 6 | 64_hauser_polizia_stazzema_sant anna |
65 | numeri casuali - casuali - numeri - garavaglia - italia | 6 | 65_numeri casuali_casuali_numeri_garavaglia |
66 | philo - skims - marchio - moda - collezione | 5 | 66_philo_skims_marchio_moda |
67 | lavastoviglie - lavaggio - acqua - piatti - stoviglie | 5 | 67_lavastoviglie_lavaggio_acqua_piatti |
Training hyperparameters
- calculate_probabilities: True
- language: italian
- low_memory: False
- min_topic_size: 5
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: True
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.33
- UMAP: 0.5.5
- Pandas: 2.2.1
- Scikit-Learn: 1.5.1
- Sentence-transformers: 2.5.1
- Transformers: 4.44.2
- Numba: 0.59.0
- Plotly: 5.19.0
- Python: 3.10.13
- Downloads last month
- 4
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social
visibility and check back later, or deploy to Inference Endpoints (dedicated)
instead.