Una stop list, o lista di stopword, è una lista predefinita di parole escluse dai processi di indicizzazione e reperimento di informazioni.
Utilizzo
Lo scopo di una stop list è quello di escludere le parole che sono così comuni e frequenti in una lingua da avere poca o nessuna valenza per distinguere un documento da un altro.
Operatori
Le stoplist di solito includono parole come “a”, “un”, “il”, “in”, “su”, “di” e altre preposizioni, congiunzioni e articoli. Dato che queste parole non sono portatrici in sé di significato, la includerle in una query di ricerca o in un indice porterebbe a molti risultati di ricerca irrilevanti.
Elaborazione del linguaggio
Nella elaborazione del linguaggio naturale (Natural. Language Processing – NLP), le stop list stop sono spesso utilizzate per pre-processare i dati testuali prima di attività come la classificazione dei documenti, l’analisi del sentiment o la modellazione degli argomenti.
Rimuovere le stop word da un documento o da un corpus rende le parole rimanenti più significative e permette di rivelare gli argomenti e i temi di fondo.
Pagine e articoli correlati
Se stai cercando contenuti simili, dai un’occhiata a questi suggerimenti e scopri di più sul mondo dell’e-commerce e su Luigi’s Box.
Stop word
Le stop word sono le parole giudicate di nessun valore all'interno di un indice (Vedi anche Elenchi di parole escluse).
Elenchi di parole escluse
Le stop list escludono parole troppo comuni dall'indice, migliorando la precisione della ricerca. Scopri come funzionano!
Risultati di ricerca
I risultati di ricerca sono i documenti o le informazioni che una ricerca ha restituito.
Glossario della ricerca
Coda lunga
La coda lunga rappresenta query rare ma numerose. Luigi's Box ottimizza anche queste per migliorare la soddisfazione dei clienti.
Indicizzazione linguistica
L'indicizzazione linguistica è la classificazione di gruppi di parole in categorie grammaticali come nomi, aggettivi, verbi.
Ranking
Il ranking ordina i contenuti per pertinenza. Luigi's Box utilizza punteggi avanzati per risultati rilevanti e organizzati.
Stemming
Lo stemming identifica la radice delle parole per ricerche più precise. Luigi's Box usa questa tecnica per migliorare i risultati.