Sobre el comportamiento complejo de las palabras relevantes en textos: heterogeneidad espacial y correlaciones de largo alcance.
| dc.centro | E.T.S.I. Informática | es_ES |
| dc.contributor.advisor | Carpena-Sánchez, Pedro Juan | |
| dc.contributor.advisor | Coronado-Jiménez, Ana Victoria | |
| dc.contributor.author | Carretero-Campos, Concepción | |
| dc.date.accessioned | 2025-02-05T10:02:36Z | |
| dc.date.available | 2025-02-05T10:02:36Z | |
| dc.date.created | 2024 | |
| dc.date.issued | 2025 | |
| dc.date.submitted | 2024-11-29 | |
| dc.departamento | Física Aplicada II | |
| dc.description.abstract | La física estadística de sistemas complejos es un área con múltiples aplicaciones entre las que se encuentra el estudio de las dinámicas del lenguaje escrito. Se conoce que las palabras relevantes de un texto presentan una distribución espacial heterogénea y se concentran en determinadas regiones formando agrupamientos o clusters. La conexión entre clustering y relevancia ha sido usada satisfactoriamente para extraer automáticamente palabras clave sin información previa ni un corpus de referencia Hemos realizado comparaciones con una medida basada en el cálculo de entropía definiendo métricas adecuadas para la evaluación de detectores de palabras clave, y hemos definido una nueva medida de clustering consecuencia de haber obtenido analíticamente la distribución exacta para las distancias entre apariciones sucesivas de una palabra esperada por azar, válida independientemente de la frecuencia de aparición y de la longitud del texto. En aproximaciones anteriores, se usaba como referencia la distribución geométrica, lo que es cierto sólo asintóticamente. La nueva medida mejora la detección en textos cortos y el estudio de los valores de clustering extremos permite diferenciar entre palabras clave genéricas y específicas Se conoce que los textos presentan una distribución espacial compleja que da lugar a la existencia de correlaciones de largo alcance. La fuerte auto-atracción de las palabras relevantes hace pensar que las correlaciones se deben a sus palabras clave. Hemos obtenido un vínculo claro entre ambas pudiéndose usar el grado de correlaciones como medida de relevancia. Realizamos un estudio numérico sistemático de las distribuciones de los tiempos de paso de procesos con correlaciones en ley de potencias y proponemos un modelo que reproduce la distribución espacial de una palabra a todas las escalas, su exponente de correlación y su valor de clustering basado en las correlaciones de largo alcance observadas e incorporando un factor de repulsión a escala corta | es_ES |
| dc.identifier.uri | https://hdl.handle.net/10630/37711 | |
| dc.language.iso | spa | es_ES |
| dc.publisher | UMA Editorial | es_ES |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | * |
| dc.rights.accessRights | open access | es_ES |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
| dc.subject | Tratamiento de textos - Tesis doctorales | es_ES |
| dc.subject.other | Aplicaciones interdisciplinares de la física estadística | es_ES |
| dc.subject.other | Detección de palabras clave | es_ES |
| dc.subject.other | Correlaciones de largo alcance | es_ES |
| dc.subject.other | Lingüística cuantitativa | es_ES |
| dc.title | Sobre el comportamiento complejo de las palabras relevantes en textos: heterogeneidad espacial y correlaciones de largo alcance. | es_ES |
| dc.type | doctoral thesis | es_ES |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | fc66b6b1-80c9-4370-9948-c7066152db7f | |
| relation.isAdvisorOfPublication | 9ca98553-6549-41ea-9754-de5370241670 | |
| relation.isAdvisorOfPublication.latestForDiscovery | fc66b6b1-80c9-4370-9948-c7066152db7f | |
| relation.isAuthorOfPublication | c9182455-7b8b-4157-80fc-61b173d6b228 | |
| relation.isAuthorOfPublication.latestForDiscovery | c9182455-7b8b-4157-80fc-61b173d6b228 |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- TD_CARRETERO_CAMPOS, Concepción.pdf
- Size:
- 4.86 MB
- Format:
- Adobe Portable Document Format
- Description:

