Oferta de Proyectos Fin de Carrera
- Representación de documentos HTML dentro de Latent Semantic Indexing y con función de ponderación basada en
combinaciones heurísticas de criterios.
Descripción: Latent semantic analysis (LSA) es una técnica dentro del Procesamiento de Lenguaje Natural basado fundamentalmente en la coaparición de términos en los documentos; LSA usa una matriz término-documento que describe dichas occurrencias. Las filas se corresponden con documentos y las columnas con los términos. Un típico ejemplo de función de ponderación dentro de este espacio es la función TF-IDF (que considera la frecuencia de aparición de un término en un documento y lo corrige penalizando aquellos términos que aparezcan muy habitualmente en una colección). El objetivo de este trabajo es desarrollar una aplicación capaz de represemtar documentos HTML considerando funciones de ponderación basadas en combinaciones borrosas de criterios.
Tutor: Víctor Fresno (victor.fresno@urjc.es)
Número de alumnos: 1
Titulación: Ingeniería Técnica en Informática de Gestión / Sistemas. Conocimientos previos deseables: Java, XML. - Validador de Entidades Clasificadas.
Descripción: Ante la salida de un sistema de identificación y clasificación de Entidades Nombradas (nombres de personas, lugares, organizaciones, etc.), se trata de validar si todas las entidades se encuentran bien clasificadas, y si no es así, clasificarlas correctamente. Se trabajará con documentos de noticias de periódicos.
Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Víctor Fresno (victor.fresno@urjc.es)
Número de alumnos: 1
Titulación: Ingeniería en Informática. Conocimientos previos deseables: Java, Swing, XML.
Proyectos Fin de Carrera en desarrollo:
- Aprendizaje Automático para la estimación de parámetros en algoritmos de clustering.
Descripción: El Aprendizaje Automático es una rama de la Inteligencia Artificial que desarrolla técnicas que permiten desarrollar sistemas capaces de obtener mejores comportamientos con experimencia que sin ella, es decir, técnicas que permiten aprender a las máquinas. Se trata de diseñar y construir una aplicación que permita estimar los parámetros que obtengan los mejores resultados en un algoritmo de clustering. Para ello se deben analizar diferentes técnicas de Aprendizaje Automático, así como su posible aplicación sobre diferentes algoritmos de clustering de documentos.
Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Víctor Fresno (victor.fresno@urjc.es)
Número de alumnos: 1
Titulación: Ingenierías Técnicas en Informática.
Conocimientos previos deseables: Java, Swing, XML. - Extracción de los términos más relevantes de un documento de texto a partir de formatos Open Document (ODF)
mediante combinaciones heurísticas de criterios.
Descripción: El Open Document Format es un formato estándar (ISO 26300) basado en XML que permite guardar documentos de texto, bases de datos, hojas de cálculo, presentaciones... Se trata de diseñar y construir una aplicación que permita extraer el contenido de un documento de texto escrito en en ODF y, en base a un conjunto de heurísticas básicas extraídas de los procesos de lectura y escritura de textos, encontrar el conjunto de términos que resulten más representativos del contenido de textual del documento. Los criterios considerados deberán ser combinados por medio de un motor borroso (fuzzy).
Tutor: Víctor Fresno (victor.fresno@urjc.es)
Alumnos: Vanessa
Titulación: Ingeniería Técnica en Informática de Gestión / Sistemas.
Conocimientos previos deseables: Java, XML. - Herramienta de soporte a la transformación de Vocabularios.
Descripción: Se trata de transformar diferentes vocabularios o documentos de su formato inicial a otro formato adecuado para un determinado procesamiento; de tal forma que se puedan reorganizar sus elementos, añadir, eliminar, etc..
Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Víctor Fresno (victor.fresno@urjc.es)
Alumno: Miguel Ángel Guadix
Titulación: Ingenierías Técnicas en Informática de gestión
Conocimientos previos deseables: Java, Swing, lenguajes de marcado. - Plataforma de soporte para Clustering Multilingüe de Documentos.
Descripción: El Clustering Multilingüe de documentos consiste en agrupar documentos en diferentes idiomas cuya temática es similar. Se trata de diseñar y construir una herramienta que pueda ejecutar diferentes algoritmos de clustering para una misma entrada, realizando por tanto una comparativa de los mismos.
Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Víctor Fresno (victor.fresno@urjc.es)
Alumno: Sergio Mas
Titulación: Ingeniería en Informática.
Conocimientos previos deseables: Java, Swing, XML. - Interfaz de un motor de búsqueda web con integración de sistemas de clasificación y clustering de documentos.
Descripción: Diseño y desarrollo de un interfaz que permita la interacción con un motor de búsqueda de páginas web (el motor ya existe). El conjunto de páginas resultado del motor de búsqueda, se deberán visualizar de forma que permita la integración de sistemas de clasificación automática y clustering de páginas web.
Tutor: Víctor Fresno (victor.fresno@urjc.es)
Alumno: Santi Huertas
Titulación: Ingeniería Técnica en Informática de Gestión.
Conocimientos previos deseables: Java, HTML. - Sistema de evaluación Fuzzy en entornos de enseñanza colaborativa.
Descripción:
Tutor: Víctor Fresno (victor.fresno@urjc.es) y Maximiliano Paredes (maximiliano.paredes@urjc.es)
Alumno: Carolina Ramírez
Titulación: Ingeniería Técnica en Informática de Gestión.
Conocimientos previos deseables: Java. - Identificación de cognados en Corpora Comparables.
Descripción: Diseñar e implementar de una herramienta que permita identificar cognados en las diferentes lenguas en que están escritos los documentos de un corpus comparable.
Tutor: Víctor Fresno (victor.fresno@urjc.es) y Soto Montalvo (soto.montalvo@urjc.es)
Alumno: Eva Teruel
Titulación: Ingeniería Informática.
Conocimientos previos deseables: Java, Swing, XML. - Reconocimiento de Entidades Nombradas Temporales.
Descripción: El Reconocimiento de Entidades Nombradas es una rama dentro del Procesamiento de Lenguaje Natural. Este proyecto consiste en identificar expresiones temporales en documentos de noticias. Se trata de diseñar y construir una aplicación que permita identificar entidades temporales y anotar los documentos de entrada, así como otros tipos de entidades como números y abreviaturas.
Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Víctor Fresno (victor.fresno@urjc.es)
Alumno: Iván Urroz
Titulación: Ingenierías Técnicas en Informática.
Conocimientos previos deseables: Java, XML. - Detección de menciones de entidades.
Descripción:
Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Víctor Fresno (victor.fresno@urjc.es)
Alumno: Miguel Ángel Tinte
Titulación: Ingenierías Técnicas en Informática.
Conocimientos previos deseables: Java, Swing, XML.
Proyectos Fin de Carrera dirigidos
El total de Proyectos Fin de Carrera que he dirigido desde Octubre de 2001 es:
Ingeniería Informática:
- María del Soto Montalvo Herranz. "eXitor: herramienta para la edición asistida de documentos XML". Curso 2002-03.
- Joaquín Pérez Iglesias. "Desarrollo de un editor XML con prevalidación". Curso 2002-03.
- David Arbona Navarro. "Serialización en XML de objetos JAVA". Co-dirección: Soto Montalvo Herranz. Curso 2003-04.
- Félix Coto Ortiz. "exitor2.0: Un editor XML con prevalidación y soporte XML-Schema". Co-dirección: Soto Montalvo Herranz. Curso 2004-05.
- David Hernández Aranda. "Interfaz gráfica de representación de documentos XML mediante combinación borrosa de criterios". Curso 2005-06.
- Daniel Núñez Yuste. "Plataforma de soporte para WSD". Co-dirección: Soto Montalvo Herranz. Curso 2005-06.
- David Reinares Lara. "SVM multiclass: clasificación de páginas web". Curso 2006-2007.
Ingeniería Técnica en Informática de Gestión:
- David Hernández Aranda. "Módulo para la representación de documentos HTML". Curso 2002-2003.
- Daniel Núñez Yuste. "Módulo de Clasificación Automática de páginas web". Curso 2003-04.
- David Fernández de Alba. "XPathViewer: una herramienta para la enseñanza del lenguiaje XPath". Co-dirección: Micael Gallego Carrillo. Curso 2004-2005.
- Daniel Cañamares Ullan. "XSLTViewer: una herramienta para la enseñanza del lenguiaje XSLT". Co-dirección: Micael Gallego Carrillo. Curso 2004-2005.
- José Ruiz Retamosa. "Integración de módulos de representaci´n y clasificación de páginas web mediante bases de datos". Curso 2004-2005.
- Sergio Bullido Barcenilla. "Módulo de representación de documentos XML mediante criterios heurísticos". Curso 2004-2005
- Pedro Contreras Sánchez. "Tienda Virtual con Struts". Curso 2006-2007.