Curso de doctorado (4 créditos):
APLICACIONES
DE LA INFORMÁTICA
Código de programa: 5099
Dpto. coordinador: Lenguajes y Sistemas
Informáticos
"Búsquedas inteligentes
de información en la web"
Profesor
Antonio
Ferrández Rodríguez
Breve descripción
La popularización del uso de Internet ha posibilitado la existencia
de enormes cantidades de información y la ha puesto al alcance de
cualquier usuario de este medio. Sin embargo, la localización de
toda la información realmente relevante acerca de un tema concreto
sigue siendo una labor lenta y tediosa. La aparición de los buscadores
(sistemas que intentan localizar los documentos que en un momento dado
son de nuestro interés) ha facilitado dicha tarea; sin embargo,
los resultados hasta la fecha no son lo suficientemente satisfactorios
y sólo facilitan en pocos aspectos la búsqueda de la información.
Es por ello que se pretende construir un sistema de recuperación
de información de sedes Web. Como recuperación de información
se entiende la capacidad de seleccionar de entre una gran cantidad de documentos
aquellos cuyo contenido hacen referencia a un tema indicado.
Objetivos
-
Conocer el funcionamiento de los buscadores de información.
-
Mejorar su funcionamiento: precisión y calidad de los resultados
devueltos.
-
Aplicar técnicas de procesamiento del lenguaje natural a estos buscadores.
-
Permitir búsquedas sobre preguntas concretas escritas en lenguaje
natural, y no únicamente limitarnos a búsquedas por palabras
clave.
-
Ir un paso más allá de lo que realizan los buscadores tradicionales,
para ello, contestar a las preguntas del usuario. Es decir, en lugar de
devolver el documento completo, devolver la zona del texto donde se encuentra
la información requerida. Este proceso se denomina Question Answering
o
Búsqueda de Respuestas dentro del campo de estudio de la
Lingüística Computacional.
-
Introducir las técnicas que permiten añadir una capacidad
de trabajo multilingüe a los buscadores.
Programa
-
Introducción.
-
Sistemas de búsqueda de información (Information Retrieval).
Estado del arte.
-
Incorporación de técnicas de lenguaje natural a los buscadores
de información.
-
Sistemas de búsqueda de respuesta (Question Answering).
-
Recuperación de información multilingüe (Cross Language
Information Retrieval).
El curso tendrá una base teórica que se pondrá en
práctica sobre diferentes sistemas de recuperación de información.
Se trabajará sobre textos principalmente en inglés aunque
se estudiará su aplicación sobre el español.
Materiales
Bibliografía
Enlaces de interés
Prototipos de Sistemas de Recuperación de Información
-
ExtrAns
-
ITEM
Recuperación de Información Textual en un Entorno Multilíngüe
con Técnicas de Lenguaje Natural
-
ITEM
Search Engine (Demo)
-
MULINEX:
Demonstrator: multilingual search engine
-
Natural
Language Information Retrieval: electric knowledge
-
Xerox
SPARKLE Cross Language information Retrieval
Cursos sobre Recuperación de Información y Conferencias Internacionales
-
Cross-Language
Evaluation Forum (CLEF)
-
INFORMATION
RETRIEVAL BOOK: C. J. van RIJSBERGEN
-
IR
& NLP Course
-
Text
REtrieval Conference (TREC) Tracks
-
Text
REtrieval Conference (TREC) Home Page
Herramientas a utilizar a lo largo del curso:
Analizadores morfológicos
-
ARIES
Natural Language Tools
-
Multext
tools
-
PC-KIMMO
tagger/análisis morfológico
-
Universidad
de Las Palmas de Gran Canaria
-
Maco
analizador morfológico español y análisis sintáctico
(UPC)
Diccionarios
-
Dictionaries:
A Web of On-line
-
Dictionary
List
Etiquetadores (Part-of-Speech o POS taggers)
-
Brill's
English POS Tagger
-
MBT
POS Tagger Demo: Dutch English Spanish Swedish Slovene
-
POS
tagger español SpaCG-2 (by Conexor)
-
POS
tagger Conexor's English
-
STEMMER
de Porter
-
STEMMER
de Porter: CODE in C
Análisis semántico
-
MIKROKOSMOS
-
Euro
WordNet Descripción proyecto
-
EuroWordnet
Interface 0.1 (by LSI-UPC)
-
WordNet
Análisis sintáctico
-
Base
de Datos Sintácticos del Español Actual
-
Clause
Splitting Concurso
-
LFG:
Grammar Writer's Workbench for Lexical Functional Grammar
-
Link
Grammar
-
Memory-Based
Shallow Parser Demo
-
PATRII
grammars
Acceso a Bases de Datos en lenguaje natural
-
Microsoft
BackOffice - Expedia Hotel English Query Demo
Corpus
-
Download
the ICE-GB Sample Corpus (inglés)
-
Recursos
de Corpus en Español
Cursos de Procesamiento del Lenguaje Natural y de Prolog
-
Natural
Language Processing (Alison Cawsey)
-
Prolog
course (Basics) by Alison Cawsey
-
Prolog:
A Short Tutorial
-
Prolog
Programming A First Course: EXTENSO
Glosario Lingüístico
-
Ciber-Lexico
Comparativo
-
Computer,
Telephony and Electronics Glossary and Dictionary
-
Babylon.com
Information @ a click
-
Glosario
lingüístico electrónico
-
Glosario
inglés
-
Glosario
de Internet (ATI)
-
Vocabulario
ordenadores e Internet
Gramáticas y analizadores o parsers
-
HPSG
Literature
-
Link
Grammar
-
Link
Grammar Demo
-
Natural
Language Computing: An English Grammar in Prolog
-
TACAT
(Jordi Atserias Batalla's) (TAgged Corpus Analizer Tool)
Extracción de Información
-
Highlight
Information Extraction Demo
Traducción automática
-
Alis
(anglés, francés, alemany, espanyol, italià, rus,
japonés, xinés tradicional, xinés simplificat)
-
AltaVista
Translations (babelfish)
-
Amikai
(anglés, francés, espanyol, alemany, japonés, xinñes,
portugués, italià coreà)
-
Automatictrans
(castellà, català, portugués)
-
Babylon
Translator Dictionary Converter and Information at your fingertips!
-
Dictionary.com/Translate
-
elingo
(anglés, espanyol,http://www.alis.com/translate_online.html alemany,
italià, portugués, francés, japonés,
-
FreeTranslation.com
- Free Translation from English to Spanish, French, German, Portuguese,
Italian, and Norwegian
-
IBM
(anglés, francés, italià, japonés, espanyol,
xinés simplificat, xinés tradicional)
-
interNOSTRUM
(Míkel)
-
INTER
TRAN EMPRESA - Translation Experts (natural language translation software)
-
InterTran
(tm) - translate between 729 language pairs!
-
Introducción
MT
-
L&H
Lernout & Hauspie (anglés, francés, alemany, espanyol,
italià, portugués)
-
MINDS:
English, Japanese, Russian, Spanish Summarizer-Translator
-
Polish-English-Polish
Translator and online Polish Dictionary.
-
Reverso
translate (anglés, alemany, francés, espanyol, rus)
-
SAIL
LABS - Innovation in Understanding (castellà, català):
-
Sancho
-- Automatic translation of Spanish web pages into English
-
Spanish
to English Translation (Curso IR de la UNED)
-
Survey
of Machine Translation products and services
-
Transcend
Main
-
WebTranSmart
Machine Translation Service (finés, anglés)
-
WinBabel.Com
Updated in June 2001