Curso de doctorado (4 créditos):

APLICACIONES DE LA INFORMÁTICA

Código de programa:  5099
Dpto. coordinador:  Lenguajes y Sistemas Informáticos

"Búsquedas inteligentes de información en la web"

 
 
 
 

Profesor

Antonio Ferrández Rodríguez
 
 
 
 

Breve descripción

La popularización del uso de Internet ha posibilitado la existencia de enormes cantidades de información y la ha puesto al alcance de cualquier usuario de este medio. Sin embargo, la localización de toda la información realmente relevante acerca de un tema concreto sigue siendo una labor lenta y tediosa. La aparición de los buscadores (sistemas que intentan localizar los documentos que en un momento dado son de nuestro interés) ha facilitado dicha tarea; sin embargo, los resultados hasta la fecha no son lo suficientemente satisfactorios y sólo facilitan en pocos aspectos la búsqueda de la información. Es por ello que se pretende construir un sistema de recuperación de información de sedes Web. Como recuperación de información se entiende la capacidad de seleccionar de entre una gran cantidad de documentos aquellos cuyo contenido hacen referencia a un tema indicado.

Objetivos

Programa
  1. Introducción.
  2. Sistemas de búsqueda de información (Information Retrieval). Estado del arte.
  3. Incorporación de técnicas de lenguaje natural a los buscadores de información.
  4. Sistemas de búsqueda de respuesta (Question Answering).
  5. Recuperación de información multilingüe (Cross Language Information Retrieval).
El curso tendrá una base teórica que se pondrá en práctica sobre diferentes sistemas de recuperación de información. Se trabajará sobre textos principalmente en inglés aunque se estudiará su aplicación sobre el español.
 


Materiales

Bibliografía

Enlaces de interés

Prototipos de Sistemas de Recuperación de Información

ExtrAns
ITEM Recuperación de Información Textual en un Entorno Multilíngüe con Técnicas de Lenguaje Natural
ITEM Search Engine (Demo)
MULINEX: Demonstrator: multilingual search engine
Natural Language Information Retrieval: electric knowledge
Xerox SPARKLE Cross Language information Retrieval

Cursos sobre Recuperación de Información y Conferencias Internacionales

Cross-Language Evaluation Forum (CLEF)
INFORMATION RETRIEVAL BOOK: C. J. van RIJSBERGEN
IR & NLP Course
Text REtrieval Conference (TREC) Tracks
Text REtrieval Conference (TREC) Home Page

Herramientas a utilizar a lo largo del curso:

Analizadores morfológicos

ARIES Natural Language Tools
Multext tools
PC-KIMMO tagger/análisis morfológico
Universidad de Las Palmas de Gran Canaria
Maco analizador morfológico español y análisis sintáctico (UPC)

Diccionarios

Dictionaries: A Web of On-line
Dictionary List

Etiquetadores (Part-of-Speech o POS taggers)

Brill's English POS Tagger
MBT POS Tagger Demo: Dutch English Spanish Swedish Slovene
POS tagger español SpaCG-2 (by Conexor)
POS tagger Conexor's English
STEMMER de Porter
STEMMER de Porter: CODE in C

Análisis semántico

MIKROKOSMOS
Euro WordNet Descripción proyecto
EuroWordnet Interface 0.1 (by LSI-UPC)
WordNet

Análisis sintáctico

Base de Datos Sintácticos del Español Actual
Clause Splitting Concurso
LFG: Grammar Writer's Workbench for Lexical Functional Grammar
Link Grammar
Memory-Based Shallow Parser Demo
PATRII grammars

Acceso a Bases de Datos en lenguaje natural

Microsoft BackOffice - Expedia Hotel English Query Demo

Corpus

Download the ICE-GB Sample Corpus (inglés)
Recursos de Corpus en Español

Cursos de Procesamiento del Lenguaje Natural y de Prolog

Natural Language Processing (Alison Cawsey)
Prolog course (Basics) by Alison Cawsey
Prolog: A Short Tutorial
Prolog Programming A First Course: EXTENSO

Glosario Lingüístico

Ciber-Lexico Comparativo
Computer, Telephony and Electronics Glossary and Dictionary
Babylon.com Information @ a click
Glosario lingüístico electrónico
Glosario inglés
Glosario de Internet (ATI)
Vocabulario ordenadores e Internet

Gramáticas y analizadores o parsers

HPSG Literature
Link Grammar
Link Grammar Demo
Natural Language Computing: An English Grammar in Prolog
TACAT (Jordi Atserias Batalla's) (TAgged Corpus Analizer Tool)

Extracción de Información

Highlight Information Extraction Demo

Traducción automática

Alis (anglés, francés, alemany, espanyol, italià, rus, japonés, xinés tradicional, xinés simplificat)
AltaVista Translations (babelfish)
Amikai (anglés, francés, espanyol, alemany, japonés, xinñes, portugués, italià coreà)
Automatictrans (castellà, català, portugués)
Babylon Translator Dictionary Converter and Information at your fingertips!
Dictionary.com/Translate
elingo (anglés, espanyol,http://www.alis.com/translate_online.html alemany, italià, portugués, francés, japonés,
FreeTranslation.com - Free Translation from English to Spanish, French, German, Portuguese, Italian, and Norwegian
IBM (anglés, francés, italià, japonés, espanyol, xinés simplificat, xinés tradicional)
interNOSTRUM (Míkel)
INTER TRAN EMPRESA - Translation Experts (natural language translation software)
InterTran (tm) - translate between 729 language pairs!
Introducción MT
L&H Lernout & Hauspie (anglés, francés, alemany, espanyol, italià, portugués)
MINDS: English, Japanese, Russian, Spanish Summarizer-Translator
Polish-English-Polish Translator and online Polish Dictionary.
Reverso translate (anglés, alemany, francés, espanyol, rus)
SAIL LABS - Innovation in Understanding (castellà, català):
Sancho -- Automatic translation of Spanish web pages into English
Spanish to English Translation (Curso IR de la UNED)
Survey of Machine Translation products and services
Transcend Main
WebTranSmart Machine Translation Service (finés, anglés)
WinBabel.Com



Updated in June 2001