Projects running in 2016

Projects at University of Hildesheim

  • Computational linguistic control and enhancement of the linguistic quality of requirements (08/2014 - 11/2016), in cooperation with Daimler AG, RD/EIT.
  • e-Identity (05/2012 -- 04/2015)
    Cooperation with Prof. Dr. Cathleen Kantner (Univ. of Stuttgart, Political Sciences, Coordinator), Prof. Dr. Jonas Kuhn (Univ. of Stuttgart, IMS) and Prof. Dr. Manfred Stede (Univ. of Potsdam): Using computational linguistic techniques to support political scientists in text interpretation
  • SeLA, Scientific e-Lexicography for Africa, (06/2012 -- 05/2015)
    Cooperation with University of South Africa, University of Pretoria, University of Stellenbosch and University of Namibia, on methods for the preparation of electronic dictionaries.
  • Vergleich von maschineller und manueller Termextraktion
    (cooperation with an industrial partner) (2011-2013)
  • New electronic versions of the Dictionary of South African English (04/2015-12/2015), on turning a historical-scholarly dictionary into a data collection for multiple selective queries.

Selected past projects: lexicons, corpora, morphology

  • Speaker function in the workgroup NA-105-AA-06 of DIN(German Standard Institute), on standards for language resources (mirror committee of ISO TC 37 SC 4).
  • Collocations en Contexte, 03/2006 - 02/2008, partly financed by AUF, Agence Universitaire pour la Francophonie, coord. Prof. Amalia Todirascu (Univ. of Strasbourg)
  • DFG- Transferbereich TFB-32: Automatische Exzerption:Tools and methods for building and upgrading dictionaries on the basis of text corpora (10/2001 - 10/2003)
  • DECIDE (Designing and Evaluating Extraction Tools for Collocations in Dictionaries and Corpora,
    EU MLAP 93/19, 1994 - 1996)
  • DeKo (Deutsche Derivations- und Kompositionsmorphologie) (1999 - 2001, Linguistic work towards a German computational morphology system for inflection, derivation and compounding, based on the SFST system developed by Helmut Schmid )
  • TextCorpora and tools for their exploration Project on corpus processing techniques which produced, among others, the corpus query tool IMS CorpusWorkbench, CWB
  • DELIS (Descriptive Lexical Specifications and Tools for corpus-based Lexicon Building,
    EU LRE 61.034, coordinator)
  • Several application-oriented projects with publishing houses from Germany, Denmark and the Netherlands, concerning the extraction of lexicographically relevant linguistic data (collocations, examples, subcategorization data, etc.) from text corpora

Selected past projects: dialogue systems

Selected past projects: infrastructure and standardization

  • D-SPIN: Deutsche Sprachressourcen-Infrastruktur (09/2008 - 03/2011, coordinated by Prof. Dr. E.Hinrichs , University of Tuebingen, local responsables at IMS: Prof. Dr. H.Schuetze, PD Dr. H. Schmid, U. Heid)
  • EAGLES (Expert Advisory Group on Linguistic Engineering Standards)
  • ISLE - International Standards for Language Engineering
  • ELSNET (European Network of Excellence in Speech and Natural Language Processing - Managing Node for Germany)
  • Eurotra-7 Study on Reusable Lexical and Terminological Resources for NLP (coordinator)
  • RELATOR (A European Network of Repositories for Linguistic Resources, EU LRE 62.056)

Eingeladene Vorträge: 


  • 01/07/2014: Potchefstroom; Südafrika:
    Eingeladener Hauptvortrag bei der AfriLex-Jahrestagung 2014,
  • 16/07/2014: Bozen, Italien:
    Eingeladener Hauptvortrag bei der EURALEX-Tagung 2014


  • 12/02/2012: Hildesheim:
    Eingeladener Vortrag für die Regionalgruppe Südniedersachsen der tekom - Verein für Technische Kommunikation:
    Monolonguale und bilinguale Termextraktion (mit A. Ramm und G. Schaper)
  • 06/03/2013: Stellenbosch, Südafrika:
    Eingeladener Vortrag im Oberseminar der Abteilung Afrikaans und Nederlands:
    Multiword expressions in technical and terminology translation
  • 14/11/2013: Aarhus, Dänemark:
    Towards usability design for electronic dictionaries,
    Symposium (auf Einladung) zu elektronischen Wörterbüchern der Betriebswirtschaft
  • 21/11/2013: Mannheim, DFG-Netzwerk Internet-Lexikographie: t.b.a.


  • 29/09/2012: Modena:
    Vortrag zur Kollokationsextraktion, im Rahmen der Giornata Europea delle Lingue, Universität Modena
  • 11/10/2012: Saarbrücken:
    Terminologieextraktion und Termalignment, Universität des Saarlandes


  • 21/01/2011: Heidelberg:
    Gastvortrag am Institut für Übersetzen und Dolmentschen der Universität Heidelberg:
    Extraktion von Fachterminologie aus Texten
  • 21/02/2011: Genf:
    Extraction de données terminologiques à partir de corpus électroniques, ETI, Université de Genève
  • 03/05 bis 06/05/2011: Maribor, Slowenien:
    Blockkurs Computational Lexicography im Rahmen des Lehrprogramms des European Master in Lexicography, (EN)
  • 10/05/2011: Hildesheim:
    Forschungskolloquium der Fakultät III der Universität Hildesheim:
    Extraktion von Fachterminologie und Fachphraseologie aus Texten
  • 03/06/2011: Erlangen:
    Kolloquium des Erlanger Zentrums für Lexikographie, Valenz- und Kollokationsforschung:
    Interaktion zwischen lexikalischen Daten und Korpusdaten in elektronischen Wörterbüchern
  • 08/07/2011: Erlangen:
    Morphosyntaktische Eigenschaften von Nomen + Verb-Kollokationen, Germanistik, Universität Erlangen
  • 27/07/2011: Mannheim:
    Institutskolloquium des IdS, Institut für deutsche Sprache:
    Usability Tests für elektronische Wörterbücher - Methoden und erste Ergebnisse
  • 26/09/2011: Hamburg:
    Nachhaltigkeit von Sprachressourcen - Workshop im Rahmen der GDCL-Tagung 2011
  • 07/10/2011: Hildesheim:
    Korpusmethoden für die kontrastive und übersetzungswissenschaftliche Forschung, eingeladenes Seminar im Doktorandenkolloquium des Instituts für Übersetzungswissenschaft und Fachkommunikation der Universität Hildesheim


  • 10/03/2010: Mannheim:
    Jahrestagung des Instituts für deutsche Sprache:
    Kollokationen im Deutschen von Deutschland, Österreich, der Schweiz und Südtirol
  • 22/04/2010: Universität Valladolid, Spanien:
    Symposium über elektronische Wörterbücher (auf Englisch):
    Computerlinguistische Verfahren für Datenbankbeschaffung, Repräsentation und Usability elektronischer Wörterbücher
  • 31/08/2010: Bad Homburg v.d.H.:
    D-SPIN-Sommerschule eHumanities und Sprachressourcen:
    Kurs zur Extraktion von Mehrwortausdrücken aus Texten (mit Dipl.-Ling. Fabienne Fritzinger)
  • 25/10/2010: Universität Maribor, Slovenien:
    Internationales Lexikographie-Symposium:
    Elektronische Fachwörterbücher


  • 16/01/2009: Karlsuniversität Prag, Zentrum für das Tschechische Nationalkorpus:
    Capita Selecta
    Extraktion von Mehrwortausdrücken aus deutschen Texten (auf Englisch)
  • 14/03/2009: Université de Strasbourg:
    Séminaire de l'école doctorale en TALN
    Extraktion syntaktischer Daten aus Texten: Methoden und Ergebnisdaten (auf Französisch)
  • 27/04/2009: Universität Gießen:
    Juristische Fachphraseologie
  • 28/05/2009: Institut voor Nederlandse Lexicologie, Leiden, Capita Selecta:
    Mehrwortausdrücke als computerlexikographisches Problem (auf Englisch)
  • 23/10/2009: Universität Louvain-La-Neuve, Belgien:
    International Symposium eLexicography: Deskription und Präsentation für Elektronische Wörterbücher - Beispielfall Mehrwortausdrücke (eingeladener Plenarvortrag, auf Englisch)
  • 19/11/2009: Universität Leipzig:
    Workshop des EU-Projekts CLARIN:
    Das D-SPIN-Text-Korpus-Format TCF und sein Verhältnis zu internationalen Normen (auf Englisch)


  • 28/03/2008: Brixen (Südtirol, Italien):
    Kollokationsvarietäten in Südtirol und Österreich (Kolloquium zur Nutzung von Varietätenkorpora)
  • 10/07/2008: Darmstadt:
    Pipelines bei der korpusbasierten Datenextraktion (auf Englisch)
    (Workshop zu Processing Pipelines in der Sprachverarbeitung)
  • 30/07 bis 01/08/2008: München:
    Blockseminar Fachsprachliche Phraseologie, SDI, Hochschule für Sprachen, München
  • 03/09/2008: Hagen:
    Semantik und Lexikon
    Festvortrag beim Kolloquium zur Emeritierung von Prof. Dr. Hermann Helbig
