• česky
  • english

7E11051 - EuroMatrixPlus - Enlarged European Union Bringing Machine Translation for European Languages to the User (2011-2012, MSM/7E)

Údaje o projektu
Identifikační kód7E11051
Důvěrnost údajůS - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
Název v původním jazyceEuroMatrixPlus - Enlarged European Union Bringing Machine Translation for European Languages to the User
PoskytovatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Program7E - Podpora projektů sedmého rámcového programu Evropského společenství pro výzkum, technologický rozvoj a demonstrace (2007 až 2013) podle zákona č. 171/2007 Sb. (2007-2019)
Kategorie VaVZV - Základní výzkum
Hlavní oborAI - Jazykověda
Vedlejší oborIN - Informatika
Zahájení řešení1.1.2011
Ukončení řešení30.4.2012
Datum posledního uvolnění účelové podpory22.7.2011
Číslo smlouvy13595/2011 – 321
Poslední stav řešeníK - Končící víceletý projekt, tj. projekt, který byl řešen již v předcházejícím roce, příslušný rok sběru dat je posledním rokem účinnosti smlouvy resp. vykonatelnosti rozhodnutí o poskytnutí podpory
Finance projektu
Období20112012celkem
Výše podpory ze státního rozpočtu510 tis. Kč170 tis. Kč680 tis. Kč
Celkové uznané náklady510 tis. Kč170 tis. Kč680 tis. Kč
Typskutečně čerpanépřidělené
Druh soutěžeRP - Spolufinancování programu ES
Výzva Rámcového programuFP7-ICT-2009-5
Cíle řešení v původním jazyceThe recent extensions of the European Union have drastically increased the need for translingual technologies that help to overcome language boundaries by supporting human translation. The project EuroMatrixPlus addresses this need by systematically investigating novel methods for automatic translation among EU languages and by bringing the new technologies to the users. EuroMatrixPlus was able to provide MT systems for 462 translation directions, to make important steps towards improving the quality of these systems via novel learning approaches and learning from feedback from users, and to establish exchange and cooperation with users of MT technology on a broad scale. In the process of developing and testing these 462 systems it became obvious that progress in performance for automatic translation of Slavic languages is seriously hampered by problems that are not sufficiently covered by ongoing MT research, including richer morphologies and higher degrees of word order freedom. So far only one Slavic language, Czech, is receiving special attention in the research setup of EuroMatrixPlus. No other Slavic languages are covered by the expertise available in the consortium, despite the important role of this language family in the European multilingual society. EuroMatrixPlus-X will provide expertise and interest in MT for two additional Slavic languages – Slovak and Bulgarian, valuable resources for processing these languages and the motivation and competence to strengthen research in approaches that have turned out to be especially promising, in particular the exploitation of linguistic tools and deeply annotated corpora for MT and the automatic translation among closely related languages, such as Czech and Slovak. The research will also study methods of using the translation between Czech and Slovak for improving the translation between Slovak and English.
Klíčová slova v anglickém jazyceMachine Translation, Language Reources, Hybrid Approaches, Slavic Languages, Computational Linguistics, Natural Language Processing
Rok dodání údajů do CEP2012
Systémové označení dodávky datCEP12-MSM-7E-R/03:3
Datum dodání záznamu27.11.2012
Účastníci projektu
Počet příjemců1
Počet dalších účastníků projektu0
Příjemce / Organizační jednotka garantující řešeníUniverzita Karlova v Praze / Matematicko-fyzikální fakulta
ŘešitelRNDr. Ondřej Bojar, Ph.D. (státní příslušnost: CZ - Česká republika; tel.: 221914276)
Finance účastníků projektu
Poznámka: Finance účastníků projektu jsou sledovány od roku 2007
Výše podpory ze státního rozpočtu
Účastník20112012
Univerzita Karlova v Praze / Matematicko-fyzikální fakulta510 tis. Kč170 tis. Kč
Celkové uznané náklady
Účastník20112012
Univerzita Karlova v Praze / Matematicko-fyzikální fakulta510 tis. Kč170 tis. Kč
Výsledky projektu v RIV
Počet výsledků v RIV9
Výsledek druhu DRIV/00216208:11320/12:10130026 - Automatic MT Error Analysis: Hjerson Helping Addicter (2012)
Výsledek druhu RRIV/00216208:11320/12:10132443 - eman (2012)
Výsledek druhu DRIV/00216208:11320/12:10130044 - Improving SMT by Using Parallel Data of a Closely Related Language (2012)
Výsledek druhu DRIV/00216208:11320/12:10130029 - The Joy of Parallelism with CzEng 1.0 (2012)
Výsledek druhu DRIV/00216208:11320/12:10130027 - Probes in a Taxonomy of Factored Phrase-Based Models (2012)
Výsledek druhu DRIV/00216208:11320/12:10130100 - Selecting Data for English-to-Czech Machine Translation (2012)
Výsledek druhu DRIV/00216208:11320/12:10130041 - Terra: a Collection of Translation Error-Annotated Corpora (2012)
Výsledek druhu DRIV/00216208:11320/12:10130028 - Towards a Predicate-Argument Evaluation for MT (2012)
Výsledek druhu RRIV/00216208:11320/11:10109513 - Prague Czech-English Dependency Treebank 2.0 (2011)