| | |
|---|
| Údaje o projektu |
| Identifikační kód | 7E11051 |
| Důvěrnost údajů | S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů |
| Název v původním jazyce | EuroMatrixPlus - Enlarged European Union Bringing Machine Translation for European Languages to the User |
| Poskytovatel | MSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT) |
| Program | 7E - Podpora projektů sedmého rámcového programu Evropského společenství pro výzkum, technologický rozvoj a demonstrace (2007 až 2013) podle zákona č. 171/2007 Sb. (2007-2019) |
| Kategorie VaV | ZV - Základní výzkum |
| Hlavní obor | AI - Jazykověda |
| Vedlejší obor | IN - Informatika |
| Zahájení řešení | 1.1.2011 |
| Ukončení řešení | 30.4.2012 |
| Datum posledního uvolnění účelové podpory | 22.7.2011 |
| Číslo smlouvy | 13595/2011 – 321 |
| Poslední stav řešení | K - Končící víceletý projekt, tj. projekt, který byl řešen již v předcházejícím roce, příslušný rok sběru dat je posledním rokem účinnosti smlouvy resp. vykonatelnosti rozhodnutí o poskytnutí podpory |
| Finance projektu | |
| Období | 2011 | 2012 | celkem |
|---|
| Výše podpory ze státního rozpočtu | 510 tis. Kč | 170 tis. Kč | 680 tis. Kč |
| Celkové uznané náklady | 510 tis. Kč | 170 tis. Kč | 680 tis. Kč |
| Typ | skutečně čerpané | přidělené |
|
| Druh soutěže | RP - Spolufinancování programu ES |
| Výzva Rámcového programu | FP7-ICT-2009-5 |
| Cíle řešení v původním jazyce | The recent extensions of the European Union have drastically increased the need for translingual technologies that help to overcome language boundaries by supporting human translation. The project EuroMatrixPlus addresses this need by systematically investigating novel methods for automatic translation among EU languages and by bringing the new technologies to the users. EuroMatrixPlus was able to provide MT systems for 462 translation directions, to make important steps towards improving the quality of these systems via novel learning approaches and learning from feedback from users, and to establish exchange and cooperation with users of MT technology on a broad scale. In the process of developing and testing these 462 systems it became obvious that progress in performance for automatic translation of Slavic languages is seriously hampered by problems that are not sufficiently covered by ongoing MT research, including richer morphologies and higher degrees of word order freedom. So far only one Slavic language, Czech, is receiving special attention in the research setup of EuroMatrixPlus. No other Slavic languages are covered by the expertise available in the consortium, despite the important role of this language family in the European multilingual society. EuroMatrixPlus-X will provide expertise and interest in MT for two additional Slavic languages – Slovak and Bulgarian, valuable resources for processing these languages and the motivation and competence to strengthen research in approaches that have turned out to be especially promising, in particular the exploitation of linguistic tools and deeply annotated corpora for MT and the automatic translation among closely related languages, such as Czech and Slovak. The research will also study methods of using the translation between Czech and Slovak for improving the translation between Slovak and English. |
| Klíčová slova v anglickém jazyce | Machine Translation, Language Reources, Hybrid Approaches, Slavic Languages, Computational Linguistics, Natural Language Processing |
| Rok dodání údajů do CEP | 2012 |
| Systémové označení dodávky dat | CEP12-MSM-7E-R/03:3 |
| Datum dodání záznamu | 27.11.2012 |
| Účastníci projektu |
| Počet příjemců | 1 |
| Počet dalších účastníků projektu | 0 |
| Příjemce / Organizační jednotka garantující řešení | Univerzita Karlova v Praze / Matematicko-fyzikální fakulta |
| Řešitel | RNDr. Ondřej Bojar, Ph.D. (státní příslušnost: CZ - Česká republika; tel.: 221914276) |
| Finance účastníků projektu |
| Poznámka: Finance účastníků projektu jsou sledovány od roku 2007 |
| Výše podpory ze státního rozpočtu | |
| Účastník | 2011 | 2012 |
|---|
| Univerzita Karlova v Praze / Matematicko-fyzikální fakulta | 510 tis. Kč | 170 tis. Kč |
|
| Celkové uznané náklady | |
| Účastník | 2011 | 2012 |
|---|
| Univerzita Karlova v Praze / Matematicko-fyzikální fakulta | 510 tis. Kč | 170 tis. Kč |
|
| Výsledky projektu v RIV |
| Počet výsledků v RIV | 9 |
| Výsledek druhu D | RIV/00216208:11320/12:10130026 - Automatic MT Error Analysis: Hjerson Helping Addicter (2012) |
| Výsledek druhu R | RIV/00216208:11320/12:10132443 - eman (2012) |
| Výsledek druhu D | RIV/00216208:11320/12:10130044 - Improving SMT by Using Parallel Data of a Closely Related Language (2012) |
| Výsledek druhu D | RIV/00216208:11320/12:10130029 - The Joy of Parallelism with CzEng 1.0 (2012) |
| Výsledek druhu D | RIV/00216208:11320/12:10130027 - Probes in a Taxonomy of Factored Phrase-Based Models (2012) |
| Výsledek druhu D | RIV/00216208:11320/12:10130100 - Selecting Data for English-to-Czech Machine Translation (2012) |
| Výsledek druhu D | RIV/00216208:11320/12:10130041 - Terra: a Collection of Translation Error-Annotated Corpora (2012) |
| Výsledek druhu D | RIV/00216208:11320/12:10130028 - Towards a Predicate-Argument Evaluation for MT (2012) |
| Výsledek druhu R | RIV/00216208:11320/11:10109513 - Prague Czech-English Dependency Treebank 2.0 (2011) |