• česky
  • english

LM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010-2015, MSM/LM)

Údaje o projektu
Identifikační kódLM2010013
Důvěrnost údajůS - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
Název v původním jazyceLINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat
PoskytovatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
ProgramLM - Projekty velkých infrastruktur pro VaVaI (2010-2017)
Kategorie VaVIF - Infrastruktura výzkumu a vývoje
Hlavní oborAI - Jazykověda
Vedlejší oborIN - Informatika
Zahájení řešení1.1.2010
Ukončení řešení31.12.2015
Datum posledního uvolnění účelové podpory30.4.2014
Číslo smlouvy23754/2010-320
Poslední stav řešeníK - Končící víceletý projekt, tj. projekt, který byl řešen již v předcházejícím roce, příslušný rok sběru dat je posledním rokem účinnosti smlouvy resp. vykonatelnosti rozhodnutí o poskytnutí podpory
Finance projektu
Období201020112012201320142015celkem
Výše podpory ze státního rozpočtu14 893 tis. Kč19 931 tis. Kč19 809 tis. Kč21 496 tis. Kč22 387 tis. Kč22 388 tis. Kč120 904 tis. Kč
Celkové uznané náklady14 893 tis. Kč19 931 tis. Kč19 809 tis. Kč21 496 tis. Kč22 387 tis. Kč22 388 tis. Kč120 904 tis. Kč
Typskutečně čerpanéskutečně čerpanéskutečně čerpanéskutečně čerpanéskutečně čerpanépřidělené
Cíle řešení v původním jazyceProjekt LINDAT-CLARIN je koncipován jako český uzel mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure, FP7-RI-2122230) a projektu META-NET (Technologies for the Multilingual European Information Society, NoE, 2011-2014, FP7-ICT-4-249119) pro volné sdílení jazykových dat a pokročilých technologií mezi institucemi a jednotlivci ve vědě a výzkumu. Tyto evropské projekty mají za cíl překážky volného přístupu k jazykovým datům postupně odstranit a umožnit národně distribuované, ale technologicky jednotné poskytování jazykových dat a souvisejících technologií všem zájemcům. V oblasti anotace dat je cílem projektu pořídit tato data v dostatečném rozsahu pro praktickou aplikaci statistického modelování jazyka jako nutnou podmínku pro aplikaci těchto modelů v praxi (korektory textu, automatický překlad, extrakce informací z textu, porozumění textu, dialogové systémy apod.). V oblasti distribuce dat je cílem poskytovat službu repozitáře pro úschovu, licencování a poskytování dat v rámci celoevropské sítě Clarin a META-SHARE (součást projektu META-NET). V oblasti technologické i v oblasti lidských zdrojů je cílem vybudování know-how v oblasti sběru, úschovy, tvorby a distribuce dat, které bude možno poskytovat i externím subjektům. Přitom je třeba vyškolit jazykové odborníky i odborníky z oblasti technologií (informatika, statistika, matematické modelování) tak, aby byli schopni v tomto výrazné mezioborovém projektu efektivně pracovat. Nezanedbatelným cílem projektu je vychovat další vědeckou generaci, která bude umět s jazykovými daty pracovat, správně je analyzovat a používat v národním i mezinárodním kontextu, a spolupracovat v rámci EU i mimo ni na budoucích projektech využívajících moderní jazykové technologie.
Klíčová slova v anglickém jazycelanguage resources; langauge databases; public access to scientific data; langauge corpora; machine translation; natural language processing; computational linguistics
Rok dodání údajů do CEP2015
Systémové označení dodávky datCEP15-MSM-LM-R/02:2
Datum dodání záznamu16.7.2015
Účastníci projektu
Počet příjemců2
Počet dalších účastníků projektu2
Koordinující příjemce / Organizační jednotka garantující řešeníUniverzita Karlova v Praze / Matematicko-fyzikální fakulta
ŘešitelProf. RNDr. Jan Hajič, Dr. (státní příslušnost: CZ - Česká republika; vedidk: 9997180)
Příjemce / Organizační jednotka garantující řešeníMasarykova univerzita / Fakulta informatiky
Řešiteldoc. PhDr. Karel Pala, CSc. (státní příslušnost: CZ - Česká republika; vedidk: 6076939)
Další účastník projektuÚstav pro jazyk český AV ČR, v. v. i.
Řešiteldoc. RNDr. Karel Oliva, Ph.D. (státní příslušnost: CZ - Česká republika; vedidk: 8027854)
Další účastník projektu / Organizační jednotka garantující řešeníZápadočeská univerzita v Plzni / Fakulta aplikovaných věd
Řešitelprof. Ing. Josef Psutka, CSc. (státní příslušnost: CZ - Česká republika; vedidk: 4396855)
Finance účastníků projektu
Poznámka: Finance účastníků projektu jsou sledovány od roku 2007, investiční prostředky od roku 2013
Celkové uznané náklady
Účastník201020112012201320142015
Univerzita Karlova v Praze / Matematicko-fyzikální fakulta9 940 tis. Kč13 949 tis. Kč13 971 tis. Kč14 058 tis. Kč14 949 tis. Kč14 950 tis. Kč
Masarykova univerzita / Fakulta informatiky1 647 tis. Kč1 994 tis. Kč1 946 tis. Kč2 646 tis. Kč2 646 tis. Kč2 646 tis. Kč
Ústav pro jazyk český AV ČR, v. v. i.1 635 tis. Kč1 994 tis. Kč1 946 tis. Kč2 846 tis. Kč2 846 tis. Kč2 846 tis. Kč
Západočeská univerzita v Plzni / Fakulta aplikovaných věd1 671 tis. Kč1 994 tis. Kč1 946 tis. Kč1 946 tis. Kč1 946 tis. Kč1 946 tis. Kč
Výše podpory ze státního rozpočtu
Účastník201020112012201320142015
Univerzita Karlova v Praze / Matematicko-fyzikální fakulta9 940 tis. Kč13 949 tis. Kč13 971 tis. Kč14 058 tis. Kč14 949 tis. Kč14 950 tis. Kč
Masarykova univerzita / Fakulta informatiky1 647 tis. Kč1 994 tis. Kč1 946 tis. Kč2 646 tis. Kč2 646 tis. Kč2 646 tis. Kč
Ústav pro jazyk český AV ČR, v. v. i.1 635 tis. Kč1 994 tis. Kč1 946 tis. Kč2 846 tis. Kč2 846 tis. Kč2 846 tis. Kč
Západočeská univerzita v Plzni / Fakulta aplikovaných věd1 671 tis. Kč1 994 tis. Kč1 946 tis. Kč1 946 tis. Kč1 946 tis. Kč1 946 tis. Kč
Investiční prostředky z podpory ze státního rozpočtu na účastníka v daném roce
Účastník201320142015
Univerzita Karlova v Praze / Matematicko-fyzikální fakulta0 tis. Kč0 tis. Kč
Masarykova univerzita / Fakulta informatiky0 tis. Kč0 tis. Kč
Ústav pro jazyk český AV ČR, v. v. i.0 tis. Kč0 tis. Kč
Západočeská univerzita v Plzni / Fakulta aplikovaných věd0 tis. Kč0 tis. Kč
Výsledky projektu v RIV
Očekávané výsledky projektu
O - Ostatní výsledky nezařaditelné do žádného z výše uvedených druhů výsledku1
Počet výsledků v RIV219
Výsledek druhu DRIV/00216208:11320/14:10289387 - A Comparison of MT Methods for Closely Related Languages: a Case Study on Czech - Slovak Language Pair (2014)
Výsledek druhu DRIV/00216208:11320/14:10289380 - A Factored Discriminative Spoken Language Understanding for Spoken Dialogue Systems (2014)
Výsledek druhu DRIV/00216208:11320/14:10289378 - A Tagged Corpus and a Tagger for Urdu (2014)
Výsledek druhu RRIV/00216208:11320/14:10289548 - AdjDeriNet: Words Derived from Adjectives in Czech (2014)
Výsledek druhu DRIV/00216208:11320/14:10289381 - Alex: A Statistical Dialogue Systems Framework (2014)
Výsledek druhu DRIV/00216208:11320/14:10289369 - Alex: Bootstrapping a Spoken Dialogoue System for a New Domain by Real Users (2014)
Výsledek druhu JRIV/00216208:11320/14:10289230 - An Interplay between Valency Information and Reflexivity (2014)
Výsledek druhu DRIV/00216224:14330/14:00073212 - Annotation Game for Textual Entailment Evaluation (2014)
Výsledek druhu JRIV/00216224:14330/14:00073241 - arTenTen: Arabic Corpus and Word Sketches (2014)
Výsledek druhu DRIV/00216224:14330/14:00074831 - Automatic classification of patterns from the Pattern Dictionary of English Verbs (2014)
Výsledek druhu DRIV/00216208:11320/14:10289362 - Automatic Mapping Lexical Resources: A Lexical Unit as the Keystone (2014)
Výsledek druhu JRIV/00216208:11320/14:10289233 - Automatic Recognition of Clauses (2014)
Výsledek druhu DRIV/00216224:14330/14:00079490 - Building large corpora and tools for computer lexicography (2014)
Výsledek druhu DRIV/00216208:11320/14:10289418 - The Centre and Periphery of Discourse Connectives (2014)
Výsledek druhu BRIV/68378092:_____/14:00429411 - Český jazykový atlas 3 (2014)
Výsledek druhu BRIV/68378092:_____/14:00439849 - Český jazykový atlas 4 (2014)
Výsledek druhu DRIV/00216224:14330/14:00077506 - Character-based Language Model (2014)
Výsledek druhu JRIV/00216208:11320/14:10289225 - Charles Fillmore has passed away (2014)
Výsledek druhu DRIV/00216208:11320/14:10289423 - Comparing Czech and English AMRs (2014)
Výsledek druhu DRIV/00216208:11320/14:10289406 - Cross-lingual dependency transfer with harmonized Indian language treebanks (2014)
Výsledek druhu DRIV/00216208:11320/14:10289421 - CUNI in WMT14: Chimera Still Awaits Bellerophon (2014)
Výsledek druhu CRIV/00216208:11320/14:10289274 - Delimitation of information between grammatical rules and lexicon (2014)
Výsledek druhu RRIV/00216208:11320/14:10289542 - Depfix, Automatic Post-editing of SMT (2014)
Výsledek druhu RRIV/00216208:11320/14:10289549 - DeriNet: Lexical Network of Derivational Word-Formation Relations in Czech (2014)
Výsledek druhu DRIV/00216224:14330/14:00076326 - Disambiguating Verbs by Collocation: Corpus Lexicography meets Natural Language Processing (2014)
Výsledek druhu DRIV/00216208:11320/14:10289396 - Discourse Relations in the Prague Dependency Treebank 3.0 (2014)
Výsledek druhu RRIV/49777513:23520/14:43924574 - English TTS speech corpus of air traffic (pilot) messages - Serbian accent (2014)
Výsledek druhu RRIV/49777513:23520/14:43924573 - English TTS speech corpus of air traffic (pilot) messages - Taiwanese accent (2014)
Výsledek druhu DRIV/00216224:14330/14:00073227 - Extrinsic Corpus Evaluation with a Collocation Dictionary Task (2014)
Výsledek druhu RRIV/00216208:11320/14:10289544 - Fairytale child (2014)
Výsledek druhu DRIV/00216224:14330/14:00075387 - Finding Terms in Corpora for Many Languages with the Sketch Engine (2014)
Výsledek druhu DRIV/00216224:14330/14:00077515 - Finding the Best Name for a Set of Words Automatically (2014)
Výsledek druhu DRIV/49777513:23520/14:43922934 - First Experiments with Relevant Documents Selection for Blind Relevance Feedback in Spoken Document Retrieval (2014)
Výsledek druhu DRIV/00216208:11320/14:10289384 - Free English and Czech telephone speech corpus shared under the CC-BY-SA 3.0 license (2014)
Výsledek druhu DRIV/00216208:11320/14:10289405 - Genres in the Prague Discourse Treebank (2014)
Výsledek druhu DRIV/00216208:11320/14:10289389 - Gramatické závislosti vs. koordinace z pohledu redukční analýzy (2014)
Výsledek druhu JRIV/00216208:11320/14:10289245 - HamleDT: Harmonized Multi-Language Dependency Treebank (2014)
Výsledek druhu DRIV/00216208:11320/14:10289408 - HamleDT 2.0: Thirty Dependency Treebanks Stanfordized (2014)
Výsledek druhu DRIV/00216224:14330/14:00076251 - HindEnCorp – Hindi-English and Hindi-only Corpus for Machine Translation (2014)
Výsledek druhu DRIV/00216208:11320/14:10289360 - Improving Evaluation of English-Czech MT through Paraphrasing (2014)
Výsledek druhu DRIV/00216208:11320/14:10289394 - In-House: An Ensemble of Pre-Existing Off-the-Shelf Parsers (2014)
Výsledek druhu DRIV/00216208:11320/14:10289404 - Integration of an On-line Kaldi Speech Recogniser to the Alex Dialogue Systems Framework (2014)
Výsledek druhu DRIV/00216224:14330/14:00077518 - Intelligent Search and Replace for Czech Phrases (2014)
Výsledek druhu DRIV/49777513:23520/14:43922922 - Inter-Annotator Agreement on Spontaneous Czech Language (2014)
Výsledek druhu JRIV/00216208:11320/14:10289239 - K možnostem korpusového zpracování nadvětných jevů (2014)
Výsledek druhu BRIV/00216208:11320/14:10289264 - Lexikálně-sémantické konverze ve valenčním slovníku (2014)
Výsledek druhu DRIV/00216224:14330/14:00077512 - Low Inter-Annotator Agreement = An Ill-Defined Problem? (2014)
Výsledek druhu DRIV/00216208:11320/14:10289367 - Machine Translation of Medical Texts in the Khresmoi Project (2014)
Výsledek druhu DRIV/00216224:14330/14:00077521 - Mapping Czech and English Valency Lexicons: Preliminary Report (2014)
Výsledek druhu ARIV/68378092:_____/14:00439202 - Modul digitalizovaných mluvnic — charakteristiky 71 mluvnic, redakce k 10. 11. 2014 (2014)
Výsledek druhu RRIV/00216208:11320/14:10289545 - MSTperl parser (2014)
Výsledek druhu JRIV/00216208:11320/14:10289240 - Multilingual Dependency Parsing: Using Machine Translated Texts instead of Parallel Corpora (2014)
Výsledek druhu JRIV/00216208:11320/14:10289231 - Nominalizované struktury se dvěma aktanty ve formě bezpředložkového genitivu (2014)
Výsledek druhu DRIV/00216208:11320/14:10289430 - Not an Interlingua, But Close: Comparison of English AMRs to Chinese and Czech (2014)
Výsledek druhu BRIV/00216208:11320/14:10289266 - O slovosledu z komunikačního pohledu (2014)
Výsledek druhu DRIV/00216208:11320/14:10289427 - On Linguistic Structure of Evaluative Meaning (2014)
Výsledek druhu CRIV/00216208:11320/14:10289275 - On the word order of Actor and Patient in Czech (2014)
Výsledek druhu DRIV/00216224:14330/14:00077509 - One System to Solve Them All (2014)
Výsledek druhu DRIV/00216208:11320/14:10289420 - Open-Source Tools for Morphology, Lemmatization, POS Tagging and Named Entity Recognition (2014)
Výsledek druhu DRIV/00216224:14330/14:00077511 - Optimization of Regular Expression Evaluation within the Manatee Corpus Management System (2014)
Výsledek druhu DRIV/00216224:14330/14:00073936 - Paraphrase and Textual Entailment Generation (2014)
Výsledek druhu JRIV/00216224:14330/14:00073238 - Paraphrase and Textual Entailment Generation in Czech (2014)
Výsledek druhu DRIV/00216224:14330/14:00077608 - Partial Grammar Checking for Czech Using the SET Parser (2014)
Výsledek druhu JRIV/68378092:_____/14:00440878 - Přechylování příjmení v češtině jako případ jazykového managementu (2014)
Výsledek druhu JRIV/00216208:11320/14:10289232 - Preference v souvýskytu aktantů u českých substantiv mluvení (2014)
Výsledek druhu CRIV/00216224:14330/14:00075222 - PtTenTen: A corpus for Portuguese lexicography (2014)
Výsledek druhu DRIV/00216208:11320/14:10289382 - Reflexive Verbs in a Valency Lexicon: The Case of Czech Reflexive Morphemes (2014)
Výsledek druhu DRIV/00216208:11320/14:10289434 - Resources in Conflict: A Bilingual Valency Lexicon vs. a Bilingual Treebank vs. a Linguistic Theory (2014)
Výsledek druhu RRIV/00216208:11210/14:10292346 - ROMi 1.0 (2014)
Výsledek druhu JRIV/00216208:11320/14:10289235 - RU-EVAL-2014: EVALUATING ANAPHORA AND COREFERENCE RESOLUTION FOR RUSSIAN (2014)
Výsledek druhu DRIV/49777513:23520/14:43922926 - Score Normalization Methods Applied to Topic Identification (2014)
Výsledek druhu DRIV/00216208:11320/14:10289393 - Semantic Representation of Ellipsis in the Prague Dependency Treebanks (2014)
Výsledek druhu DRIV/00216208:11320/14:10289398 - SemEval 2014 Task 8: Broad-Coverage Semantic Dependency Parsing (2014)
Výsledek druhu DRIV/00216208:11320/14:10289375 - Sentence diagrams: their evaluation and combination (2014)
Výsledek druhu CRIV/00216208:11320/14:10289271 - Sentence Structure and Discourse Structure (Possible parallels) (2014)
Výsledek druhu DRIV/00216208:11320/14:10289428 - Sentiment Detection and Annotation in a Treebank (2014)
Výsledek druhu DRIV/00216224:14330/14:00077513 - SkELL: Web Interface for English Language Learning (2014)
Výsledek druhu DRIV/00216224:14330/14:00077519 - SQAD: Simple Question Answering Database (2014)
Výsledek druhu DRIV/00216224:14330/14:00077516 - Style Markers Based on Stop-word List (2014)
Výsledek druhu JRIV/00216208:11320/14:10289244 - Subjectivity Lexicon for Czech: Implementation and Improvements (2014)
Výsledek druhu RRIV/00216208:11320/14:10289543 - Terminal-based CoNLL-file viewer (2014)
Výsledek druhu DRIV/00216224:14330/14:00077514 - Text Tokenisation Using unitok (2014)
Výsledek druhu DRIV/00216208:11320/14:10289374 - Three dimensions of the so-called "interoperability" of annotation schemes (2014)
Výsledek druhu DRIV/00216208:11320/14:10289425 - To pay or to get paid: Enriching a Valency Lexicon with Diatheses (2014)
Výsledek druhu DRIV/00216224:14330/14:00077522 - Tools for Fast Morphological Analysis Based on Finite State Automata (2014)
Výsledek druhu DRIV/00216208:11320/14:10289435 - Tracing Sentiments: Syntactic and Semantic Features in a Subjectivity Lexicon (2014)
Výsledek druhu DRIV/00216208:11320/14:10289377 - Two-Step Machine Translation with Lattices (2014)
Výsledek druhu DRIV/00216208:11320/14:10289429 - ÚFAL: Using Hand-crafted Rules in Aspect Based Sentiment Analysis on Parsed Data (2014)
Výsledek druhu DRIV/00216208:11320/14:10289410 - Use of Coreference in Automatic Searching for Multiword Discourse Markers in the Prague Dependency Treebank (2014)
Výsledek druhu DRIV/00216208:11320/14:10289409 - Valency and Word Order in Czech - A Corpus Probe (2014)
Výsledek druhu JRIV/00216208:11320/14:10289234 - "VCHERA NASOCHINYALSYA VOROH STROK": PRODUCTIVE CIRCUMFIXAL INTENSIFYING PATTERNS IN RUSSIAN (2014)
Výsledek druhu ARIV/68378092:_____/14:00440656 - Vokabulář webový – webové hnízdo pramenů k poznání historické češtiny (2014)
Výsledek druhu RRIV/68378092:_____/14:00440660 - Vokabulář webový – webové hnízdo pramenů k poznání historické češtiny (2014)
Výsledek druhu RRIV/00216208:11320/14:10289539 - Vystadial 2013 - ASR training scripts (2014)
Výsledek druhu RRIV/00216208:11320/14:10289540 - Vystadial 2013 - Česká data (2014)
Výsledek druhu RRIV/00216208:11320/14:10289538 - Vystadial 2013 - English data (2014)
Výsledek druhu DRIV/00216208:11320/14:10289395 - What can linguists learn from some simple statistics on annotated treebanks (2014)
Výsledek druhu DRIV/00216208:11320/14:10289432 - Word-Formation Network for Czech (2014)
Výsledek druhu JRIV/00216208:11320/14:10289247 - Zjišťování slovotvorné produktivity z korpusových dat: přípony odvozující názvy vlastností (2014)
Výsledek druhu DRIV/00216208:11320/13:10194657 - A Case Study of a Free Word Order (2013)
Výsledek druhu DRIV/00216208:11320/13:10194679 - A New State-of-The-Art Czech Named Entity Recognizer (2013)
Výsledek druhu DRIV/00216224:14330/13:00070350 - Acquiring Data for Textual Entailment Recognition (2013)
Výsledek druhu RRIV/49777513:23520/13:43921013 - Audiovizuální korpus z Mistrovství světa v ledním hokeji 2011 (2013)
Výsledek druhu DRIV/00216208:11320/13:10194656 - Automatic Processing of Linguistic Data as a Feedback for Linguistic Theory (2013)
Výsledek druhu DRIV/00216208:11320/13:10194676 - Coordination Structures in Dependency Treebanks (2013)
Výsledek druhu DRIV/00216208:11320/13:10194647 - Corpus Based Identification of Czech Light Verbs (2013)
Výsledek druhu RRIV/00216208:11320/13:10194844 - Czech Named Entity Corpus, version 2.0 (2013)
Výsledek druhu DRIV/00216208:11320/13:10194685 - Czech Subjectivity Lexicon: A Lexical Resource for Czech Polarity Classification (2013)
Výsledek druhu RRIV/00216208:11320/13:10194847 - Czech SubLex 1.0 (2013)
Výsledek druhu DRIV/00216208:11320/13:10194688 - Deadjektivní deriváty v češtině jako deriváty syntaktické vs. lexikální (2013)
Výsledek druhu DRIV/00216208:11320/13:10194677 - Deepfix: Statistical Post-editing of Statistical Machine Translation Using Deep Syntactic Analysis (2013)
Výsledek druhu DRIV/49777513:23520/13:43920730 - Dynamic Threshold Selection Method for Multi-label Newspaper Topic Identification (2013)
Výsledek druhu DRIV/00216224:14330/13:00065981 - Enhancing Czech Parsing with Verb Valency Frames (2013)
Výsledek druhu DRIV/00216224:14330/13:00070317 - Expanding Translation Memories: Proposal and Evaluation of Several Methods (2013)
Výsledek druhu DRIV/00216224:14330/13:00070327 - Fast Construction of a Word-Number Index for Large Data (2013)
Výsledek druhu DRIV/00216208:11320/13:10194639 - Improvements to Syntax-based Machine Translation using Ensemble Dependency Parsers (2013)
Výsledek druhu DRIV/00216224:14330/13:00070316 - Intrinsic Methods for Comparison of Corpora (2013)
Výsledek druhu DRIV/00216208:11320/13:10194675 - Introducing the Prague Discourse Treebank 1.0 (2013)
Výsledek druhu JRIV/00216208:11320/13:10194813 - K subjektivnímu slovosledu na základě korpusu (2013)
Výsledek druhu RRIV/49777513:23520/13:43920881 - Korpus expresivní řeči: Czech Senior COMPANION (2013)
Výsledek druhu JRIV/00216208:11320/13:10194809 - Liší se mluvené a psané texty ve valenci? (2013)
Výsledek druhu DRIV/00216224:14330/13:00070354 - Methods for Detection of Word Usage over Time (2013)
Výsledek druhu ARIV/68378092:_____/13:00426770 - Modul digitalizovaných mluvnic — charakteristiky 51 mluvnic, redakce k 8. 11. 2013 (2013)
Výsledek druhu JRIV/00216208:11320/13:10194817 - MTMonkey: A Scalable Infrastructure for a Machine Translation Web Service (2013)
Výsledek druhu RRIV/00216208:11320/13:10194846 - MTMonkey 1.0 (2013)
Výsledek druhu DRIV/00216224:14330/13:00069065 - Parameter Estimation for LDA-Frames (2013)
Výsledek druhu DRIV/00216224:14330/13:00070328 - Portable Lexical Analysis for Parsing of Morphologically-Rich Languages (2013)
Výsledek druhu RRIV/00216208:11210/13:10194843 - Prague Arabic Dependency Treebank 1.5 (2013)
Výsledek druhu RRIV/00216208:11320/13:10194835 - Prague Dependency Treebank 3.0 (2013)
Výsledek druhu DRIV/00216224:14330/13:00065945 - PRALED – A New Kind of Lexicographic Workstation (2013)
Výsledek druhu DRIV/00216208:11320/13:10194662 - (Pre-)Annotation of Topic-Focus Articulation in Prague Czech-English Dependency Treebank (2013)
Výsledek druhu DRIV/00216224:14330/13:00065743 - Preparing VerbaLex Printed Edition (2013)
Výsledek druhu ORIV/00216224:14330/13:00079719 - Proceedings of the Seventh Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2013 (2013)
Výsledek druhu JRIV/00216208:11320/13:10194808 - Professor Ladislav Matejka (1919-2012) passed away (2013)
Výsledek druhu DRIV/00216208:11320/13:10194673 - The Role of Grammatical Constraints in Lexical Component in Functional Generative Description (2013)
Výsledek druhu DRIV/00216224:14330/13:00070352 - Semi-automatic Theme-Rheme Identification (2013)
Výsledek druhu JRIV/00216208:11320/13:10194814 - Skončil 39. ročník Olympiády v českém jazyce (2013)
Výsledek druhu DRIV/00216208:11320/13:10194645 - Subordinators with Elaborative Meanings in Czech and English (2013)
Výsledek druhu DRIV/00216208:11320/13:10194621 - Syntactic Identification of Occurrences of Multiword Expressions in Text using a Lexicon with Dependency Structures (2013)
Výsledek druhu DRIV/00216208:11320/13:10194684 - Towards Automatic Detection of Applicable Diatheses (2013)
Výsledek druhu DRIV/00216224:14330/13:00070329 - Towards taggers and parsers for Slovak (2013)
Výsledek druhu DRIV/00216224:14330/13:00070342 - Type-based Search of Idiomatic Expression (2013)
Výsledek druhu DRIV/00216224:14330/13:00070353 - Typos in Czech Corpora (2013)
Výsledek druhu DRIV/00216208:11320/13:10194689 - Verb Valency and Argument Non-correspondence in a Bilingual Treebank (2013)
Výsledek druhu DRIV/00216224:14330/13:00070313 - Web Application for Semantic Network Editing (2013)
Výsledek druhu DRIV/00216208:11320/13:10194730 - Why Words Alone Are Not Enough: Error Analysis of Lexicon-based Polarity Classifier for Czech (2013)
Výsledek druhu RRIV/00216208:11320/13:10194837 - WMT Dependency Annotations 0.1 (2013)
Výsledek druhu DRIV/00216224:14330/12:00073752 - A database of semantic clusters of verb usages (2012)
Výsledek druhu DRIV/00216208:11320/12:10130074 - A Dataset Comparison for an Indonesian-English Statistical Machine Translation System (2012)
Výsledek druhu DRIV/00216208:11320/12:10130097 - A High-Quality Web Corpus of Czech (2012)
Výsledek druhu DRIV/00216224:14330/12:00062508 - Adaptation of Czech Parsers for Slovak (2012)
Výsledek druhu DRIV/00216208:11320/12:10130065 - Analyzing the Most Common Errors in the Discourse Annotation of the Prague Dependency Treebank (2012)
Výsledek druhu JRIV/49777513:23520/12:43915504 - Application of Lemmatization and Summarization Methods in Topic Identification Module for Large Scale Language Modeling Data Filtering (2012)
Výsledek druhu DRIV/00216208:11320/12:10130043 - Application of Topic Segmentation in Audiovisual Information Retrieval (2012)
Výsledek druhu DRIV/00216208:11320/12:10130083 - Assimetrii meždу glуbinnym i poverchnostnym prestavleniem predloženija (na primere dvуch tipov obstojatelstv v češskom jazyke) (2012)
Výsledek druhu DRIV/00216224:14330/12:00067067 - Behaviour of the Czech Suffix -ák – A Case Study (2012)
Výsledek druhu DRIV/00216208:11320/12:10130057 - Building a Corpus of Old Czech (2012)
Výsledek druhu DRIV/00216224:14330/12:00062319 - Building A Thesaurus Using LDA-Frames (2012)
Výsledek druhu DRIV/00216224:14330/12:00057572 - Building a 70 billion word corpus of English from ClueWeb (2012)
Výsledek druhu DRIV/00216224:14330/12:00057949 - Building Evaluation Dataset for Textual Entailment in Czech (2012)
Výsledek druhu BRIV/68378092:_____/12:00388951 - Český jazykový atlas 1 (2012)
Výsledek druhu BRIV/68378092:_____/12:00388960 - Český jazykový atlas 2 (2012)
Výsledek druhu DRIV/00216224:14330/12:00057557 - Common Sense Inference using Verb Valency Frames (2012)
Výsledek druhu JRIV/00216208:11320/12:10129915 - Concurrent effects of lexical status and letter-rotation during early stages of visual word recognition: evidence from ERPs (2012)
Výsledek druhu DRIV/00216208:11320/12:10130105 - Creating annotated resources for polarity classification in Czech (2012)
Výsledek druhu DRIV/00216224:14330/12:00068067 - CzAccent - Simple Tool for Restoring Accents in Czech Texts (2012)
Výsledek druhu DRIV/00216224:14330/12:00062284 - Detecting Spam in Web Corpora (2012)
Výsledek druhu RRIV/00216208:11320/12:10132450 - Dialogy.Org 1.1 (2012)
Výsledek druhu DRIV/00216224:14330/12:00057392 - Finding Multiwords of More Than Two Words (2012)
Výsledek druhu DRIV/00216208:11320/12:10130039 - Formemes in English-Czech Deep Syntactic MT (2012)
Výsledek druhu DRIV/00216208:11320/12:10130110 - HamleDT: To Parse or Not to Parse? (2012)
Výsledek druhu DRIV/00216208:11320/12:10130077 - IDENTIC Corpus: Morphologically Enriched Indonesian-English Parallel Corpus (2012)
Výsledek druhu DRIV/00216224:14330/12:00062222 - Improving Automatic Ontology Developement (2012)
Výsledek druhu DRIV/00216208:11320/12:10130086 - Interplay of Coreference and Discourse Relations: Discourse Connectives with a Referential Component (2012)
Výsledek druhu DRIV/00216208:11320/12:10130029 - The Joy of Parallelism with CzEng 1.0 (2012)
Výsledek druhu JRIV/68378092:_____/12:00390719 - Klad a zápor po slovesech bránění (2012)
Výsledek druhu DRIV/00216208:11320/12:10130079 - Language Richness of the Web (2012)
Výsledek druhu DRIV/00216224:14330/12:00059944 - Large Corpora for Turkic Languages and Unsupervised Morphological Analysis (2012)
Výsledek druhu DRIV/00216224:14330/12:00057989 - Linguistic Logical Analysis of Direct Speech (2012)
Výsledek druhu DRIV/00216224:14330/12:00057239 - Low-cost ontology development (2012)
Výsledek druhu DRIV/00216208:11320/12:10130038 - Maintaining consistency of monolingual verb entries with interannotator agreement (2012)
Výsledek druhu JRIV/00216208:11320/12:10130070 - Making Community and ASR Join Forces in Web (2012)
Výsledek druhu JRIV/00216208:11320/12:10129914 - Mapping Semantic Information from FrameNet onto VALLEX (2012)
Výsledek druhu DRIV/00216224:14330/12:00057240 - Migrating Cornetto Lexicon to New XML Database Engine (2012)
Výsledek druhu ARIV/68378092:_____/12:00389360 - Modul digitalizovaných mluvnic — charakteristiky 21 mluvnic, redakce k 24. 10. 2012 (2012)
Výsledek druhu DRIV/68378092:_____/12:00389342 - Modul digitalizovaných mluvnic: co k čemu, pro koho (2012)
Výsledek druhu DRIV/00216208:11320/12:10134008 - Možnosti jednotlivých volných slovesných doplnění být obligatorním členem věty (2012)
Výsledek druhu JRIV/00216208:11320/12:10129912 - Nejčastější konektivní prostředky kauzálního vztahu v Pražském závislostním korpusu (2012)
Výsledek druhu JRIV/00216208:11210/12:10129917 - On a Corpus of Older Czech Texts and Its Usage (2012)
Výsledek druhu JRIV/00216208:11320/12:10129909 - On scalarity in information structure (2012)
Výsledek druhu DRIV/00216208:11320/12:10130036 - Optimizing semantic granularity for NLP - report on a lexicographic experiment (2012)
Výsledek druhu RRIV/49777513:23520/12:43917952 - OVM - Otázky Václava Moravce (2012)
Výsledek druhu DRIV/00216224:14330/12:00061900 - POS Annotated 50M Corpus of Tajik Language (2012)
Výsledek druhu RRIV/00216208:11320/12:10132451 - Prague Discourse Treebank 1.0 (2012)
Výsledek druhu DRIV/00216208:11320/12:10130059 - Prague Markup Language Framework (2012)
Výsledek druhu DRIV/00216224:14330/12:00057973 - Recent Czech Web Corpora (2012)
Výsledek druhu JRIV/00216208:11320/12:10130067 - The Rule-Based Approach to Czech Grammaticalized Alternations (2012)
Výsledek druhu DRIV/00216224:14330/12:00062331 - Saara: Anaphora Resolution on Free Text in Czech (2012)
Výsledek druhu JRIV/00216208:11320/12:10130111 - Sentence Modality Assignment in the Prague Dependency Treebank (2012)
Výsledek druhu RRIV/00216224:14330/12:00064706 - SpiderLing (2012)
Výsledek druhu RRIV/00216224:14330/12:00058274 - Syntactic parser SET (2012)
Výsledek druhu JRIV/00216208:11320/12:10129913 - Syntaktické konstrukce typu Včely se hemží na zahradě - Zahrada se hemží včelami (2012)
Výsledek druhu DRIV/00216208:11320/12:10130066 - The Syntax-Semantics Interface of Czech Verbs in the Valency Lexicon (2012)
Výsledek druhu DRIV/00216208:11320/12:10130054 - Topic-Focus revisited (Through the eyes of the Prague Dependency Treebank) (2012)
Výsledek druhu DRIV/00216208:11320/12:10130075 - Towards an Indonesian-English SMT System: A Case Study of an Under-Studied and Under-Resourced Language, Indonesian (2012)
Výsledek druhu DRIV/00216224:14330/12:00064722 - Towards 100M Morphologically Annotated Corpus of Tajik (2012)
Výsledek druhu RRIV/00216208:11320/12:10132449 - VALLEX 2.6 (2012)
Výsledek druhu JRIV/00216208:11320/11:10107810 - An attractive game with the document: (im)possible? (2011)
Výsledek druhu RRIV/00216208:11210/11:10109521 - Extended Textual Coreference and Bridging Relations in PDT 2.0 (2011)
Výsledek druhu CRIV/00216208:11210/11:10108078 - Korpusy mluvené češtiny a možnosti jejich využití pro poznání rozdílných "světů" mluvenosti a psanosti (2011)
Výsledek druhu RRIV/00216208:11320/11:10109513 - Prague Czech-English Dependency Treebank 2.0 (2011)
Výsledek druhu RRIV/00216208:11320/11:10109514 - Prague Database of Spoken English (2011)
Výsledek druhu RRIV/00216208:11320/11:10109511 - Prague Dependency Treebank 2.5 (2011)
Výsledek druhu RRIV/00216208:11320/11:10109515 - Pražská databáze mluvené češtiny (2011)
Výsledek druhu BRIV/00216208:11320/11:10109109 - Valence sloves v Pražském závislostním korpusu (2011)
Výsledek druhu BRIV/00216208:11320/11:10109110 - Valenční slovník Pražského závislostního korpusu (PDT-Vallex) (2011)
Výsledek druhu BRIV/00216208:11320/11:10109106 - Významová reprezentace elipsy (2011)
Výsledek druhu RRIV/00216208:11320/10:10079362 - Český WordNet 1.9 PDT (2010)
Výsledek druhu RRIV/00216208:11320/10:10079346 - Lexikálně-sémantická anotace PDT pomocí Českého WordNetu (2010)