Off topic: OT: Pomoc s Mozilla Common Voice
Thread poster: Vojtěch Drábek
Vojtěch Drábek
Vojtěch Drábek
Czech Republic
English to Czech
Apr 7, 2020

Dobrý den,

Mozilla Common Voice je projekt pro vytvoření svobodného korpusu mluvené řeči, primárně pro tvorbu systémů automatického rozpoznávání řeči. Kvůli nedostatku vět, které by přispěvatelé četli a které by zároveň nebylo možné vykládat jako autorsky chráněné, byla vytvořena aplikace pro automatickou extrakci vět z Wikipedie.

Návrh na podporu češtiny je tam už od února, ale zatím jsem nesehnal nikoho, kdo by prošel nějakou
... See more
Dobrý den,

Mozilla Common Voice je projekt pro vytvoření svobodného korpusu mluvené řeči, primárně pro tvorbu systémů automatického rozpoznávání řeči. Kvůli nedostatku vět, které by přispěvatelé četli a které by zároveň nebylo možné vykládat jako autorsky chráněné, byla vytvořena aplikace pro automatickou extrakci vět z Wikipedie.

Návrh na podporu češtiny je tam už od února, ale zatím jsem nesehnal nikoho, kdo by prošel nějakou část vzorku vygenerovaných vět a odhadl počet chyb, zejména pravopisu, ale i gramatiky a nevyslovitelných nebo neobvyklých cizích jmen a slov.

Připadá mi škoda do tohoto nástroje češtinu nepřidat, už proto, že se už některé věty pro přispěvatele začínají opakovat a přidávat ručně nové je problematické. Překladatelé a lokalizátoři jsou pro toto ideální, pokud někdo máte pár minut nebo desítek minut a nemáte co dělat:-), můžete prosím projít aspoň sto vět z https://gist.github.com/comodoro/a2606297fb77c2fa7dcc399ed6559c70 a dát vědět buď tady, zprávou nebo (pokud používáte Github) na https://github.com/Common-Voice/cv-sentence-extractor/pull/90?

Díky moc
Vojtěch Drábek
Collapse


 
Milan Condak
Milan Condak  Identity Verified
Local time: 12:33
English to Czech
Bezplatné versus placené aplikace Apr 9, 2020

Vojtěch Drábek wrote:

Návrh na podporu češtiny je tam už od února, ale zatím jsem nesehnal nikoho, kdo...

Díky moc
Vojtěch Drábek


Ahoj Vojtěchu,

na tomto fóru jsem nikdy nechtěl, aby někdo pracoval zadarmo. Leda pro své potěšení, a aby jiným udělal radost. Požádal jsem překladatele, aby doplňovali data do slovníku Apertium. Funguje samostatně nebo v OmegaT a to oboustranně. Moje přání jsem vyslovil v roce 2013.
Potom jsem vyzval překladatele, ať lokalizují (přeloží z angličtiny do češtiny textové řetězce) Wordfastu Anywhere, za což mohou 3 překladatelé získat licenci Wordfastu Studio (WFC+WFP). Přihlásil se mi jeden překladatel, který přeložil objem práce, za který mohl získat licenci "zdarma", a který již licenci měl. Práce na dva překladatele doposud čeká. Přitom je možno využít integrovanou funkci diktovat překlad česky. Naučit se přitom jak týmově lokalizovat software.

Proti těmto komunitním aktivitám jsou k dispozici aplikace pro využití služeb rozpoznávání řeči digitálních a komunikačních gigantů, kteří mají každodenně aktualizovaná textová i řečová data (Skype, WhatUp, Hangup, aj.)

Platí se zde POUZE ztrátou soukromí.

https://lightpdf.com/cz/aplikace-na-rozpoznavani-hlasu.html

Milí kolegové,

kdo chcete Vojtěchovi (a v budoucnosti svému soukromí) pomoci zapojte se.

Pokud jde o moje staré výzvy: na Apertium jsem rezignoval a kdo má zájem získat licenci Wordfastu Studio, může si informace snadno získat nebo mě privátně kontaktovat.


 
Vojtěch Drábek
Vojtěch Drábek
Czech Republic
English to Czech
TOPIC STARTER
OT: Pomoc s Mozilla Common Voice Apr 9, 2020

Asi bych měl upřesnit, že nejsem nijak spojen s organizací Mozilla, kromě toho, že občas používám jejich produkty. O Common Voice mám zájem jen z toho důvodu, že jsem zkoušel nějaké modely rozpoznávání řeči a při tom zjistil, že českých řečových dat je zoufale málo. Ani bych to neoznačil za práci - přečtení řekněme sta vět například od 200 do 299 a napsání, kolik jich je podle mého názoru chybných.

 
Milan Condak
Milan Condak  Identity Verified
Local time: 12:33
English to Czech
CEF Digital pasáž Apr 9, 2020

Doplněk: část textu z CEF o rozpoznávání řeči. Vždy anglická věta a její strojový překlad do češtiny.

The EC intends to allocate EUR 2.5 million to these objectives in the next two years (2020-21), including the continuation of the ELRC programme and the work of the Language Resources Board (LRB).

ES má v úmyslu přidělit na tyto cíle v příštích dvou letech (2020–21) 2.5 milionů EUR, včetně pokračování programu ELRC a činnosti Rady jazyk
... See more
Doplněk: část textu z CEF o rozpoznávání řeči. Vždy anglická věta a její strojový překlad do češtiny.

The EC intends to allocate EUR 2.5 million to these objectives in the next two years (2020-21), including the continuation of the ELRC programme and the work of the Language Resources Board (LRB).

ES má v úmyslu přidělit na tyto cíle v příštích dvou letech (2020–21) 2.5 milionů EUR, včetně pokračování programu ELRC a činnosti Rady jazykových zdrojů.

Poslední úpravy překladu LF Aligner 4.21 dne 5.4.2020 v 21:27:52
It is worth noting the new objectives that have appeared among the proposed tasks, such as the creation of tools for automatic speech recognition or the automatic text summarization.

Za zmínku stojí nové cíle, které se objevily v souvislosti s navrhovanými úkoly, jako je například vytvoření nástrojů pro automatické rozpoznávání řeči nebo automatické shrnutí textu.

In addition to the mentioned EUR 2.5 million in this year’s CEF Telecom call, EUR 4 million have been earmarked for projects involving the collection of language resources, language tools and integration projects, so that the total funding for reducing the language barriers to the Digital Single Market, promotion of European multilingualism and protecting endangered languages at risk of digital extinction has increased considerably.

Kromě uvedených 2.5 milionů EUR v letošní výzvě Nástroje pro propojení Evropy v oblasti telekomunikací bylo vyčleněno 4 milionů EUR na projekty týkající se shromažďování jazykových zdrojů, jazykových nástrojů a integračních projektů tak, aby se výrazně zvýšil celkový objem finančních prostředků na snižování jazykových překážek na jednotném digitálním trhu, podporu evropské mnohojazyčnosti a ochranu ohrožených jazyků při riziku vyhynutí.

Milan
PS: eTranslate (k dispozi od 1.4.2020) je výsledkem takového financování v období 2016-2020.
Collapse


 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


OT: Pomoc s Mozilla Common Voice






Trados Business Manager Lite
Create customer quotes and invoices from within Trados Studio

Trados Business Manager Lite helps to simplify and speed up some of the daily tasks, such as invoicing and reporting, associated with running your freelance translation business.

More info »
Trados Studio 2022 Freelance
The leading translation software used by over 270,000 translators.

Designed with your feedback in mind, Trados Studio 2022 delivers an unrivalled, powerful desktop and cloud solution, empowering you to work in the most efficient and cost-effective way.

More info »