Olá Marcelo,
Verdade! Fazem uns 10 anos que venho trabalhando exatamente na criação de datasets (corpora, recursos léxicos etc) para o processamento do Português. Realmente difícil recebermos apoio e valorização por isso, mas pior ainda é a falta de colaboração e desnecessária competição que muitas vezes acontecem. Não é incomum pesquisadores começarem novos projetos ao invés de colaborar com algum em andamento, acontece no Brazil e em todo lugar. Certamente existem várias explicações para este comportamento. Uma delas é a falta de documentação nos projetos das regras para contribuições, quanto se trata de linguagem, certas decisões precisam ser tomadas e aceitas, obter consenso para todas as decisões é muito difícil. Outra é talvez o incentivo à publicações, fácil publicar um artigo dizendo ’Existe X, X não é bom/suficiente, então fiz Y’. Bem mais difícil é ter um artigo aceito sobre a colaboração com a manutenção de um recurso já existente. E ainda existe má fé, infelizmente! :-( Recursos são incorporados em outros sem o devido crédito! Algumas até monetizam sem valorizar os desenvolvedores iniciais. Google, felizmente, sempre foi honesto em dar crédito à nossa openWordnet-PT: https://translate.google.com/intl/en/about/license/ Linguistic resources are very easy to start working on, very hard to improve and extremely difficult to maintain. Ab., Alexandre > On 22 Oct 2020, at 09:51, Marcelo Finger <mfin...@ime.usp.br> wrote: > > Oi João. > > V diz: " Agora, *haja tempo* para ouvir os vídeos e editar as legendas..." > > Estou coordenando um grupo que faz exatamente esta tarefa sistematicamente, > em vídeos genéricos do português. Para quê? para que possamos ter > ferramentas de transcrição cada vez melhores e públicas para o português, > devolver essas e outras ferramentas de processamento de linguagem natural. > > É um trabalho que requer disciplina e muito profissionalismo, que bom que > você seja capaz de apreciar a importância deste trabalho, embora muitas > agências de fomento e outros não tem uma visão tão positiva deste tipo de > atividade. Sendo assim, ela relutam em apoiar financeiramente este trabalho > de geração e coleta de dados. > > []s -- Você está recebendo esta mensagem porque se inscreveu no grupo "LOGICA-L" dos Grupos do Google. Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para logica-l+unsubscr...@dimap.ufrn.br. Para ver esta discussão na web, acesse https://groups.google.com/a/dimap.ufrn.br/d/msgid/logica-l/FA982AAA-1FFD-4ECF-B236-7388EC0112E8%40gmail.com.