Aplicação de ferramentas para coleta e análise de dados em linguística

Autores

  • Roberlei Alves Bertucci Universidade Tecnológica Federal do Paraná (Brasil)

DOI:

https://doi.org/10.21814/diacritica.576

Palavras-chave:

Linguagem e tecnologia, Coleta de dados, Análise automática de textos, Rede social

Resumo

O uso de tecnologias influencia diferentes campos de saber e atividade humanos, inclusive a linguagem. Nesse sentido, as potencialidades verificadas nos ambientes digitais para circulação de dados linguísticos precisam ser exploradas. Para isso, este trabalho descreve três ferramentas digitais relacionadas à coleta e análise de dados: primeiro, o aplicativo Netvizz, integrado ao Facebook, que auxilia na montagem de corpora com dados dessa rede; segundo, o software Tropes, capaz de analisar textos a partir do processamento lexical, indicando elementos como o estilo e frequência das categorias lexicais; finalmente, o programa Linguakit, que seleciona palavras-chave, apresenta a frequência de palavras e realiza análise de sentimentos, entre outras tarefas. Para testar as ferramentas, selecionamos um conjunto de dados, retirado dapágina do El País Brasil por ocasião da prisão do ex-presidente Lula. Após a coletade comentários, a aplicação no Tropes mostrou uma ocorrência alta de conectivos emodalizadores, além de itens lexicais referentes à situação (“universo de referência”). Já a análise no Linguakit apontou, além da alta frequência de termos específicos nasituação, elementos típicos da Comunicação Mediada por Computador (como abreviações), bem como um sentimento mais negativo associado aos comentários.

Referências

Araújo, J. Leffa, V. (Ed.) (2016). Redes sociais e ensino de línguas: o que temos de aprender?. (1ª ed.) São Paulo: Parábola Editorial.

Araújo, L. S. de. (2017). O gênero entrevista radiofônica em comunidades hispânicas: um aporte da Análise Textual Automática. Domínios de Lingu@gem, 11(2), 289–312. Disponível em: DOI: 10.14393/DL29-v11n2a2017-2. Consultado em: 23. abr. 2018. DOI: https://doi.org/10.14393/DL29-v11n2a2017-2

Auroux, S. (2014). A revolução tecnológica da gramatização. (3ª ed.) Campinas, Brasil: Editora da UNICAMP.

Barton, D. & Lee, C. (2015). Linguagem online: Textos e práticas digitais. M. C. Mota (Trad.). (1ª ed.) São Paulo: Parábola Editorial.

Benevenuto, F., Ribeiro, F. & Araújo, M. (2015). Métodos para Análise de Sentimentos em Mídias Sociais. Short course in the Brazilian Symposium on Multimedia and the Web (Webmedia). Manaus. Disponível em: http://homepages.dcc.ufmg.br/~fabricio/download/webmedia-short-course.pdf. Consultado em: 26 abr. 2018.

Bertucci, R. A. & Nunes, P. A. (2017). Interação em rede social: Das reações às características do gênero comentário. Domínios de Lingu@gem, 11(2), 313–338. DOI: 10.14393/DL29-v11n2a2017-3. DOI: https://doi.org/10.14393/DL29-v11n2a2017-3

Cassirer, E. (1979). Antropologia filosófica: Ensaio sobre o homem. São Paulo: Mestre Jou.

Coscarelli, C. V. (2016). Navegar e ler na rota do aprender. In C. V. Coscarelli (Ed.), Tecnologias para aprender. São Paulo: Parábola.

Coulmas, F. Escrita e Sociedade. (2014). São Paulo: Parábola Editorial.

Cupani, A. (2016). Filosofia da tecnologia: um convite. Florianópolis: Editora da UFSC.

Finatto, M. J. B. (2017). Descrição de gêneros textuais/discursivos com apoio computacional. Domínios de Lingu@gem, 11(2), 282–288. doi: 10.14393/DL29-v11n2a2017-1. DOI: https://doi.org/10.14393/DL29-v11n2a2017-1

Linguakit. http://linguakit.com/pt/. Consultado em: 26 abr. 2018.

Manifesto das Humanidades Digitais. THATCamp Paris. 2012. Disponível em: https://humanidadesdigitais.org/manifesto-das-humanidades-digitais. Consultado em: 26 abr. 2018.

Netvizz. https://apps.facebook.com/netvizz/. Consultado em: 26 abr. 2018.

Ortega y Gasset, J. (1965). Meditación de la técnica. Madrid: Espasa-Calpe, (orig. 1939).

Paiva, C. & Paredes-Silva, V. L. (2012). Cumprindo uma pauta de trabalho: Contribuições recentes do PEUL. Alfa, São Paulo, 56(3), 739–770. DOI: https://doi.org/10.1590/S1981-57942012000300002

Portal de Periódicos da Capes. www.periodicos.capes.gov.br. Consultado em: 26 abr. 2018.

Raso, T. & Mello, H. (Eds.) (2012). C-ORAL-BRASIL I: corpus de referência do português brasileiro falado informal. Belo Horizonte: Editora UFMG.

Recuero, R. (2012). A conversação em rede: comunicação mediada pelo computador e redes sociais na Internet. Porto Alegre: Sulina.

Rieder. B. (2013). Studying Facebook via data extraction: The Netvizz application. Proceedings of the 5th Annual ACM Web Science Conference, 346–355. DOI: https://doi.org/10.1145/2464464.2464475

Sardinha, T. B. (2000). Corpus Linguistics: History and problematization. DELTA, 16(2), 323–367. Disponível em: http://dx.doi.org/10.1590/S0102-44502000000200005. Consultado em: 26 abr. 2018. DOI: https://doi.org/10.1590/S0102-44502000000200005

Sardinha, T. B. (2005). Trazendo a língua portuguesa para o computador. In T. B. Sardinha (Ed.), A Língua Portuguesa no computador (pp. 269–295). Campinas: Mercado de Letras & Fapesp.

Tropes. http://www.semantic-knowledge.com/tropes.htm. Consultado em: 26 abr. 2018.

Vieira Pinto, Á. (2005). O conceito de tecnologia. Rio de Janeiro: Contraponto.

Downloads

Publicado

24-03-2020

Como Citar

Bertucci, R. A. (2020). Aplicação de ferramentas para coleta e análise de dados em linguística. Diacrítica, 32(3), 129–155. https://doi.org/10.21814/diacritica.576